NAB наконец-то раскрыла природу случая использования машинного обучения, связанного с мошенничеством, и алгоритм используется для обнаружения людей, которые подают поддельные документы в поддержку кредитных заявок.
Главный специалист по данным Гленда Крисп впервые раскрыла случай использования, связанный с мошенничеством, на саммите AWS в Сиднее еще в мае 2019 года, но в основном отказалась обсуждать его.
“Мы смогли сделать несколько интересных вещей вокруг мошенничества, и я не люблю говорить об этом слишком много”, — сказала она тогда.
Выступая в прошлом месяце на конференции AWS re:Invent 2019 в Лас-Вегасе, Крисп впервые указал, где банк нацелен на случаи мошенничества с помощью своих усилий по машинному обучению.
“Что касается моделей машинного обучения, то мы уже некоторое время работаем над созданием этой возможности”, — сказала она.
“Мы начинаем в тех областях, в которых вы ожидаете, что банк начнет работать: борьба с отмыванием денег, кибер-и мошенничество.
— Позвольте мне побыстрее поговорить о мошенничестве. Это может быть шоком для некоторых из вас в комнате, но есть люди, которые на самом деле лгут в своих кредитных заявках. И они не только лгут, но и присылают нам фальшивые документы, как фальшивые платежные ведомости.
“Таким образом, мы создаем модель машинного обучения — на самом деле она довольно продвинута в своем обучении прямо сейчас — чтобы попытаться идентифицировать поддельную и фальсифицированную документацию, и мы видим некоторые действительно хорошие улучшения по сравнению с традиционными моделями, которые мы использовали.”
Крисп также обсудил существование второй модели машинного обучения, которая выполняет “тематическую и тематическую аналитику вокруг жалоб клиентов.”
“Мы получаем жалобы клиентов, и мы действительно хотели бы знать, что движет этими жалобами», — сказал Крисп.
“Итак, у нас есть модель машинного обучения, которая работает уже несколько месяцев на этих [жалобах].
“То, что меня, как CDO, больше всего интересует, и я отслеживаю наиболее внимательно, — это процент жалоб клиентов, связанных с качеством данных, и поэтому это число я хочу снизить, потому что не думаю, что это должно произойти.
“Я думаю, что наши клиенты должны быть в состоянии доверять нам за хорошее качество данных.”
Экспериментальные «лаборатории»
NAB использует AWS SageMaker, чтобы позволить примерно 400 специалистам по обработке данных и аналитикам создавать, обучать и развертывать модели машинного обучения.
Это является частью инструментария, который NAB называет своим Discovery Cloud или NDC.
“Именно здесь мы строим модели машинного обучения и прогнозную аналитику», — сказал Крисп.
Крисп сказал, что специалисты по обработке данных смогли создать временные “лаборатории данных” для экспериментов по созданию моделей на срок до 90 дней, а иногда и дольше, если это необходимо.
Она сказала, что в настоящее время в NAB работает 55 лабораторий данных, “каждая из которых обычно имеет один, может быть, два варианта использования в любой момент времени.”
Создание и уничтожение лабораторий данных происходило автоматически с использованием сервисов AWS, и они содержали соответствующие ограждения для обеспечения безопасного проведения экспериментов.
Автоматическое ограничение по времени должно было гарантировать, что модели не будут постоянно работать в лабораториях, а вместо этого будут перенесены в обычную производственную среду, если они будут признаны готовыми.
“[Лаборатории] не предназначены для того, чтобы все время запускать модели”, — сказал Крисп.
“Это подразумевается как область разработки или эксперимента, поэтому, если вы действительно строите модель и хотите, чтобы она пошла в производство, у нас есть путь к производству, и у нас есть производственная среда, в которой она будет жить, и у нас есть все необходимые операционные средства управления вокруг этого.”
Крисп отметил, что NDC-это та часть информационной среды NAB, которая, скорее всего, быстро изменится.
“Это, вероятно, та часть архитектуры, которая больше всего меняется и пробует новые вещи”, — сказала она.
“Мы постоянно ищем новые способы делать вещи.
“У нас есть PoC, идущий с H2O.ai, и Databricks-это что-то еще, что мы также исследуем. Так что ты увидишь, как мы тут кое-что пробуем.
“Эта часть архитектуры особенно быстро изменится в течение следующих шести-12 месяцев.”