You are currently viewing Как NAB использует машинное обучение для поиска поддельных кредитных документов

Как NAB использует машинное обучение для поиска поддельных кредитных документов

  • Post author:
  • Post category:Финансы

NAB наконец-то раскрыла природу случая использования машинного обучения, связанного с мошенничеством, и алгоритм используется для обнаружения людей, которые подают поддельные документы в поддержку кредитных заявок.

Главный специалист по данным Гленда Крисп впервые раскрыла случай использования, связанный с мошенничеством, на саммите AWS в Сиднее еще в мае 2019 года, но в основном отказалась обсуждать его.

“Мы смогли сделать несколько интересных вещей вокруг мошенничества, и я не люблю говорить об этом слишком много”, — сказала она тогда.

Выступая в прошлом месяце на конференции AWS re:Invent 2019 в Лас-Вегасе, Крисп впервые указал, где банк нацелен на случаи мошенничества с помощью своих усилий по машинному обучению.

“Что касается моделей машинного обучения, то мы уже некоторое время работаем над созданием этой возможности”, — сказала она.

“Мы начинаем в тех областях, в которых вы ожидаете, что банк начнет работать: борьба с отмыванием денег, кибер-и мошенничество.

— Позвольте мне побыстрее поговорить о мошенничестве. Это может быть шоком для некоторых из вас в комнате, но есть люди, которые на самом деле лгут в своих кредитных заявках. И они не только лгут, но и присылают нам фальшивые документы, как фальшивые платежные ведомости.

“Таким образом, мы создаем модель машинного обучения — на самом деле она довольно продвинута в своем обучении прямо сейчас — чтобы попытаться идентифицировать поддельную и фальсифицированную документацию, и мы видим некоторые действительно хорошие улучшения по сравнению с традиционными моделями, которые мы использовали.”

Крисп также обсудил существование второй модели машинного обучения, которая выполняет “тематическую и тематическую аналитику вокруг жалоб клиентов.”

“Мы получаем жалобы клиентов, и мы действительно хотели бы знать, что движет этими жалобами», — сказал Крисп.

“Итак, у нас есть модель машинного обучения, которая работает уже несколько месяцев на этих [жалобах].

“То, что меня, как CDO, больше всего интересует, и я отслеживаю наиболее внимательно, — это процент жалоб клиентов, связанных с качеством данных, и поэтому это число я хочу снизить, потому что не думаю, что это должно произойти.

“Я думаю, что наши клиенты должны быть в состоянии доверять нам за хорошее качество данных.”

Экспериментальные «лаборатории»

NAB использует AWS SageMaker, чтобы позволить примерно 400 специалистам по обработке данных и аналитикам создавать, обучать и развертывать модели машинного обучения.

Это является частью инструментария, который NAB называет своим Discovery Cloud или NDC.

“Именно здесь мы строим модели машинного обучения и прогнозную аналитику», — сказал Крисп.

Крисп сказал, что специалисты по обработке данных смогли создать временные “лаборатории данных” для экспериментов по созданию моделей на срок до 90 дней, а иногда и дольше, если это необходимо.

Она сказала, что в настоящее время в NAB работает 55 лабораторий данных, “каждая из которых обычно имеет один, может быть, два варианта использования в любой момент времени.”

Создание и уничтожение лабораторий данных происходило автоматически с использованием сервисов AWS, и они содержали соответствующие ограждения для обеспечения безопасного проведения экспериментов.

Автоматическое ограничение по времени должно было гарантировать, что модели не будут постоянно работать в лабораториях, а вместо этого будут перенесены в обычную производственную среду, если они будут признаны готовыми.

“[Лаборатории] не предназначены для того, чтобы все время запускать модели”, — сказал Крисп.

“Это подразумевается как область разработки или эксперимента, поэтому, если вы действительно строите модель и хотите, чтобы она пошла в производство, у нас есть путь к производству, и у нас есть производственная среда, в которой она будет жить, и у нас есть все необходимые операционные средства управления вокруг этого.”

Крисп отметил, что NDC-это та часть информационной среды NAB, которая, скорее всего, быстро изменится.

“Это, вероятно, та часть архитектуры, которая больше всего меняется и пробует новые вещи”, — сказала она.

“Мы постоянно ищем новые способы делать вещи.

“У нас есть PoC, идущий с H2O.ai, и Databricks-это что-то еще, что мы также исследуем. Так что ты увидишь, как мы тут кое-что пробуем.

“Эта часть архитектуры особенно быстро изменится в течение следующих шести-12 месяцев.”