Компания CSIRO digital arm Data61 разработала новый способ автоматической идентификации попыток фишинга с заявленным более высоким уровнем успеха по сравнению с существующими методами.
Data61 объединился с НЮУ и кибер-безопасности на основе сотрудничества научно-исследовательского центра (CSCRC) в разработке новых алгоритмических методов, которые используют сжатие файлов, чтобы определить фишинговой активности.
“Предыдущие методы обнаружения фишинга использовали алгоритмы машинного обучения, которые использовали традиционные методы классификации, такие как логистическая регрессия, машины опорных векторов, деревья решений и искусственные нейронные сети”, — сказал исследователь Data61 доктор Аринд Пал в блоге алгоритма цифрового агентства.
“Эти алгоритмы не могут справиться с динамическим характером фишинга, который часто приводит к тому, что мошенники постоянно меняют дизайн и гиперссылку незаконного сайта каждые несколько часов.”
В результате существующие методы предотвращения атак, такие как черные списки, платформы анализа контента и веб-фильтры, обеспечивают лишь ограниченную защиту до того, как мошенники разработают новые и более сложные атаки — часто быстрее, чем могут быть разработаны решения для их противодействия.
Пал сказал, что новая система «PhishZip» использует алгоритм сжатия файлов БЕЗ потерь DEFLATE для сжатия как законных, так и фишинговых сайтов, разделяя их, исследуя, насколько они сжимаются.
“Законные и фишинговые сайты имеют разные коэффициенты сжатия.
“Затем мы вводим систематический процесс отбора значимых слов, которые связаны с фишинговыми и нефишинговыми сайтами, и анализируем вероятность появления этих слов, таким образом вычисляя оптимальный порог вероятности.
“Эти слова затем используются в качестве предопределенного словаря для наших моделей сжатия и используются для обучения алгоритма идентификации случаев, когда распространение этих ключевых слов указывает на вредоносный веб-сайт.”
PhishZip имеет преимущество перед моделями, основанными на машинном обучении, в том, что он не нуждается в обучении модели или синтаксическом анализе HTML, где HTML-код извлекает информацию из веб-страниц, таких как заголовки и заголовки.
Алгоритм PhishZip использовался на нескольких фишинговых сайтах, которые являются клонами PayPal, Facebook, Microsoft, ING Direct и других популярных сайтов, правильно идентифицируя 83 процента фишинговых сайтов, что, по словам Data61, является заметным улучшением по сравнению с существующими методами.
Исследователи также смогли использовать платформу для предоставления полных наборов фишинговых данных в PhishTank, сообщество, управляемое OpenDNS, чтобы люди могли делиться, проверять и отслеживать фишинговые данные.
Scamwatch Австралийской Комиссии по конкуренции и защите прав потребителей получил более 16 000 сообщений о фишинговых мошенничествах на сегодняшний день в этом году, что составляет почти 600 000 долларов убытков.
CSIRO заявила, что за последнее десятилетие наблюдался значительный рост фишинговой активности, а вспышка COVID-19 и последовавший за этим переход на работу из дома привели к еще большему количеству случаев.
“Эта технология может в конечном итоге предотвратить значительные финансовые потери для отдельных лиц и организаций”, — добавил Пал.
Те, кто заинтересован в раннем доступе к проекту PhishZip, могут связаться с Data61 здесь.