Обнаружение фишинговых порталов посредством алгоритмов машинного обучения
https://doi.org/10.21822/2073-6185-2024-51-3-154-162
Аннотация
Цель. Целью исследования является анализ и практическая реализация функционала обнаружения фишинговых порталов посредством алгоритмов машинного обучения. Метод. Систематизация разрозненных сведений, анализ области, описание имеющихся наработок – основные методики, которые были применены в исследовании. Работа разбита на три больших подблока. В первом проводится анализ понятия машинного обучения, описываются основные способы верной интерпретации вводимых сведений, указываются наиболее ходовые методики, базы данных. Во второй части работы проводится анализ искусственных нейронных сетей. В частности, показываются их подвиды с описанием особенностей реализации, проводится сопоставление с живыми нейронами. В третьей части проводится практическая реализация двух методик и их сравнение, даются рекомендации относительно их использования при обнаружении фишинговых порталов. Результат. Проведено исследование методик анализа фишинговых порталов. Анализ показал, что наиболее рационально применять случайный лес, т.к. именно он обеспечивает качество по метрикам precession, recall, F1-score, 98% при значительном количестве введенных параметрических значений. Вывод. При реализации различных методологий поиска фишинговых порталов необходимо учитывать их снижение эффективности от вводимых параметров. Для этого важно проводить предварительные тесты. Однако результат тестов можно интерпретировать по-разному. В частности, эффективность методов может быть повышена, если ограничить количество вводимых параметров, но при этом жестко структурированных по одному критерию поиска.
Об авторе
Е. А. ТрушниковРоссия
Трушников Евгений Александрович, магистрант
123423, г. Москва, ул. Народного Ополчения, 32
Список литературы
1. Завьялов А.Н. Интернет-мошенничество (фишинг): проблемы противодействия и предупреждения // Baikal Research Journal. - 2022. - Т. 13. - № 2. - С20-26
2. Number of unique phishing sites detected worldwide from 3rd quarter 2013 to 2nd quarter 2023. - URL: https://www.statista.com/statistics/266155/number-of-phishing-domain-names-worldwide/ (дата обращения 21.02.2024).
3. Платонов А.В. Машинное обучение : учебное пособие для вузов. М.: Издательство Юрайт, 2023. – 85 с.
4. Techtarget. Machine learning. - URL: https://searchenterpriseai.techtarget.com/ definition/machinelearning-ML (дата обращения 21.12.2022).
5. Google Dataset Search. - URL: https://datasetsearch.research.google.com/ (дата обращения: 25.12.2022)
6. Visual Data Discovery. - URL: https://visualdata.io/discovery (дата обращения: 25.12.2022)
7. Kaggle. - URL: https://www.kaggle.com/ (дата обращения: 25.12.2022)
8. Портал открытых данных Российской Федерации. – URL: https://data.gov.ru/opendata (дата обращения: 25.12.2022)
9. Воронова Л.И., Брус В.Р., Воронов В.И., Баширов А.Н. Предобработка данных для нейросетевого управления: учебное пособие. – М.: МТУСИ, 2021. - 44 с.
10. Потапкин К.О. Искусственные нейронные сети. Нейронная сеть // XLVI Огарёвские чтения : Материалы научной конференции: В 3-х частях, Саранск, 06–13 декабря 2017 года / Ответственный за выпуск П.В. Сенин. Том Часть 1. – Саранск: Национальный исследовательский Мордовский государственный университет им. Н.П. Огарёва, 2018. – С. 315-320.
11. Воронова Л.И., Воронов В.И. Machine Learning: регрессионные методы интеллектуального анализа данных : учеб. пособ.. М.: Московский технический университет связи и информатики, 2018. - 82 c.
12. The perceptron: a probabilistic model for information storage and organization in the brain. - URL: https://www.ling.upenn.edu/courses/cogs501/Rosenblatt1958.pdf (дата обращения: 21.12.2022)
13. Neural networks and physical systems with emergent collective computational abilities. - URL: https://bi.snu.ac.kr/Courses/g-ai09-2/hopfield82.pdf (дата обращения: 21.12.2022)
14. Разновидности нейронных сетей. - URL: https://tproger.ru/translations/neural-network-zoo-1/ (дата обращения: 21.12.2022)
15. Что такое нейронные сети, что они могут. - URL: https://neural-university.ru/neural-networks-basics (дата обращения: 20.12.2022)
16. Нейронные сети: распознавание образов и изображений c помощью ИИ. - URL: https://center2m.ru/ai-recognition (дата обращения: 20.12.2022)
17. Маркова С.В., Жигалов К.Ю. Применение нейронной сети для создания системы распознавания изображений // Фундаментальные исследования. – 2017. – № 8-1. – С. 60-64
18. Как работает нейронная сеть: алгоритмы, обучение, функции активации и потери. - URL: https://neurohive.io/ru/osnovy-data-science/osnovy-nejronnyh-setej-algoritmy-obuchenie-funkcii-aktivacii-i-poteri/
19. Xuan C.D. Nguyen H.D., Nikolaevich T.V. Malicious URL detection based on machine learning // International Journal of Advanced Computer Science and Applications. – 2020. – Vol. 11. – No 1. – P.148-153
20. Manjeri A.S., Kaushir R., Ajay M.N.V., Nair P.C. A Machine Learning Approach for Detecting Malicious Websites using URL Features // 3rd International Conference on Electronics, Communication and Aerospace Technology(ICECA), 12-14 June 2019. - Coimbatore, India. 555–561 pp.
21. Sarasjati W. et al., Comparative Study of Classification Algorithms for Website Phishing Detection on Multiple Datasets // International Seminar on Application for Technology of Information and Communication (iSemantic). - Semarang, Indonesia, 2022. - 448-452 pp.
22. A new hybrid ensemble feature selection framework for machine learning-based phishing detection system. - URL: https://www.sciencedirect.com/science/article/abs/pii/S0020025519300763?via%3Dihub (дата обращения: 21.12.2022)
23. Учебник по библиотеке NumPy: учитесь на примерах. - URL: https://pythonist.ru/ uchebnik-pobiblioteke-numpy-uchites-na-primerah/ (дата обращения: 27.12.2022)
24. Руководство по Matplotlib. - URL: https://indico-hlit.jinr.ru/event/151/attachments/340/492/Project_school_Matplotlib_original.pdf (дата обращения: 27.12.2022)
25. Seaborn для визуализации данных в Python. - URL: https://pythonru.com/biblioteki/ seaborn-plot (дата обращения: 27.12.2022)
26. Scikit-learn Machine Learning in Python. - URL: https://scikit-learn.org/ (дата обращения: 21.12.2022)
Рецензия
Для цитирования:
Трушников Е.А. Обнаружение фишинговых порталов посредством алгоритмов машинного обучения. Вестник Дагестанского государственного технического университета. Технические науки. 2024;51(3):154-162. https://doi.org/10.21822/2073-6185-2024-51-3-154-162
For citation:
Trushnikov E.A. Detection of phishing portals through machine learning algorithms. Herald of Dagestan State Technical University. Technical Sciences. 2024;51(3):154-162. (In Russ.) https://doi.org/10.21822/2073-6185-2024-51-3-154-162