Preview

Вестник Дагестанского государственного технического университета. Технические науки

Расширенный поиск

Методика выявления аномалий в данных оценки кибератак с использованием Random Forest и градиентного бустинга в машинном обучении

https://doi.org/10.21822/2073-6185-2024-51-3-72-85

Аннотация

Цель. Исследование направлено на обнаружение аномалий в данных с использованием моделей машинного обучения, в частности случайного леса и градиентного бустинга, для анализа активности сети и обнаружения кибератак. Тема исследования является актуальной, поскольку кибератаки становятся все более сложными и изощренными. Разработка эффективных методов обнаружения аномалий и защиты от киберугроз становится приоритетной задачей для организаций. Метод. Исследование основано на методах комплексного анализа, начиная с разработки алгоритма тестирования и загрузки данных для обучения и тестирования. Исследование проводится с помощью двух алгоритмов машинного обучения: Random Forest и градиентного Бустинга. Процесс включает в себя анализ важных признаков, визуализацию решений, оценку производительности моделей и анализ матриц ошибок для каждой категории атак. Результат. Модель Random Forest показала точность около 94% при использовании топ-10 важных признаков. Графическое представление решений позволяет понять, как модель принимает решения на основе признаков. Модель градиентного бустинга Xgboost достигла высокой точности и достоверности результатов. В классификационном отчете приводится подробное описание производительности моделей по каждой категории. Вывод. Проделанная работа представляет собой результат комплексного анализа модели машинного обучения, предназначенной для обнаружения кибератак. Она включает в себя несколько ключевых шагов и методов, позволяющих оценить эффективность модели, выделить наиболее важные признаки и проанализировать ее производительность для различных категорий атак.

Об авторах

А. С. Кечеджиев
Донской государственный технический университет
Россия

Кечеджиев Александр Сергеевич, магистрант кафедры «Вычислительные системы и информационная безопасность»

344002, г. Ростов-на-Дону, пл. Гагарина, 1 



О. Л. Цветкова
Донской государственный технический университет
Россия

Цветкова Ольга Леонидовна, кандидат технических наук, доцент, доцент кафедры «Вычислительные системы и информационная безопасность»

344002, г. Ростов-на-Дону, пл. Гагарина, 1 



А. И. Дубровина
Донской государственный технический университет
Россия

Дубровина Ангелина Игоревна, ассистент кафедры «Вычислительные системы и информационная безопасность»

344002, г. Ростов-на-Дону, пл. Гагарина, 1 



Список литературы

1. Гайдук, К. А. К вопросу о реализации алгоритмов выявления внутренних угроз с применением машинного обучения / К. А. Гайдук, А. Ю. Исхаков // Вестник СибГУТИ. – 2022. – Т. 16, № 4. – С. 80-95. – DOI 10.55648/1998-6920-2022-16-4-80-95. – EDN SGBSIH.

2. Савицкий, Д. Е. Выявление аномалий при обработке потоковых данных в реальном времени / Д. Е. Савицкий, М. Е. Дунаев, К. С. Зайцев // International Journal of Open Information Technologies. – 2022. – Т. 10, № 6. – С. 70-76. – EDN IGAWAO.

3. Токарев, Д.М. Обнаружение аномалий на основе машинного обучения с использованием сочетания алгоритмов K-MEAN и SMO / Д.М. Токарев, М.Г. Городничев // Телекоммуникации и информационные технологии. – 2023. – Т. 10, № 1. – С. 5-13. – EDN ILCJZP.

4. Мельник М. В., Котенко И. В. Обнаружение аномального поведения пользователей и сущностей в контейнерных системах на основе методов машинного обучения// Информационная безопасность регионов России (ИБРР-2023) : XIII Санкт-Петербургская межрегиональная конференция. Материалы конференции, Санкт-Петербург, 25–27 октября 2023 года. Санкт-Петербург: Санкт-Петербургское Общество информатики, вычислительной техники, систем связи и управления, 2023. – С. 97-98. – EDN QOBTZP.

5. Терских М.Г., Тишина Е.М. Обнаружение аномального поведения пользователей в журналах событий безопасности Windows с применением алгоритмов машинного обучения// Теория и практика современной науки. – 2018. – № 5(35). – С. 821-839. – EDN UYMTHC.

6. Сафин, А. Р. Обнаружение аномального поведения сетевого трафика на основе статистических методов при помощи машинного обучения / А. Р. Сафин // Информационная безопасность и защита персональных данных. Проблемы и пути их решения: Материалы XIII Межрегиональной научно-практической конференции, Брянск, 30 апреля 2021 года. – Брянск: Брянский государственный технический университет, 2021. – С. 228-231. – EDN UDRGDA.

7. Динамическая аутентификация пользователей на основе анализа работы с компьютерной мышью / А.В. Березникер, М.А. Казачук, И.В. Машечкин [и др.] // Вестник Московского университета. Серия 15: Вычислительная математика и кибернетика. – 2021. – № 4. – С. 3-16. – EDN XIQNIZ.

8. Попова, И.А. Обнаружение аномалий в наборе данных с помощью алгоритмов машинного обучения без учителя Isolation Forest и Local Outlier Factor / И.А. Попова // StudNet. – 2020. – Т. 3, № 12. – С. 1460-1470. – EDN XILRBX.

9. А. Асунсьон, Д. Ньюман. Репозиторий машинного обучения UCI, 2007.

10. М. М. Брейниг, Х.-П. Кригель, Р. Т. Нг и Дж. Сандер. LOF: идентификация локальных выбросов на основе плотности. Запись ACM SIGMOD, 29(2):93-104, 2000.

11. Т. Ши, С. Хорват. Неконтролируемое обучение со случайными лесными предикторами. Журнал вычислительной и графической статистики, 15 (1): 118-138, март 2006.


Рецензия

Для цитирования:


Кечеджиев А.С., Цветкова О.Л., Дубровина А.И. Методика выявления аномалий в данных оценки кибератак с использованием Random Forest и градиентного бустинга в машинном обучении. Вестник Дагестанского государственного технического университета. Технические науки. 2024;51(3):72-85. https://doi.org/10.21822/2073-6185-2024-51-3-72-85

For citation:


Kechedzhiev A.S., Tsvetkova O.L., Dubrovina A.I. Methodology for detecting anomalies in cyber attack assessment data using Random Forest and Gradient Boosting in machine learning. Herald of Dagestan State Technical University. Technical Sciences. 2024;51(3):72-85. (In Russ.) https://doi.org/10.21822/2073-6185-2024-51-3-72-85

Просмотров: 232


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2073-6185 (Print)
ISSN 2542-095X (Online)