АНАЛИЗ МЕТОДОВ ПОИСКА ИНФОРМАЦИИ И ИНТЕЛЛЕКТУАЛЬНАЯ КЛАССИФИКАЦИЯ ИНФОРМАЦИИ ИЗ ДАРКНЕТА

Авторы

DOI:

https://doi.org/10.52167/1609-1817-2024-135-6-214-222

Ключевые слова:

индексирование, даркнет, машинное обучение, NLP, цифровая криминалистика, интеллектуальная классификация, анализ данных, кибербезопасность, TOR, краулеры, нейронная сеть, BERT, LSTM, FastText, TF-IDF

Аннотация

В данной статье проводится анализ существующих методов поиска информации и интеллектуальной классификации данных, доступных в закрытых сетях даркнета. Рассматриваются особенности текстовых данных, специфичные для даркнета, такие как наличие специализированного сленга, жаргона и кодовых выражений. Представлен сравнительный анализ традиционных методов поиска и современных подходов, основанных на применении нейронных сетей, включая модель BERT и её адаптации для поиска в даркнете. Описаны вызовы, связанные с доступностью и индексированием информации, а также предложены методы классификации, направленные на повышение точности выявления и фильтрации незаконного контента. Статья подчеркивает значимость использования машинного обучения для автоматизации поиска и мониторинга даркнета, что может способствовать улучшению информационной безопасности.

Биографии авторов

Асель Хасанова, Евразийский национальный университет имени Л.Н. Гумилева

докторант, Астана, Казахстан, asel_khas@list.ru

Асем Шаяхметова, Казахский национальный университет имени аль-Фараби

PhD, ассоциированный профессор, Алматы, Казахстан, asemshayakhmetova@mail.ru

Нургуль Байтемирова, Atyrau University

магистр, сеньор-лектор, Атырау, Казахстан, n.baytemirova@asu.edu.kz

Валентина Махатова, Atyrau University

к.т.н., профессор, Атырау, Казахстан, mahve@mail.ru

Дариха Рыспаева, Astana International University

магистр, преподаватель, Астана, Казахстан, d_dariga83@mail.ru

Библиографические ссылки

[1] Greengard, Samuel. "Tor (network)". Encyclopedia Britannica, 21 Aug. 2024, https://www.britannica.com/technology/Tor-encryption-network. Accessed 16 October 2024.

[2] Montasari, R., Boon, A. (2023). An Analysis of the Dark Web Challenges to Digital Policing. In: Jahankhani, H. (eds) Cybersecurity in the Age of Smart Societies. Advanced Sciences and Technologies for Security Applications. Springer, Cham. https://doi.org/10.1007/978-3-031-20160-8_19.

[3] Vildanov Timur Emilievich, Ivanov Nikita Sergeevich Analysis of parsing and web scraping tools in the framework of developing an arbitration investment strategy in the sports betting market // Skif. 2021. No. 5 (57).

[4] Mitchell, R. (2018). Web Scraping with Python: Collecting Data from the Modern Web. O'Reilly Media, Inc.

[5] Akzholov R.K., Veriga A.V. TEXT PREPROCESSING FOR SOLVING NLP PROBLEMS // Science Bulletin. 2020. No. 3 (24).

[6] Bojanowski, P., Grave, E., Joulin, A., & Mikolov, T. (2017). "Enriching Word Vectors with Subword Information." Transactions of the Association for Computational Linguistics, vol. 5, pp. 135-146.

[7] Ramos, J. (2003). "Using TF-IDF to Determine Word Relevance in Document Queries." Proceedings of the First International Conference on Machine Learning.

[8] Zhou, Peng & Shi, Wei & Tian, Jun & Qi, Zhenyu & Li, Bingchen & Hao, Hongwei & Xu, Bo. (2016). Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classification. 207-212. 10.18653/v1/P16-2034.

[9] Sayeed, Md Shohel & Roji, Varsha & Anbananthen, Kalaiarasi. (2023). BERT: A Review of Applications in Sentiment Analysis. HighTech and Innovation Journal. 4. 453-462. 10.28991/HIJ-2023-04-02-015.

[10] Schölkopf, B., & Smola, A. J. (2002). Learning with Kernels: Support Vector Machines, Regularization, Optimization, and Beyond. MIT Press.

Загрузки

Опубликован

25.10.2024

Как цитировать

Khassan, A., Shayakhmetova, A., Baitemirova, N., Makhatova, V., & Ryspaeva, D. (2024). АНАЛИЗ МЕТОДОВ ПОИСКА ИНФОРМАЦИИ И ИНТЕЛЛЕКТУАЛЬНАЯ КЛАССИФИКАЦИЯ ИНФОРМАЦИИ ИЗ ДАРКНЕТА. Вестник КазАТК, 135(6), 214–222. https://doi.org/10.52167/1609-1817-2024-135-6-214-222

Выпуск

Раздел

Автоматизация, телемеханика, связь, компьютерные науки