ПРИМЕНЕНИЕ МЕТОДОВ ГЛУБОКОГО ОБУЧЕНИЯ ДЛЯ РАСПОЗНАВАНИЯ ВИЗУАЛЬНЫХ ОБРАЗОВ НА РАЗНОРОДНЫХ ИЗОБРАЖЕНИЯХ

Авторы

  • Айнур Джумагалиева K.Kulazhanov Kazakh University of Technology and Business https://orcid.org/0000-0001-8632-5209
  • Эльмира Абдыкеримова Yessenov University
  • Лаззат Абдыкеримова Dulaty University
  • Динара Каргабаева Dulaty University
  • Нургул Жоранова Dulaty University

DOI:

https://doi.org/10.52167/1609-1817-2025-141-6-195-208

Ключевые слова:

глубокое обучение, классификация, сверточная нейронная сеть, распознавание, обнаружение, прогнозирование, анализ

Аннотация

В данном исследовании изучались методы глубокого обучения для распознавания визуальных образов на изображениях с гетерогенной структурой. Исследование сосредоточено на двух сложных и различных задачах: распознавание выражений лица и анализ рентгеновских снимков грудной клетки при пневмонии. Для проведения объективного сравнительного анализа двух задач в точно определенных условиях использовалась единая архитектура сверточной нейронной сети. Анализ проводился на базах данных FER2013 и PneumoniaMNIST. Эти две базы данных различаются по количеству типов классов, визуальной структуре и внутриклассовой вариации. Методы, использованные в ходе эксперимента, включали предварительную обработку изображений, обучение модели, оценку производительности и анализ пространства признаков с использованием t-SNE-проекций, и ROC-кривых. Результаты экспериментов показывают, что медицинская классификация была более стабильной, сходилась быстрее и достигала более высоких значений чувствительности, специфичности и AUC, чем наша задача распознавания эмоций. В частности, модель обнаружения пневмонии достигла точности выше 93% и значений AUC около 0,97, демонстрируя свои превосходные дискриминационные возможности. Напротив, результаты показывают, что задача распознавания эмоций по выражению лица значительно сложнее из-за небольших межклассовых различий и высокого уровня внутриклассовой вариации. Результаты нашего исследования подтверждают, что структура набора данных и сложность меток, используемых при обучении, существенно влияют на производительность моделей глубокого обучения в задачах компьютерного зрения.

Биографии авторов

Айнур Джумагалиева, K.Kulazhanov Kazakh University of Technology and Business

магистр, сеньор-лектор, Астана, Казахстан, jumagalievaainur.m.@gmail.com

Эльмира Абдыкеримова , Yessenov University

к.п.н., Актау, Казахстан, abdykerimova_el@mail.ru

Лаззат Абдыкеримова, Dulaty University

магистр, старший преподаватель, Тараз, Казахстан, Lazzat_Abdykerim@mail.ru

Динара Каргабаева, Dulaty University

магистр, старший преподаватель, Тараз, Казахстан, dinara_tlektesovna@mail.ru

Нургул Жоранова , Dulaty University

магистр, старший преподаватель, Тараз, Казахстан, zhoranova71@mail.ru

Библиографические ссылки

[1] Li, Y. (2022, January). Research and application of deep learning in image recognition. In 2022 IEEE 2nd international conference on power, electronics and computer applications (ICPECA) (pp. 994-999). IEEE. https://doi.org/10.1109/icpeca53709.2022.9718847

[2] Dan, H. C., Bai, G. W., & Zhu, Z. H. (2021). Application of deep learning-based image recognition technology to asphalt–aggregate mixtures: Methodology. Construction and Building Materials, 297, 123770. https://doi.org/10.1016/j.conbuildmat.2021.123770

[3] Castellano, G., & Vessio, G. (2021). Deep learning approaches to pattern extraction and recognition in paintings and drawings: An overview. Neural Computing and Applications, 33(19), 12263-12282. https://doi.org/10.1007/s00521-021-05893-z

[4] Adegun, A. A., Viriri, S., & Tapamo, J. R. (2023). Review of deep learning methods for remote sensing satellite images classification: experimental survey and comparative analysis. Journal of Big Data, 10(1), 93. https://doi.org/10.1186/s40537-023-00772-x

[5] Fantin Irudaya Raj, E., & Balaji, M. (2022). Application of deep learning and machine learning in pattern recognition. In Advance Concepts of Image Processing and Pattern Recognition: Effective Solution for Global Challenges (pp. 63-89). Singapore: Springer Singapore. https://doi.org/10.1007/978-981-16-9324-3_4

[6] Jacob, I. J., & Darney, P. E. (2021). Design of deep learning algorithm for IoT application by image based recognition. Journal of ISMAC, 3(03), 276-290. https://doi.org/10.36548/jismac.2021.3.008

[7] Banerji, S., & Mitra, S. (2022). Deep learning in histopathology: A review. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 12(1), e1439. https://doi.org/10.1002/widm.1439

[8] Baegizova, A., Jumagaliyeva, A., Rystygulova, V., Mukhamedrakhimova, G., & Lamasheva, Z. (2024). Использование искусственного интеллекта для распознания объектов на основе нейронных сетей. Вестник КазАТК, 136(1), 246–259. https://doi.org/10.52167/1609-1817-2025-136-1-246-259

[9] Wu, Y., Cheng, M., Huang, S., Pei, Z., Zuo, Y., Liu, J., ... & Shao, W. (2022). Recent advances of deep learning for computational histopathology: principles and applications. Cancers, 14(5), 1199. https://doi.org/10.3390/cancers14051199

[10] Lv, Z., Huang, H., Gao, L., Benediktsson, J. A., Zhao, M., & Shi, C. (2022). Simple multiscale UNet for change detection with heterogeneous remote sensing images. IEEE Geoscience and Remote Sensing Letters, 19, 1-5. https://doi.org/10.1109/lgrs.2022.3173300

[11] Shafique, A., Cao, G., Khan, Z., Asad, M., & Aslam, M. (2022). Deep learning-based change detection in remote sensing images: A review. Remote Sensing, 14(4), 871. https://doi.org/10.3390/rs14040871

[12] Amiri, Z., Heidari, A., Navimipour, N. J., Unal, M., & Mousavi, A. (2024). Adventures in data analysis: A systematic review of Deep Learning techniques for pattern recognition in cyber-physical-social systems. Multimedia Tools and Applications, 83(8), 22909-22973. https://doi.org/10.1007/s11042-023-16382-x

[13] Wang, M., Yue, P., Jiang, L., Yu, D., Tuo, T., & Li, J. (2025). An open flame and smoke detection dataset for deep learning in remote sensing based fire detection. Geo-spatial Information Science, 28(2), 511-526. https://doi.org/10.1080/10095020.2024.2347922

[14] Zhang, M., Qu, L., Singh, P., Kalpathy-Cramer, J., & Rubin, D. L. (2022). Splitavg: A heterogeneity-aware federated deep learning method for medical imaging. IEEE Journal of Biomedical and Health Informatics, 26(9), 4635-4644. https://doi.org/10.1109/jbhi.2022.3185956

[15] Cen, L. P., Ji, J., Lin, J. W., Ju, S. T., Lin, H. J., Li, T. P., ... & Zhang, M. (2021). Automatic detection of 39 fundus diseases and conditions in retinal photographs using deep neural networks. Nature communications, 12(1), 4828. https://doi.org/10.1038/s41467-021-25138-w

Загрузки

Опубликован

27.11.2025

Как цитировать

Джумагалиева, А., Абдыкеримова , Э., Абдыкеримова, Л. ., Каргабаева, Д., & Жоранова , Н. . (2025). ПРИМЕНЕНИЕ МЕТОДОВ ГЛУБОКОГО ОБУЧЕНИЯ ДЛЯ РАСПОЗНАВАНИЯ ВИЗУАЛЬНЫХ ОБРАЗОВ НА РАЗНОРОДНЫХ ИЗОБРАЖЕНИЯХ. Вестник КазАТК, 141(6), 195–208. https://doi.org/10.52167/1609-1817-2025-141-6-195-208

Выпуск

Раздел

Автоматизация, телемеханика, связь, компьютерные науки

Категории


Цели в области устойчивого развития:

Наиболее читаемые статьи этого автора (авторов)

1 2 > >>