ПРИМЕНЕНИЕ МЕТОДОВ ГЛУБОКОГО ОБУЧЕНИЯ ДЛЯ РАСПОЗНАВАНИЯ ВИЗУАЛЬНЫХ ОБРАЗОВ НА РАЗНОРОДНЫХ ИЗОБРАЖЕНИЯХ
DOI:
https://doi.org/10.52167/1609-1817-2025-141-6-195-208Ключевые слова:
глубокое обучение, классификация, сверточная нейронная сеть, распознавание, обнаружение, прогнозирование, анализАннотация
В данном исследовании изучались методы глубокого обучения для распознавания визуальных образов на изображениях с гетерогенной структурой. Исследование сосредоточено на двух сложных и различных задачах: распознавание выражений лица и анализ рентгеновских снимков грудной клетки при пневмонии. Для проведения объективного сравнительного анализа двух задач в точно определенных условиях использовалась единая архитектура сверточной нейронной сети. Анализ проводился на базах данных FER2013 и PneumoniaMNIST. Эти две базы данных различаются по количеству типов классов, визуальной структуре и внутриклассовой вариации. Методы, использованные в ходе эксперимента, включали предварительную обработку изображений, обучение модели, оценку производительности и анализ пространства признаков с использованием t-SNE-проекций, и ROC-кривых. Результаты экспериментов показывают, что медицинская классификация была более стабильной, сходилась быстрее и достигала более высоких значений чувствительности, специфичности и AUC, чем наша задача распознавания эмоций. В частности, модель обнаружения пневмонии достигла точности выше 93% и значений AUC около 0,97, демонстрируя свои превосходные дискриминационные возможности. Напротив, результаты показывают, что задача распознавания эмоций по выражению лица значительно сложнее из-за небольших межклассовых различий и высокого уровня внутриклассовой вариации. Результаты нашего исследования подтверждают, что структура набора данных и сложность меток, используемых при обучении, существенно влияют на производительность моделей глубокого обучения в задачах компьютерного зрения.
Библиографические ссылки
[1] Li, Y. (2022, January). Research and application of deep learning in image recognition. In 2022 IEEE 2nd international conference on power, electronics and computer applications (ICPECA) (pp. 994-999). IEEE. https://doi.org/10.1109/icpeca53709.2022.9718847
[2] Dan, H. C., Bai, G. W., & Zhu, Z. H. (2021). Application of deep learning-based image recognition technology to asphalt–aggregate mixtures: Methodology. Construction and Building Materials, 297, 123770. https://doi.org/10.1016/j.conbuildmat.2021.123770
[3] Castellano, G., & Vessio, G. (2021). Deep learning approaches to pattern extraction and recognition in paintings and drawings: An overview. Neural Computing and Applications, 33(19), 12263-12282. https://doi.org/10.1007/s00521-021-05893-z
[4] Adegun, A. A., Viriri, S., & Tapamo, J. R. (2023). Review of deep learning methods for remote sensing satellite images classification: experimental survey and comparative analysis. Journal of Big Data, 10(1), 93. https://doi.org/10.1186/s40537-023-00772-x
[5] Fantin Irudaya Raj, E., & Balaji, M. (2022). Application of deep learning and machine learning in pattern recognition. In Advance Concepts of Image Processing and Pattern Recognition: Effective Solution for Global Challenges (pp. 63-89). Singapore: Springer Singapore. https://doi.org/10.1007/978-981-16-9324-3_4
[6] Jacob, I. J., & Darney, P. E. (2021). Design of deep learning algorithm for IoT application by image based recognition. Journal of ISMAC, 3(03), 276-290. https://doi.org/10.36548/jismac.2021.3.008
[7] Banerji, S., & Mitra, S. (2022). Deep learning in histopathology: A review. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 12(1), e1439. https://doi.org/10.1002/widm.1439
[8] Baegizova, A., Jumagaliyeva, A., Rystygulova, V., Mukhamedrakhimova, G., & Lamasheva, Z. (2024). Использование искусственного интеллекта для распознания объектов на основе нейронных сетей. Вестник КазАТК, 136(1), 246–259. https://doi.org/10.52167/1609-1817-2025-136-1-246-259
[9] Wu, Y., Cheng, M., Huang, S., Pei, Z., Zuo, Y., Liu, J., ... & Shao, W. (2022). Recent advances of deep learning for computational histopathology: principles and applications. Cancers, 14(5), 1199. https://doi.org/10.3390/cancers14051199
[10] Lv, Z., Huang, H., Gao, L., Benediktsson, J. A., Zhao, M., & Shi, C. (2022). Simple multiscale UNet for change detection with heterogeneous remote sensing images. IEEE Geoscience and Remote Sensing Letters, 19, 1-5. https://doi.org/10.1109/lgrs.2022.3173300
[11] Shafique, A., Cao, G., Khan, Z., Asad, M., & Aslam, M. (2022). Deep learning-based change detection in remote sensing images: A review. Remote Sensing, 14(4), 871. https://doi.org/10.3390/rs14040871
[12] Amiri, Z., Heidari, A., Navimipour, N. J., Unal, M., & Mousavi, A. (2024). Adventures in data analysis: A systematic review of Deep Learning techniques for pattern recognition in cyber-physical-social systems. Multimedia Tools and Applications, 83(8), 22909-22973. https://doi.org/10.1007/s11042-023-16382-x
[13] Wang, M., Yue, P., Jiang, L., Yu, D., Tuo, T., & Li, J. (2025). An open flame and smoke detection dataset for deep learning in remote sensing based fire detection. Geo-spatial Information Science, 28(2), 511-526. https://doi.org/10.1080/10095020.2024.2347922
[14] Zhang, M., Qu, L., Singh, P., Kalpathy-Cramer, J., & Rubin, D. L. (2022). Splitavg: A heterogeneity-aware federated deep learning method for medical imaging. IEEE Journal of Biomedical and Health Informatics, 26(9), 4635-4644. https://doi.org/10.1109/jbhi.2022.3185956
[15] Cen, L. P., Ji, J., Lin, J. W., Ju, S. T., Lin, H. J., Li, T. P., ... & Zhang, M. (2021). Automatic detection of 39 fundus diseases and conditions in retinal photographs using deep neural networks. Nature communications, 12(1), 4828. https://doi.org/10.1038/s41467-021-25138-w
Загрузки
Опубликован
Как цитировать
Выпуск
Раздел
Категории
Лицензия
Copyright (c) 2026 Айнур Джумагалиева

Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial-NoDerivatives» («Атрибуция — Некоммерческое использование — Без производных произведений») 4.0 Всемирная.











