ОБНАРУЖЕНИЕ ОПУХОЛЕЙ ГЛАЗА С ИСПОЛЬЗОВАНИЕМ УЛУЧШЕННОГО РАСПОЗНАВАНИЯ И КЛАССИФИКАЦИИ ПОВРЕЖДЕНИЙ ПОСРЕДСТВОМ ИНТЕГРАЦИИ GRAD-CAM

Авторы

  • Farhad Mohsin Ali International Information Technologies University
  • Razaque Abdul International Information Technologies University
  • Tahir Md Nooritawati International Information Technologies University https://orcid.org/0000-0002-3082-8963
  • Сауле Аманжолова International Information Technologies University
  • Мерует Даулетбек International Information Technologies University https://orcid.org/0009-0005-5569-4980

DOI:

https://doi.org/10.52167/1609-1817-2025-138-3-355-370

Ключевые слова:

обнаружение опухолей глаза, Grad-CAM, глубокие сверточные нейронные сети, классификация изображений глазного дна, распознавание поражений, интерпретируемый искусственный интеллект

Аннотация

Опухоли глаз представляют собой серьезные диагностические проблемы, требующие раннего и точного обнаружения для предотвращения серьезных нарушений или потери зрения. В этой статье представлена ​​инновационная методология первого обнаружения опухолей глаза с использованием расширенного распознавания и классификации поражений с помощью модели интеграции градиентно-взвешенного картирования активации классов (Grad-CAM) (ELRC-GI). Используя глубокие сверточные нейронные сети (CNN) в сочетании с Grad-CAM, наш подход фокусируется на точном распознавании и классификации поражений на изображениях глазного дна. Предлагаемая модель, основанная на архитектурах VGG19 и ResNet50, демонстрирует превосходную производительность, достигая точности 97%, точности 93% и полноты 85% в наборе данных RFMiD. Кроме того, модель ELRC-GI постоянно превосходит традиционные базовые модели, поддерживая уровень истинно положительных результатов (TPR) на уровне 96% при уровне ложноположительных результатов (FPR) 0,3, о чем свидетельствуют надежные результаты кривой ROC. Интеграция Grad-CAM не только повышает интерпретируемость нашей модели, но также способствует автоматическому обнаружению поражений, предлагая значительный потенциал для реальных клинических применений в диагностике опухолей глаз и результатах лечения, что делает ее ценным инструментом в клинических условиях и открывает путь для будущие исследования в области анализа медицинских изображений.

Биографии авторов

Farhad Mohsin Ali, International Information Technologies University

PhD, ассоциированный профессор, Алматы, Казахстан, m.farhad@iitu.edu.kz

Razaque Abdul, International Information Technologies University

PhD, ассоциированный профессор, Алматы, Казахстан, a.razaque@iitu.edu.kz

Tahir Md Nooritawati, International Information Technologies University

PhD, ассоциированный профессор, Алматы, Казахстан, n.tahir@iitu.edu.kz

Сауле Аманжолова, International Information Technologies University

к.т.н., ассоциированный профессор, Алматы, Казахстан, s.amanzholova@iitu.edu.kz

Мерует Даулетбек, International Information Technologies University

магистр, сеньор-лектор, Алматы, Казахстан, m.dauletbek@iitu.edu.kz

Библиографические ссылки

[1] Li, Xiang, Minglei Li, Pengfei Yan, Guanyi Li, Yuchen Jiang, Hao Luo, and Shen Yin. "Deep learning attention mechanism in medical image analysis: Basics and beyonds." International Journal of Network Dynamics and Intelligence (2023): 93-116.

[2] Puneet, Rakesh Kumar, and Meenu Gupta. "Optical coherence tomography image-based eye disease detection using deep convolutional neural network." Health Information Science and Systems 10, no. 1 (2022): 13.

[3] Mungloo-Dilmohamud, Zahra, Maleika Heenaye-Mamode Khan, Khadiime Jhumka, Balkrish N. Beedassy, Noorshad Z. Mungloo, and Carlos Peña-Reyes. "Balancing data through data augmentation improves the generality of transfer learning for diabetic retinopathy classification." Applied Sciences 12, no. 11 (2022): 5363.

[4] Akter, Nahida, Stuart Perry, John Fletcher, Matthew P. Simunovic, Fiona Stapleton, and Maitreyee Roy. "Glaucoma Detection and Feature Visualization from OCT Images Using Deep Learning." medRxiv (2023): 2023-03.

[5] Ho, Edward, Edward Wang, Saerom Youn, Asaanth Sivajohan, Kevin Lane, Jin Chun, and Cindy ML Hutnik. "Deep ensemble learning for retinal image classification." Translational Vision Science & Technology 11, no. 10 (2022): 39-39.

[6] Hou, Qingshan, Peng Cao, Liyu Jia, Leqi Chen, Jinzhu Yang, and Osmar R. Zaiane. "Image quality assessment guided collaborative learning of image enhancement and classification for diabetic retinopathy grading." IEEE Journal of Biomedical and Health Informatics 27, no. 3 (2022): 1455-1466.

[7] Nuzzi, Raffaele, Giacomo Boscia, Paola Marolo, and Federico Ricardi. "The impact of artificial intelligence and deep learning in eye diseases: a review." Frontiers in Medicine 8 (2021): 710329.

[8] Zunair, Hasib, and A. Ben Hamza. "Sharp U-Net: Depthwise convolutional network for biomedical image segmentation." Computers in biology and medicine 136 (2021): 104699.

[9] Selvaraju, Ramprasaath R., Michael Cogswell, Abhishek Das, Ramakrishna Vedantam, Devi Parikh, and Dhruv Batra. "Grad-CAM: visual explanations from deep networks via gradient-based localization." International journal of computer vision 128 (2020): 336-359.

[10] De Fauw, Jeffrey, Joseph R. Ledsam, Bernardino Romera-Paredes, Stanislav Nikolov, Nenad Tomasev, Sam Blackwell, Harry Askham et al. "Clinically applicable deep learning for diagnosis and referral in retinal disease." Nature medicine 24, no. 9 (2018): 1342-1350.

[11] Mikołajczyk, Agnieszka, and Michał Grochowski. "Data augmentation for improving deep learning in image classification problem." In 2018 international interdisciplinary PhD workshop (IIPhDW), pp. 117-122. IEEE, 2018.

[12] Gulshan, Varun, Lily Peng, Marc Coram, Martin C. Stumpe, Derek Wu, Arunachalam Narayanaswamy, Subhashini Venugopalan et al. "Development and validation of a deep learning algorithm for detection of diabetic retinopathy in retinal fundus photographs." jama 316, no. 22 (2016): 2402-2410.

[13] Kassymova, Akmaral, Assem Konyrkhanova, Aida Issembayeva, Zagira Saimanova, Alisher Saltayev, Maral Ongarbayeva, and Gulnur Issakova. "Application of deep learning methods for automated analysis of retinal structures in ophthalmology." International Journal of Electrical & Computer Engineering (2088-8708) 14, no. 2 (2024).

[14] Shields, Carol L., Swathi Kaliki, Minoru Furuta, Arman Mashayekhi, and Jerry A. Shields. "Clinical spectrum and prognosis of uveal melanoma based on age at presentation in 8,033 cases." Retina 32, no. 7 (2012): 1363-1372.

[15] Esteva, Andre, Brett Kuprel, Roberto A. Novoa, Justin Ko, Susan M. Swetter, Helen M. Blau, and Sebastian Thrun. "Dermatologist-level classification of skin cancer with deep neural networks." nature 542, no. 7639 (2017): 115-118.

[16] De Fauw, Jeffrey, Joseph R. Ledsam, Bernardino Romera-Paredes, Stanislav Nikolov, Nenad Tomasev, Sam Blackwell, Harry Askham et al. "Clinically applicable deep learning for diagnosis and referral in retinal disease." Nature medicine 24, no. 9 (2018): 1342-1350.

[17] Siddique, Nahian, Sidike Paheding, Colin P. Elkin, and Vijay Devabhaktuni. "U-net and its variants for medical image segmentation: A review of theory and applications." IEEE access 9 (2021): 82031-82057.

[18] Chattopadhay, Aditya, Anirban Sarkar, Prantik Howlader, and Vineeth N. Balasubramanian. "Grad-cam++: Generalized gradient-based visual explanations for deep convolutional networks." In 2018 IEEE winter conference on applications of computer vision (WACV), pp. 839-847. IEEE, 2018.

[19] Esteva, Andre, Katherine Chou, Serena Yeung, Nikhil Naik, Ali Madani, Ali Mottaghi, Yun Liu, Eric Topol, Jeff Dean, and Richard Socher. "Deep learning-enabled medical computer vision." NPJ digital medicine 4, no. 1 (2021): 5.

[20] He, Kaiming, Xiangyu Zhang, Shaoqing Ren, and Jian Sun. "Deep residual learning for image recognition." In Proceedings of the IEEE conference on computer vision and pattern recognition, pp. 770-778. 2016.

[21] Wu, Songtao, Shenghua Zhong, and Yan Liu. "Deep residual learning for image steganalysis." Multimedia tools and applications 77 (2018): 10437-10453.

[22] Sun, Weiwei, and Ruisheng Wang. "Fully convolutional networks for semantic segmentation of very high resolution remotely sensed images combined with DSM." IEEE Geoscience and Remote Sensing Letters 15, no. 3 (2018): 474-478.

[23] Lin, Tsung-Yi, Priya Goyal, Ross Girshick, Kaiming He, and Piotr Dollár. "Focal loss for dense object detection." In Proceedings of the IEEE international conference on computer vision, pp. 2980-2988. 2017.

[24] Zhou, Bolei, Aditya Khosla, Agata Lapedriza, Aude Oliva, and Antonio Torralba. "Learning deep features for discriminative localization." In Proceedings of the IEEE conference on computer vision and pattern recognition, pp. 2921-2929. 2016.

[25] Kim, Jiwon, Jung Kwon Lee, and Kyoung Mu Lee. "Accurate image super-resolution using very deep convolutional networks." In Proceedings of the IEEE conference on computer vision and pattern recognition, pp. 1646-1654. 2016.

[26] Yosinski, Jason, Jeff Clune, Yoshua Bengio, and Hod Lipson. "How transferable are features in deep neural networks?." Advances in neural information processing systems 27 (2014).

[27] Russakovsky, Olga, Jia Deng, Hao Su, Jonathan Krause, Sanjeev Satheesh, Sean Ma, Zhiheng Huang et al. "Imagenet large scale visual recognition challenge." International journal of computer vision 115 (2015): 211-252.

[28] Hazazi, Ali, Abdulmajid A. AlShehah, Farhan R. Khan, Mohammed Ageeli Hakami, Fahad Almarshadi, Adil Abalkhail, Somia A. Nassar et al. "From diagnosis to therapy: The transformative role of lncRNAs in eye cancer management." Pathology-Research and Practice 254 (2024): 155081.

Загрузки

Опубликован

15.05.2025

Как цитировать

Mohsin Ali, F., Abdul, R., Md Nooritawati, T., Amanzholova, S., & Dauletbek, M. (2025). ОБНАРУЖЕНИЕ ОПУХОЛЕЙ ГЛАЗА С ИСПОЛЬЗОВАНИЕМ УЛУЧШЕННОГО РАСПОЗНАВАНИЯ И КЛАССИФИКАЦИИ ПОВРЕЖДЕНИЙ ПОСРЕДСТВОМ ИНТЕГРАЦИИ GRAD-CAM. Вестник КазАТК, 138(3), 355–370. https://doi.org/10.52167/1609-1817-2025-138-3-355-370

Выпуск

Раздел

Автоматизация, телемеханика, связь, компьютерные науки

Категории


Цели в области устойчивого развития:

Наиболее читаемые статьи этого автора (авторов)