СИСТЕМАТИЧЕСКИЙ ОБЗОР ПЕРЕВОДА КАЗХСКОГО ЯЗЫКА ЖЕСТОВ В РЕЧЬ С ИСПОЛЬЗОВАНИЕМ ДИНАМИЧЕСКОГО РАСПОЗНАВАНИЯ ЖЕСТОВ

Авторы

  • Айгерим Айтим International University of Information Technology https://orcid.org/0000-0003-2982-214X
  • Дарига Саттархужаева International University of Information Technology
  • Айсулу Хайруллаева International University of Information Technology

Ключевые слова:

казахский жестовый язык, динамическое распознавание жестов, машинное обучение, перевод в речь, CNN, LSTM

Аннотация

Этот обзор рассматривает важность казахского жестового языка (КЖЯ) в качестве ключевого средства коммуникации для сообществ людей с нарушениями слуха в Казахстане. Несмотря на его важную роль, автоматический перевод КЖЯ в устную речь все еще остается недостаточно развит. Целью этого систематического обзора является изучение последних достижений в технологиях распознавания динамических жестов для перевода КЖЯ в речь. Исследование сосредоточено на применении моделей машинного обучения, в частности свёрточных нейронных сетей (CNN) и рекуррентных сетей с длительной краткосрочной памятью (LSTM), для распознавания жестов КЖЯ и оценки их эффективности в системах перевода в реальном времени. Методология исследования включает в себя анализ существующих исследований по этим моделям, выявление их сильных сторон, ограничений и эффективности в распознавании жестов для КЖЯ. Полученные результаты показывают, что модели CNN и LSTM обладают значительным потенциалом для перевода в реальном времени, однако остаются проблемы, такие как ограниченные наборы данных и обобщаемость моделей. Данное исследование вносит важный вклад в повышение доступности и содействие в социальной инклюзии, предлагая рекомендации для будущих исследований в этой области.

Биографии авторов

Айгерим Айтим, International University of Information Technology

магистр, сениор-лектор, Алматы, Казахстан, a.aitim@iitu.edu.kz

Дарига Саттархужаева, International University of Information Technology

бакалавр, Алматы, Казахстан, sattarkhuzhaevadariga@gmail.com

Айсулу Хайруллаева, International University of Information Technology

бакалавр, Алматы, Казахстан, aisulu.khairullayeva@gmail.com

Библиографические ссылки

[1] Ajgul' Zhursin. " It is difficult for people with hearing disabilities to get a profession.", 24.kz, 8 Nov. 2024, https://24.kz/ru/news/social/item/675566-lyudyam-s-invalidnostyu-po-slukhu-slozhno-poluchit-professiyu. [in Russian]

[2] Amirgaliyev, Yedilkhan, et al. "Application of Neural Networks Ensemble Method for the Kazakh Sign Language Recognition." 2024. Institute of Information and Computational Technologies, Almaty, Kazakhstan.

[3] Kenshimov, Chingiz, et al. "Sign Language Dactyl Recognition Based on Machine Learning Algorithms." Eastern-European Journal of Enterprise Technologies, vol. 4, no. 2, 2021, pp. 58-72. DOI: 10.15587/1729-4061.2021.239253.

[4] Mukhanov, Samat, et al. "Gesture Recognition of Machine Learning and Convolutional Neural Network Methods for Kazakh Sign Language." Scientific Journal of Astana IT University, Sept. 2023. DOI: 10.37943/15LPCU4095.

[5] Amangeldy, Nurzada, et al. "Sign Language Recognition Method Based on Palm Definition Model and Multiple Classification." 2022. L.N. Gumilyov Eurasian National University, Nur-Sultan, Kazakhstan, and Zangir Khan West Kazakhstan Agrarian-Technical University, Uralsk, Kazakhstan.

[6] Zholshiyeva, Lazzat Zulpukharkyzyzy, et al. "Hand Gesture Recognition Methods and Applications: A Literature Survey." The 7th International Conference on Engineering & MIS 2021, Association for Computing Machinery, 2021, pp. 1–8. ACM Digital Library, https://doi.org/10.1145/3492547.3492578.

[7] Kenshimov, Chingiz, et al. "A Comparison of Convolutional Neural Networks for Kazakh Sign Language Recognition." Eastern-European Journal of Enterprise Technologies, vol. 5, no. 2 (113), Oct. 2021, pp. 44–54. journals.uran.ua, https://doi.org/10.15587/1729-4061.2021.241535.

[8] Kudubayeva Saule, Amangeldy Nurzada, and Zakirova Alma. "Kazakh Sign Language Recognition System Based on the Bernsen Method and Morphological Structuring" Speech Technologies, no. 3-4, 2020, pp. 3-15. https://doi.org/10.58633/2305-8129_2020_3-4_3

[9] Aitim A.K., Satybaldiyeva R.Zh., Wojcik W. The construction of the Kazakh language thesauri in automatic word processing system. Proceedings of the 6th International Conference on Engineering & MIS, 2020, pp.1-4.

[10] Zholshiyeva, Lazzat, et al. "Real-Time Kazakh Sign Language Recognition Using Mediapipe and SVM. " News of NAS RK. Physical-Mathematical Series, no. 1, Mar. 2023, pp. 82–93. journals.nauka-nanrk.kz, https://doi.org/10.32014/2023.2518-1726.170.

[11] Aitim, A. (2024). Developing methods for automatic processing systems of Kazakh language. KazATC Bulletin, 133(4), pp. 254–265. https://doi.org/10.52167/1609-1817-2024-133-4-254-265

[12] Kenshimov, Chingiz, et al. "Development of a Verbal Robot Hand Gesture Recognition System." 2021. Institute of Information and Computing Technologies CS MES RK, Almaty, Kazakhstan.

Опубликован

26.05.2025

Как цитировать

Aitim, A., Sattarkhuzhayeva, D., & Khairullayeva, A. . (2025). СИСТЕМАТИЧЕСКИЙ ОБЗОР ПЕРЕВОДА КАЗХСКОГО ЯЗЫКА ЖЕСТОВ В РЕЧЬ С ИСПОЛЬЗОВАНИЕМ ДИНАМИЧЕСКОГО РАСПОЗНАВАНИЯ ЖЕСТОВ. Вестник КазАТК, 138(3). извлечено от https://vestnik.alt.edu.kz/index.php/journal/article/view/2421

Выпуск

Раздел

Автоматизация, телемеханика, связь, компьютерные науки

Категории