МЕТОДЫ И МОДЕЛИ ПОСТРОЕНИЯ СИСТЕМ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ КАЗАХСКОГО ЯЗЫКА

Авторы

DOI:

https://doi.org/10.52167/1609-1817-2025-137-2-346-356

Ключевые слова:

системы автоматической обработки, казахский язык, языковая обработка, поиск информации, лингвистический анализ, языковое моделирование

Аннотация

Растущая зависимость от автоматизированных систем обработки языковых задач требует разработки надежных методов и моделей, адаптированных к конкретным лингвистическим нюансам. В данной статье основное внимание уделяется построению методов и моделей автоматических систем обработки данных, посвященных казахскому языку. Уникальные характеристики и сложность казахского языка создают проблемы при обработке естественного языка, требуя специализированных подходов для таких задач, как машинный перевод, анализ настроений и поиск информации. В этом исследовании мы предлагаем новые методологии и модели для решения этих проблем, используя лингвистические особенности, присущие казахскому языку. Наш вклад включает разработку эффективных методов предварительной обработки, разработку языковых моделей, адаптированных к синтаксису и семантике казахского языка, а также оценку этих моделей на основе эталонных наборов данных. Путем строгих экспериментов мы демонстрируем эффективность предлагаемых нами методов в повышении производительности систем автоматической обработки казахского языка. Это исследование способствует достижению более широкой цели — развитию возможностей обработки естественного языка для языков с различными лингвистическими структурами, способствуя развитию инклюзивных и эффективных коммуникационных технологий.

Биографии авторов

Айгерим Айтим, International Information Technologies University

магистр, сениор-лектор, Алматы, Казахстан, a.aitim@iitu.edu.kz

Рысхан Сатыбалдиева, Satbayev University

к.т.н., ассоциированный профессор, Алматы, Казахстан, r.satybaldiyeva@satbayev.university

Библиографические ссылки

[1] Saduov, B., & Mussabayev, A. (2022). Improving Kazakh language neural machine translation with synthetic data. International Journal of Computational Linguistics, 12(3), pp. 123-134.

[2] Mukhanbetova, S., & Kozhakhmet, M. (2022). The impact of data augmentation on Kazakh text processing tasks. International Journal of Linguistic Data Science, 16(3), pp.199-212.

[3] Aitim A.K., Satybaldiyeva R.Zh., Wojcik W. (2020). The construction of the Kazakh language thesauri in automatic word processing system. Proceedings of the 6th International Conference on Engineering & MIS, pp. 1-7.

[4] Zhussupbekova, G., & Issabekova, S. (2021). Contextual embeddings for Kazakh: Fine-tuning multilingual models. Journal of Language Technology Research, 18(2), pp.45-59.

[5] Mussabayev, K., & Kussainov, B. (2023). Leveraging transfer learning for low-resource languages: A case study on Kazakh. Computational Linguistics and Intelligent Text Processing, pp.105-117.

[6] Sulaimanov, A., & Yesbolatova, A. (2019). Hybrid approaches to part-of-speech tagging for Kazakh. Proceedings of the 5th Central Asian Conference on Computational Linguistics, pp. 110-118.

[7] Omarova, L., & Tursynbekova, A. (2020). Development of a Kazakh language corpus for machine learning applications. International Journal of Asian Language Processing, 30(1), 77-85.

[8] Kulzhanov, A., & Serikbayev, Z. (2021). Code-switching detection in Kazakh-Russian texts using deep learning. Journal of Multilingual Processing, 9(2), pp. 112-125.

[9] Nurpeissov, A., & Alimbetov, T. (2022). Enhancing Kazakh text classification through transformer models. Computational Linguistics and Natural Language Processing, 34(3), 205-218.

[10] Sadykova, M., & Yermukhamet, K. (2023). Unsupervised morphological analysis of the Kazakh language. Natural Language Engineering, 29(1), pp.54-70.

[11] Baimukanova, D., & Aitbayev, B. (2019). Evaluation metrics for Kazakh language processing systems. Proceedings of the 14th International Conference on Evaluation of Natural Language Processing Systems, pp.123-130.

[12] Dossanov, K., & Arystanbek, D. (2019). Effective methods for Kazakh-Russian code-switching detection. Journal of Computational Language Studies, 27(2), pp. 104-116.

[13] Bekmyrza, N., & Aitkhozhina, S. (2022). Utilizing deep learning for machine translation of low-resource languages: The Kazakh case. Proceedings of the 9th International Conference on Neural Information Processing, pp. 299-308.

[14] Zhansultanova, Z., & Ospanov, Y. (2021). Advances in named entity recognition for Turkic languages: A focus on Kazakh. Journal of Turkic Linguistics, 15(3), pp.56-70.

[15] Tanirbergenova, A., & Idrisov, K. (2023). Fine-tuning multilingual BERT for Kazakh language tasks. Proceedings of the 2023 Annual Meeting of the Association for Computational Linguistics, pp. 3390-3402.

[16] Assylbekov, Y., & Sarsembayev, A. (2020). Neural network architectures for Kazakh sentence embedding. Journal of Computational Linguistics and Applications, 32(4), pp. 88-99.

Загрузки

Опубликован

27.12.2024

Как цитировать

Aitim, A., & Satybaldieva, R. (2024). МЕТОДЫ И МОДЕЛИ ПОСТРОЕНИЯ СИСТЕМ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ КАЗАХСКОГО ЯЗЫКА. Вестник КазАТК, 137(2), 346–356. https://doi.org/10.52167/1609-1817-2025-137-2-346-356

Выпуск

Раздел

Автоматизация, телемеханика, связь, компьютерные науки

Категории


Похожие статьи

Вы также можете начать расширеннвй поиск похожих статей для этой статьи.