МЕТОДЫ И МОДЕЛИ ПОСТРОЕНИЯ СИСТЕМ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ КАЗАХСКОГО ЯЗЫКА
DOI:
https://doi.org/10.52167/1609-1817-2025-137-2-346-356Ключевые слова:
системы автоматической обработки, казахский язык, языковая обработка, поиск информации, лингвистический анализ, языковое моделированиеАннотация
Растущая зависимость от автоматизированных систем обработки языковых задач требует разработки надежных методов и моделей, адаптированных к конкретным лингвистическим нюансам. В данной статье основное внимание уделяется построению методов и моделей автоматических систем обработки данных, посвященных казахскому языку. Уникальные характеристики и сложность казахского языка создают проблемы при обработке естественного языка, требуя специализированных подходов для таких задач, как машинный перевод, анализ настроений и поиск информации. В этом исследовании мы предлагаем новые методологии и модели для решения этих проблем, используя лингвистические особенности, присущие казахскому языку. Наш вклад включает разработку эффективных методов предварительной обработки, разработку языковых моделей, адаптированных к синтаксису и семантике казахского языка, а также оценку этих моделей на основе эталонных наборов данных. Путем строгих экспериментов мы демонстрируем эффективность предлагаемых нами методов в повышении производительности систем автоматической обработки казахского языка. Это исследование способствует достижению более широкой цели — развитию возможностей обработки естественного языка для языков с различными лингвистическими структурами, способствуя развитию инклюзивных и эффективных коммуникационных технологий.
Библиографические ссылки
[1] Saduov, B., & Mussabayev, A. (2022). Improving Kazakh language neural machine translation with synthetic data. International Journal of Computational Linguistics, 12(3), pp. 123-134.
[2] Mukhanbetova, S., & Kozhakhmet, M. (2022). The impact of data augmentation on Kazakh text processing tasks. International Journal of Linguistic Data Science, 16(3), pp.199-212.
[3] Aitim A.K., Satybaldiyeva R.Zh., Wojcik W. (2020). The construction of the Kazakh language thesauri in automatic word processing system. Proceedings of the 6th International Conference on Engineering & MIS, pp. 1-7.
[4] Zhussupbekova, G., & Issabekova, S. (2021). Contextual embeddings for Kazakh: Fine-tuning multilingual models. Journal of Language Technology Research, 18(2), pp.45-59.
[5] Mussabayev, K., & Kussainov, B. (2023). Leveraging transfer learning for low-resource languages: A case study on Kazakh. Computational Linguistics and Intelligent Text Processing, pp.105-117.
[6] Sulaimanov, A., & Yesbolatova, A. (2019). Hybrid approaches to part-of-speech tagging for Kazakh. Proceedings of the 5th Central Asian Conference on Computational Linguistics, pp. 110-118.
[7] Omarova, L., & Tursynbekova, A. (2020). Development of a Kazakh language corpus for machine learning applications. International Journal of Asian Language Processing, 30(1), 77-85.
[8] Kulzhanov, A., & Serikbayev, Z. (2021). Code-switching detection in Kazakh-Russian texts using deep learning. Journal of Multilingual Processing, 9(2), pp. 112-125.
[9] Nurpeissov, A., & Alimbetov, T. (2022). Enhancing Kazakh text classification through transformer models. Computational Linguistics and Natural Language Processing, 34(3), 205-218.
[10] Sadykova, M., & Yermukhamet, K. (2023). Unsupervised morphological analysis of the Kazakh language. Natural Language Engineering, 29(1), pp.54-70.
[11] Baimukanova, D., & Aitbayev, B. (2019). Evaluation metrics for Kazakh language processing systems. Proceedings of the 14th International Conference on Evaluation of Natural Language Processing Systems, pp.123-130.
[12] Dossanov, K., & Arystanbek, D. (2019). Effective methods for Kazakh-Russian code-switching detection. Journal of Computational Language Studies, 27(2), pp. 104-116.
[13] Bekmyrza, N., & Aitkhozhina, S. (2022). Utilizing deep learning for machine translation of low-resource languages: The Kazakh case. Proceedings of the 9th International Conference on Neural Information Processing, pp. 299-308.
[14] Zhansultanova, Z., & Ospanov, Y. (2021). Advances in named entity recognition for Turkic languages: A focus on Kazakh. Journal of Turkic Linguistics, 15(3), pp.56-70.
[15] Tanirbergenova, A., & Idrisov, K. (2023). Fine-tuning multilingual BERT for Kazakh language tasks. Proceedings of the 2023 Annual Meeting of the Association for Computational Linguistics, pp. 3390-3402.
[16] Assylbekov, Y., & Sarsembayev, A. (2020). Neural network architectures for Kazakh sentence embedding. Journal of Computational Linguistics and Applications, 32(4), pp. 88-99.
Загрузки
Опубликован
Как цитировать
Выпуск
Раздел
Категории
Лицензия
Copyright (c) 2025 Айгерим Айтим, Рысхан Сатыбалдиева

Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial-NoDerivatives» («Атрибуция — Некоммерческое использование — Без производных произведений») 4.0 Всемирная.