РЕШЕНИЕ АНАФОРЫ В КАЗАХСКОМ ЯЗЫКЕ НА ОСНОВЕ АЛГОРИТМА K K-EN NEAREST NEIGHBOR

Авторы

  • Гулжамал Калман Евразийский национальный университет им. Л.Н. Гумилева
  • Мадина Самбетбаева Евразийский национальный университет им. Л.Н. Гумилева
  • Ержан Жұмабай Астанинский международный университет
  • Улжан Кусаинова Кокшетауский университет имени Абая Мырзахметова
  • Махабат Айткенова Кокшетауский университет имени Абая Мырзахметова

Ключевые слова:

решение анафоры, машинное обучение, k-ближайший сосед, морфологические признаки

Аннотация

Разрешение анафоры, которая часто встречается как разрешение местоимения, заключается в разрешении ссылок на более ранние или более поздние элементы дискурса. Решением анафоры является поиск текста, резюмирование текста, объяснение диалогов, получение информации и т. д. такая активная область исследований. Разрешение анафоры в английском и других европейских языках хорошо изучено. Исследовательские работы на казахском языке не проводились. В данной статье представлена ​​система казахского языка для решения анафоры с использованием методов машинного обучения. Метод, основанный на правилах, используется для сбора анафоры и возможных антецедентных пар. Алгоритм K-En Nearest Neighbor используется для выбора наиболее вероятного кандидата, на который ссылается анафора.

Биографии авторов

Гулжамал Калман, Евразийский национальный университет им. Л.Н. Гумилева

докторант, Астана, Казахстан, guljamal14@gmail.com

Мадина Самбетбаева, Евразийский национальный университет им. Л.Н. Гумилева

 PhD, доцент, Астана, Казахстан, madina_jgtu@mail.ru

Ержан Жұмабай, Астанинский международный университет

докторант, Астана, Казахстан, erzhan_93kz@list.ru

Улжан Кусаинова, Кокшетауский университет имени Абая Мырзахметова

магистр, старший преподаватель, Кокшетау, Казахстан, ulzhan-92-92@mail.ru

Махабат Айткенова, Кокшетауский университет имени Абая Мырзахметова

магистр, старший преподаватель, Кокшетау, Казахстан, Mahabat_89_is@mail.ru

Библиографические ссылки

[1] Hobbs J.R. Resolving pronoun references,1978, Lingua 44, pp. 339-352.

[2] Hobbs J.R. Pronoun resolution, Technical Report, Department of Computer Science, City College, City University of New York 76-1. 1976.

[3] Lappin S, Leass H.J. An Algorithm for Pronominal Anaphoric Resolution, 1994, Computational linguistics 20, pp. 535-561

[4] Kennedy C, Boguarev B. Anaphora for everyone: pronominal anaphora resolution without a parser. 16th International Conference on Computational Linguistics (COLING’96) Denmark, 1996, pp.113-118.

[5] Mitkov R. Robust Pronoun Resolution with Limited Knowledge. 18th International Conference on Computational Linguistics, Canada,1998, Volume 2, pp. 869–875

[6] Mitkov R. Outstanding Issues in Anaphora Resolution. Lecture Notes in Computer Science 2004, pp.110-125.

[7] Mitkov R. Anaphora resolution: to what extent does it help NLP applications? Anaphora: Analysis, Algorithms and Applications. Springer Verlag, Berlin Heidelberg, 2007, pp.179-190.

[8] Tetreault J, Allen J. An empirical evaluation of pronoun resolution and clausal structure. 2003 International Symposium on Reference Resolution. Venice, Italy, 2003, pp. 1–8.

[9] Tetreault J, Allen J (2004) Dialogue Structure and Pronoun Resolution. Lecture Notes in Computer Science 1793, 2004, pp.515-525.

[10] Trouilleux F. Insertions et interprétations des expressions pronominales. Actes de l’Atelier Chaînes de référence et résolveurs d’anaphores. TALN 2002 Nancy. 2002, pp.1-11.

[11] Yu-Hsiang Lin and Tyne Liang. 2004. Pronominal and Sortal Anaphora Resolution for Biomedical Literature. In Proceedings of the 16th Conference on Computational Linguistics and Speech Processing, The Association for Computational Linguistics and Chinese Language Processing (ACLCLP), Taipei, Taiwan. 2004, pp. 101–109

[12] Zhumabay, Y., Kalman, G., Sambetbayeva, M., Yerimbetova, A., Ayapbergenova, A. Bizhanova, A. Building a model for resolving referential relations in a multilingual system. Eastern-European Journal of Enterprise Technologies, 2022. V 2(2 (116), pp. 27–35.

[13] Garanina, N. O., Sidorova, E. A., Seryi, A. S. Multiagent Approach to Coreference Resolution Based on the Multifactor Similarity in Ontology Population. Programming and Computer Software, 2018, 44 (1), pp.23–34.

[14] Сидорова Е. А., Гаранина Н. О., Кононенко И. С. Многоместные онтологические отношения в задаче разрешения. Шестнадцатая национальная конференция по искусственному интеллекту с международным участием КИИ-2018. 279-287С

[15] Kibrik, A. A. Reference and Working Memory. Current Issues in Linguistic Theory, 1999. pp.29.

Опубликован

09.01.2023

Как цитировать

Қалман, Г., Самбетбаева, М., Жұмабай, Е., Кусаинова, У., & Айткенова, М. (2023). РЕШЕНИЕ АНАФОРЫ В КАЗАХСКОМ ЯЗЫКЕ НА ОСНОВЕ АЛГОРИТМА K K-EN NEAREST NEIGHBOR. Вестник КазАТК, 124(1). извлечено от https://vestnik.alt.edu.kz/index.php/journal/article/view/720

Выпуск

Раздел

Автоматизация, телемеханика, связь, энергетика, информационные системы