ПРОГНОЗИРОВАНИЕ ДИАБЕТА С ИСПОЛЬЗОВАНИЕМ АЛГОРИТМА МАШИННОГО ОБУЧЕНИЯ K-БЛИЖАЙШИХ СОСЕДЕЙ
DOI:
https://doi.org/10.52167/1609-1817-2023-128-5-288-297Ключевые слова:
аналитика данных о здоровье, сахарный диабет, наука о данных, машинное обучение, k-ближайший сосед (k-nearest neighbor), предиктивная аналитика, классификация, интеллектуальные системы, услуги IoT (Интернет вещей)Аннотация
В настоящее время услуги электронного здравоохранения стали бурно развивающейся областью, которая относится к компьютерному здравоохранению и предоставлению информации для улучшения медицинского обслуживания на местном, региональном и мировом уровне. Эффективная модель прогнозирования риска заболевания путем анализа электронных медицинских данных помогает не только лечить пациента, но и предоставлять услуги через соответствующие системы электронного здравоохранения, основанные на данных. В данной работе мы уделяем особое внимание прогнозированию и анализу сахарного диабета, все более распространенного хронического заболевания, которое относится к группе метаболических нарушений, характеризующихся высоким уровнем сахара в крови в течение длительного периода времени. K Nearest Neighbor (KNN) является одним из самых популярных и простых методов машинного обучения для построения такой модели прогнозирования риска заболевания на основе соответствующих медицинских данных. Для достижения нашей цели мы представляем оптимальную модель прогнозирования на основе обучения K Nearest Neighbor (Opt-KNN), основанную на привычных атрибутах пациента в различных измерениях. Этот подход определяет оптимальное количество соседей с низким коэффициентом ошибок для обеспечения лучшего прогнозирования в результирующей модели. Эффективность этой модели электронного здравоохранения на основе машинного обучения проверяется путем проведения экспериментов на реальных данных о сахарном диабете, собранных в медицинских учреждениях. больниц.
Библиографические ссылки
[1] N. Sneha, T. Gangil, Analysis of diabetes mellitus for early prediction using optimal feature selection, Journal of Big Data 6 (1) (2019) 13.
[2] M. Mashayekhi, F. Prescod, B. Shah, L. Dong, K. Keshawji, A. Gergaci, Evaluating the effectiveness of the Framingham model of diabetes risk assessment in Canadian electronic health records, Canadian Journal of Diabetes 39 (2)(2015) 152-156.
[3] M. F. Farooq, I. H. Sarker, et al, Performance analysis of machine learning methods for diabetes prediction, in: International Conference on Electrical, Computer, and Communications Engineering (ECCE), 2019, IEEE, 2019, pp. 1-4.
[4] S. B. Giorda, V. Manicardi, J. Diego, Impact of diabetes mellitus on health care costs in Italy, Expert Review of Pharmacoeconomics Research and Outcomes 11 (6) (2013) 709-719.
[5] C. Zou, C. Qiu, Y. Ju, X. Tan, Y. Luo, D. Yin, Predicting diabetes mellitus using machine learning techniques, Frontiers in Genetics 9 (2018) 515.
[6] M. A. Sarwar, N. Kamal, V. Hamid, M. A. Shah, Diabetes prediction using machine learning algorithms in healthcare, in: 24th International Conference on Automation and Computing (ICAC), 2018, IEEE, 2018, pp. 1-6.
[7] D. W. Aha, D. Keebler, M. K. Albert, Instance-based learning algorithms, Machine Learning 6 (1) (2016) 37-66.
[8] I. H. Sarker, A. Case, P. Watters, Performance analysis of machine learning classification models for predicting personalized context-dependent smartphone usage, Journal of Big Data 6 (1) (2019) 57.
[9] M. Khalilia, S. Chakraborty, M. Popescu, Predicting disease risks from highly unbalanced data using a random forest, BMC Medical Informatics and Decision Making 11 (1) (2015)
[10] J. R. Quinlan, C4.5: Programs for machine learning, Machine Learning (2014).
[11] J.-J. Da, T.-H. Wu, C.-W. Cao, Using data mining techniques to predict hospitalization of patients on hemodialysis, Decision Support Systems 50 (2) (2013) 439-448.
Загрузки
Опубликован
Как цитировать
Выпуск
Раздел
Лицензия
Copyright (c) 2023 Ляйля Черикбаева, Феруза Маликова, Айнұр Төлеушова, Мадина Болысханова, Бекжан Балқашбай
Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial-NoDerivatives» («Атрибуция — Некоммерческое использование — Без производных произведений») 4.0 Всемирная.