СРАВНЕНИЕ ОДИНОЧНЫХ И ГИБРИДНЫХ МОДЕЛЕЙ НЕЙРОСЕТЕЙ ДЛЯ ПРОГНОЗИРОВАНИЯ ЦЕН АКЦИЙ

Авторы

DOI:

https://doi.org/10.52167/1609-1817-2025-136-1-402-418

Ключевые слова:

прогнозирование временных рядов, фондовый рынок, гибридные модели нейронных сетей, сверточные нейронные сети, долгосрочная краткосрочная память

Аннотация

Прогнозирование цен на акции всегда было сложной и трудной задачей из-за высокой волатильности, шума в данных и резких колебаний цен, вызванных различными факторами. Традиционные подходы, такие как количественный, фундаментальный и технический анализ, часто не могут точно предсказать движение цен на акции из-за их сложности в обработке нелинейных данных. Эволюция машинного обучения, в частности моделей нейронных сетей, открыла новые возможности для повышения точности прогнозирования за счет обработки нелинейных и многомерных данных с высокой эффективностью. Это исследование сосредоточено на оценке и сравнении трех архитектур нейронных сетей, в которых последняя представляет собой комбинацию первых двух - сверточных нейронных сетей (CNN), долговременной краткосрочной памяти (LSTM) и гибридной модели CNN-LSTM для прогнозирования цен на акции. Используя десять лет исторических данных по акциям, взятых для примера для акций Apple Inc. (AAPL), начиная с 2015 по 2025 год, модели были обучены и протестированы по ключевым показателям производительности, таким как среднеквадратичная ошибка (MSE), квадратный корень из среднеквадратичной ошибки (RMSE), средняя абсолютная ошибка (MAE), средняя абсолютная процентная ошибка (MAPE) и R². Результаты показывают, что хотя обе модели CNN и LSTM показывают хорошую производительность по отдельности, гибридная модель CNN-LSTM может значительно превзойти их, достигая наивысшей точности с наименьшим уровнем ошибок. Объединяя сильные стороны CNN для извлечения признаков и LSTM для обработки временной последовательности, гибридная модель эффективно фиксирует сложные закономерности в движении цен акций. Перебирая типы используемых слоев, мы пришли к выводу, что при объединении обеих моделей в одну гибридную модель некоторые слои, такие как один слой CNN и один слой LSTM, следует удалить. Это исследование демонстрирует потенциал гибридных моделей нейронных сетей в финансовом прогнозировании временных рядов и всесторонне анализирует их преимущества перед негибридными моделями.

Биографии авторов

Самат Муханов, International University of Information Technology

PhD, Алматы, Казахстан, s.mukhanov@iitu.edu.kz

Салтанат Амиргалиева, Mukhametzhan Tynyshbayev ALT University

д.ф.-м.н., профессор, Алматы, Казахстан, saltanat_amirgal@mail.ru

Дарын Амрин, International University of Information Technology

магистрант, Алматы, Казахстан, 41376@iitu.edu.kz

Сырым Жакыпбеков, International University of Information Technology

магистр, старший преподаватель, Алматы, Казахстан, syrymzhakypbekov@gmail.com

Бейбут Амиргалиев, Astana IT University

к.т.н., профессор, Астана, Казахстан, beibut.amirgaliyev@aitu.edu.kz

Библиографические ссылки

[1] Srivinay, B. Manujakshi, M. Kabadi, and N. Naik, “A Hybrid Stock Price Prediction Model Based on PRE and Deep Neural Network,” Data, vol. 7, no. 5, p. 51, Apr. 2022, doi: 10.3390/data7050051.

[2] C. Kenshimov, S. Mukhanov, T. Merembayev, and D. Yedilkhan, “A comparison of convolutional neural networks for Kazakh sign language recognition,” EEJET, vol. 5, no. 2 (113), pp. 44–54, Oct. 2021, doi: 10.15587/1729-4061.2021.241535.

[3] S. B. Mukhanov and R. Uskenbayeva, “Pattern Recognition with Using Effective Algorithms and Methods of Computer Vision Library,” in Optimization of Complex Systems: Theory, Models, Algorithms and Applications, vol. 991, H. A. Le Thi, H. M. Le, and T. Pham Dinh, Eds., in Advances in Intelligent Systems and Computing, vol. 991. , Cham: Springer International Publishing, 2020, pp. 810–819. doi: 10.1007/978-3-030-21803-4_81.

[4] J. Shah, D. Vaidya, and M. Shah, “A comprehensive review on multiple hybrid deep learning approaches for stock prediction,” Intelligent Systems with Applications, vol. 16, p. 200111, Nov. 2022, doi: 10.1016/j.iswa.2022.200111.

[5] H. Song and H. Choi, “Forecasting Stock Market Indices Using the Recurrent Neural Network Based Hybrid Models: CNN-LSTM, GRU-CNN, and Ensemble Models,” Applied Sciences, vol. 13, no. 7, p. 4644, Apr. 2023, doi: 10.3390/app13074644.

[6] A. Lazcano, P. J. Herrera, and M. Monge, “A Combined Model Based on Recurrent Neural Networks and Graph Convolutional Networks for Financial Time Series Forecasting,” Mathematics, vol. 11, no. 1, p. 224, Jan. 2023, doi: 10.3390/math11010224.

[7] Q. Zhou, C. Zhou, and X. Wang, “Stock prediction based on bidirectional gated recurrent unit with convolutional neural network and feature selection,” PLoS ONE, vol. 17, no. 2, p. e0262501, Feb. 2022, doi: 10.1371/journal.pone.0262501.

[8] R. Jaiswal and B. Singh, “A Hybrid Convolutional Recurrent (CNN-GRU) Model for Stock Price Prediction,” in 2022 IEEE 11th International Conference on Communication Systems and Network Technologies (CSNT), Apr. 2022, pp. 299–304. doi: 10.1109/CSNT54456.2022.9787651.

[9] Faculty of Computer Science and Information Technology, Universiti Tun Hussein Onn Malaysia, 86400, Parit Raja, Batu Pahat, Johor, Malaysia, M. Zulqarnain, R. Ghazali, M. G. Ghouse, Y. M. M. Hassim, and I. Javid, “Predicting Financial Prices of Stock Market using Recurrent Convolutional Neural Networks,” IJISA, vol. 12, no. 6, pp. 21–32, Dec. 2020, doi: 10.5815/ijisa.2020.06.02.

[10] M. Benhouad, M. Mohammed, K. Bentaleb, A. el Mansouri, and S. Aidouni, “A Hybrid Approach of Wavelet Transform, Convolutional Neural Networks and Gated Recurrent Units for Stock Liquidity Forecasting,” International Journal of Advanced Computer Science and Applications, vol. 13, Jan. 2022, doi: 10.14569/IJACSA.2022.0130980.

[11] X. Yu and D. Li, “Important Trading Point Prediction Using a Hybrid Convolutional Recurrent Neural Network,” Applied Sciences, vol. 11, no. 9, p. 3984, Apr. 2021, doi: 10.3390/app11093984.

[12] S. Liu, X. Zhang, Y. Wang, and G. Feng, “Recurrent convolutional neural kernel model for stock price movement prediction,” PLoS ONE, vol. 15, no. 6, p. e0234206, Jun. 2020, doi: 10.1371/journal.pone.0234206.

[13] F. Chollet and F. Chollet, Deep Learning with Python, Second Edition. Simon and Schuster, 2021.

[14] Q. H. Nguyen et al., “Influence of Data Splitting on Performance of Machine Learning Models in Prediction of Shear Strength of Soil,” Mathematical Problems in Engineering, vol. 2021, pp. 1–15, Feb. 2021, doi: 10.1155/2021/4832864.

[15] K. R. M. Fernando and C. P. Tsokos, “Dynamically Weighted Balanced Loss: Class Imbalanced Learning and Confidence Calibration of Deep Neural Networks,” IEEE Trans. Neural Netw. Learning Syst., vol. 33, no. 7, pp. 2940–2951, Jul. 2022, doi: 10.1109/TNNLS.2020.3047335.

[16] L. Zhao and Z. Zhang, “A improved pooling method for convolutional neural networks,” Sci Rep, vol. 14, no. 1, p. 1589, Jan. 2024, doi: 10.1038/s41598-024-51258-6.

[17] C. Jan, “Financial Information Asymmetry: Using Deep Learning Algorithms to Predict Financial Distress,” Symmetry, vol. 13, no. 3, p. 443, Mar. 2021, doi: 10.3390/sym13030443.

[18] A. A. Alkhouly, A. Mohammed, and H. A. Hefny, “Improving the Performance of Deep Neural Networks Using Two Proposed Activation Functions,” IEEE Access, vol. 9, pp. 82249–82271, 2021, doi: 10.1109/ACCESS.2021.3085855.

[19] H. Widiputra, A. Mailangkay, and E. Gautama, “Multivariate CNN‐LSTM Model for Multiple Parallel Financial Time‐Series Prediction,” Complexity, vol. 2021, no. 1, p. 9903518, Jan. 2021, doi: 10.1155/2021/9903518.

[20] S. R. Dubey, S. K. Singh, and B. B. Chaudhuri, “Activation functions in deep learning: A comprehensive survey and benchmark,” Neurocomputing, vol. 503, pp. 92–108, Sep. 2022, doi: 10.1016/j.neucom.2022.06.111.

[21] Y. Liu, H. Pu, and D.-W. Sun, “Efficient extraction of deep image features using convolutional neural network (CNN) for applications in detecting and analysing complex food matrices,” Trends in Food Science & Technology, vol. 113, pp. 193–204, Jul. 2021, doi: 10.1016/j.tifs.2021.04.042.

[22] F. Landi, L. Baraldi, M. Cornia, and R. Cucchiara, “Working Memory Connections for LSTM,” Neural Networks, vol. 144, pp. 334–341, Dec. 2021, doi: 10.1016/j.neunet.2021.08.030.

[23] P. B. Weerakody, K. W. Wong, G. Wang, and W. Ela, “A review of irregular time series data handling with gated recurrent neural networks,” Neurocomputing, vol. 441, pp. 161–178, Jun. 2021, doi: 10.1016/j.neucom.2021.02.046.

[24] R. K. Behera, M. Jena, S. K. Rath, and S. Misra, “Co-LSTM: Convolutional LSTM model for sentiment analysis in social big data,” Information Processing & Management, vol. 58, no. 1, p. 102435, Jan. 2021, doi: 10.1016/j.ipm.2020.102435.

Загрузки

Опубликован

18.02.2025

Как цитировать

Mukhanov, S., Amirgaliyeva, S., Amrin, D., Zhakypbekov, S., & Amirgaliyev, B. (2025). СРАВНЕНИЕ ОДИНОЧНЫХ И ГИБРИДНЫХ МОДЕЛЕЙ НЕЙРОСЕТЕЙ ДЛЯ ПРОГНОЗИРОВАНИЯ ЦЕН АКЦИЙ. Вестник КазАТК, 136(1), 402–418. https://doi.org/10.52167/1609-1817-2025-136-1-402-418

Выпуск

Раздел

Автоматизация, телемеханика, связь, компьютерные науки

Наиболее читаемые статьи этого автора (авторов)

Похожие статьи

Вы также можете начать расширеннвй поиск похожих статей для этой статьи.