РАСПОЗНАВАНИЕ ОБЪЕКТОВ В РЕАЛЬНОМ ВРЕМЕНИ НА ОСНОВЕ ГЛУБОКОГО ОБУЧЕНИЯ

Авторы

  • Абу Абдикадырович Куандыков Международный Казахско-турецкий университет имени Ходжи Ахмеда Яссауи
  • Еркебулан Айдарбекулы Тасполат Международный Казахско-турецкий университет имени Ходжи Ахмеда Яссауи

DOI:

https://doi.org/10.52167/1609-1817-2021-116-1-286-293

Ключевые слова:

сверточная нейронная сеть, глубокое обучение, обнаружение объектов, эффективное моделирование, абляция

Аннотация

В статье разрабатывается ряд эффективных архитектур, которые решают вопросы увеличения исследований по эффективному моделированию мобильных устройств с ограниченными вычислительными мощностями и ресурсами памяти, что увеличивает потребность в использовании сверточной нейронной сети (CNN). Среди них архитектуры MobileNet, ShuffleNet и MobileNetV2, предложенные в последние годы. В исследовании делается вывод, что все эти модели основаны на глубокой изоляции, которая неэффективно реализована во многих системах глубокого обучения. Поэтому в данной работе мы предложили эффективную систему постоянной свертки. Затем мы предлагаем систему обнаружения объектов в реальном времени путем интеграции системы с детектором Single Shot MultiBox (SSD).

Биографии авторов

Абу Абдикадырович Куандыков, Международный Казахско-турецкий университет имени Ходжи Ахмеда Яссауи

д.т.н

Еркебулан Айдарбекулы Тасполат, Международный Казахско-турецкий университет имени Ходжи Ахмеда Яссауи

магистрант

Библиографические ссылки

[1] Andrew G Howard, Menglong Zhu, Bo Chen, Dmitry Kalenichenko, Weijun Wang, Tobias Weyand, Marco Andreetto, and Hartwig Adam. Mobilenets: Efficient convolutional neural networks for mobile vision applications. https://arxiv.org/abs/1704.04861 (15.10.2020).

[2] Xiangyu Zhang, Xinyu Zhou, Mengxiao Lin, and Jian Sun. Shufflenet: An extremely efficient convolutional neural network for mobile devices. https://arxiv.org/abs/1707.01083 (15.10.2020).

[3] Barret Zoph, Vijay Vasudevan, Jonathon Shlens, and Quoc V Le. Learning transferable architectures for scalable image recognition. https://arxiv.org/abs/1707.07012 (16.10.2020).

[4] Mark Sandler, Andrew Howard, Menglong Zhu, Andrey Zhmoginov, and Liang-Chieh Chen. Mobilenetv2: Inverted residuals and linear bottlenecks // In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. – 2018. – Р. 4510-4520.

[5] Christian Szegedy, Wei Liu, Yangqing Jia, Pierre Sermanet, Scott Reed, Dragomir Anguelov, Dumitru Erhan, Vincent Vanhoucke, and Andrew Rabinovich. Going deeper with convolutions // In The IEEE Conference on Computer Vision and Pattern Recognition (CVPR). – 2015. – P. 1-9.

[6] Jonathan Huang, Vivek Rathod, Chen Sun, Menglong Zhu, Anoop Korattikara, Alireza Fathi, Ian Fischer, Zbigniew Wojna, Yang Song, Sergio Guadarrama, et al. Speed/accuracy trade-offs for modern convolutional object detectors. https://www.arxiv-vanity.com/papers/1611.10012/ (17.10.2020).

[7] Gao Huang, Zhuang Liu, Kilian Q Weinberger, and Laurens van der Maaten. Densely connected convolutional networks. https://arxiv.org/pdf/1608.06993.pdf? (21.10.2020).

[8] Aditya Khosla, Nityananda Jayadevaprakash, Bangpeng Yao, and Fei-Fei Li. Novel dataset for fine-grained image categorization: Stanford dogs // In Proc. CVPR Workshop on Fine-Grained Visual Categorization (FGVC). – 2011. – Vol. 2. – P. 1.

[9] Jia Deng, Wei Dong, Richard Socher, Li-Jia Li, Kai Li, and Li Fei-Fei. Imagenet: A large-scale hierarchical image database // In Computer Vision and Pattern Recognition, 2009. CVPR 2009. IEEE Conference. – Р. 248-255.

[10] Christian Szegedy, Sergey Ioffe, Vincent Vanhoucke, and Alexander A Alemi. Inception-v4, inception-resnet and the impact of residual connections on learning // In AAAI. – 2017. – Р. 4278-4284.

[11] Zhiqiang Shen, Zhuang Liu, Jianguo Li, Yu-Gang Jiang, Yurong Chen, and Xiangyang Xue. Dsod: Learning deeply supervised object detectors from scratch // In The IEEE International Conference on Computer Vision (ICCV). – 2017. – Vol. 3. – P. 7.

[12] Sergey Ioffe and Christian Szegedy. Batch normalization: Accelerating deep network training by reducing internal covariate shift // In International Conference on Machine Learning. – 2015. – Р. 448-456.

[13] Wei Liu, Dragomir Anguelov, Dumitru Erhan, Christian Szegedy, Scott Reed, Cheng-Yang Fu, and Alexander C Berg. Ssd: Single shot multibox detector // In European conference on computer vision. – 2016. – Р. 21-37.

[14] Mark Everingham, Luc Van Gool, Christopher KI Williams, John Winn, and Andrew Zisserman. The pascal visual object classes (voc) challenge // International journal of computer vision. – 2010. – Р. 303-338.

[15] Joseph Redmon and Ali Farhadi. Yolo9000: better, faster, stronger. https://arxiv.org/pdf/1612.08242.pdf (26.10.2020).

Опубликован

09.08.2021

Как цитировать

Куандыков, А. А., & Тасполат, Е. А. (2021). РАСПОЗНАВАНИЕ ОБЪЕКТОВ В РЕАЛЬНОМ ВРЕМЕНИ НА ОСНОВЕ ГЛУБОКОГО ОБУЧЕНИЯ. Вестник КазАТК, 116(1), 286–293. https://doi.org/10.52167/1609-1817-2021-116-1-286-293

Выпуск

Раздел

Автоматика, телемеханика, связь, электроэнергетика, информационные системы