МЕТОД ТА ПРОГРАМНИЙ ЗАСІБ РОЗПІЗНАВАННЯ ТА АНАЛІЗУ ОБ’ЄКТІВ НА ВІДЕО

Автор(и)

DOI:

https://doi.org/10.34185/1562-9945-3-164-2026-14

Ключові слова:

комп'ютерний зір, відеоаналітика, виявлення об'єктів, відстеження об'єктів, багатовимірна модель, OLAP, YOLO, VLM, військова техніка

Анотація

Актуальність дослідження зумовлена стрімким розвитком технологій штучного інтелекту та комп'ютерного зору, що дозволяють автоматизувати процеси аналізу великих обсягів відеоданих у реальному часі. Однак існує вагома проблема: сучасні алгоритми генерують значні масиви «сирих» неструктурованих даних, які не мають єдиної багатовимірної структури, що суттєво ускладнює їх гнучкий аналіз та агрегування. Метою роботи є підвищення швидкості аналізу надвеликих масивів відеоданих шляхом розробки методу автоматизованої екстракції структурованих даних та їхньої інтеграції у багатовимірну OLAP-модель. Основними методами дослідження є каскадна фільтрація з використанням нейромережі YOLOv26m для швидкої детекції об'єктів, застосування мультимодальної VLM-моделі Moondream2 для семантичного збагачення опису сцен, а також побудова ROLAP-моделі у межах розподіленої мікросервісної архітектури. У результаті експериментів доведено високу точність детекції об'єктів (mAP50 = 0.814 при швидкості 81.03 FPS), збалансовану швидкодію семантичного аналізу (0.422 с/кадр) та здатність системи до лінійного прискорення при масштабуванні. Розроблений комплексний інструмент успішно трансформує великі обсяги неструктурованих відеоданих у формат, придатний для глибокого багатовимірного аналізу та ефективного прийняття рішень у високонавантажених системах відеомоніторингу.

Посилання

Mahmud, A., & Setiawan, A. A. A. (2021). A survey of convolutional neural networks in object detection. Int. J. Adv. Comput. Sci. Appl.

Redmon, J., Divvala, S., Girshick, R., & Farhadi, A. (2016). You only look once: Unified, real-time object detection. In IEEE Conference on Computer Vision and Pattern Recognition (CVPR).

Abouelyazid, M. (2023). Comparative evaluation of SORT, DeepSORT, and ByteTrack for multiple object tracking in highway videos. International Journal of Sustainable Infrastructure for Cities and Societies, 8(11), 42–52.

Din, M. U., Akram, W., Bakht, A. B., & Hussain, I. (2026). LLM-VLM fusion framework for autonomous maritime port inspection using a heterogeneous UAV-USV system. arXiv. https://doi.org/10.48550/arXiv.2601.13096

Hansung, L., Sohee, P., & Jang-Hee, Y. (2013). A data cube model for surveillance video indexing and retrieval. In SIGMAP 2013: International Conference on Signal Processing and Multimedia Applications. https://www.scitepress.org/Papers/2013/46121/46121.pdf

Wu, Y., Zhang, C., Lu, Y., Su, Y., Jiang, X., Xiang, Z., & Li, Z. (2025). VideoARD: An analysis-ready multi-level data model for remote sensing video. Remote Sens., 17(22), Art. 3746. https://doi.org/10.3390/rs17223746

Завантаження

Опубліковано

2026-04-30