Improving deep learning performance by augmenting training data

Soldatenko Dmytro; Hnatushenko Viktorija

doi:10.34185/1562-9945-4-147-2023-10

Автор(и)

Soldatenko Dmytro
Hnatushenko Viktorija

DOI:

https://doi.org/10.34185/1562-9945-4-147-2023-10

Ключові слова:

нейронна мережа, розпізнавання зображень, супутникові знімки, обробка зображень, аугментація даних, штучний інтелект, згорткова нейромережа, класифікація зображень.

Анотація

Розпізнавання супутникових зображень є життєво важливим застосуванням комп’ютерного зору з потенційними варіантами використання в таких сферах, як бороть-ба зі стихійними лихами, землеробство та міське планування. Це дослідження спрямоване на визначення оптимальної кількості вхідних даних, та підбору оптимальних методів їх аугментації, необхідних для навчання нейронної мережіCNN для розпізнавання супутнико-вих зображень. З цією метою проводиться серія експериментів, щоб дослідити вплив кількості вхідних даних на кілька показників продуктивності, включаючи точність, конвергенцію та узагальнення моделі. Дослідження пропонує кілька методів для визначення точки насичення та пом’якшення наслідків перенавчання. Результати, отримані в цьому дослідження, можуть допомогти в розробці більш ефективних моделей розпізнавання су-путниковихзображень.

Посилання

Christian L, Lucas T, Ferenc H, Jose C, Andrew C, Alejandro A, Andrew A, Alykhan T, Johannes T, Zehan W, Wenzhe S. Photo-realistic single image super-resolution using a generative adversarial network. arXiv preprint. 2016.

Shervin Minaee, Yuri Y Boykov, Fatih Porikli, Antonio J Plaza, Nasser Kehtarnavaz, and Demetri Terzopoulos. Image segmentation using deep learning: A survey. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2021.

Chengyue Gong, Dilin Wang, Meng Li, Vikas Chandra, and Qiang Liu. Keepaugment: A simple information-preserving data augmentation approach. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, pages 1055–1064, 2021.

Buda Mateusz, Maki Atsuto, Mazurowski Maciej A. A systematic study of the class imbalance problem in convolutional neural networks. Neural Networks. 2018;106:249–59.

Trishul C, Yutaka S, Johnson A, Karthik K. Project adam: building an efficient and scalable deep learning training system. In: Proceedings of OSDI. 2014. P. 571–82.

Xiaofeng Z, Zhangyang W, Dong L, Qing L. DADA: deep adversarial data augmentation for extremely low data regime classification. arXiv preprint. 2018.

Dong W, Zhou N, Paul JC, Zhang X. Optimized image resizing using seam carving and scaling. ACM Transactions on Graphics (TOG). 2009 Dec 1;28(5):1-0.

Russo F. A method for estimation and filtering of Gaussian noise in images. IEEE Transactions on Instrumentation and Measurement. 2003 Sep 23;52(4):1148-54.