СЕГМЕНТАЦІЯ ЗОБРАЖЕНЬ З УРАХУВАННЯМ НЕВИЗНАЧЕНОСТІ ЗА ДОПОМОГОЮ АРХІТЕКТУРИ U-NET І MONTE CARLO DROPOUT

В.В. Димо; О.П.  Гожий

doi:10.34185/1562-9945-4-165-2026-04

Автор(и)

В.В. Димо https://orcid.org/0009-0001-6024-3018 (неавтентифікований)
О.П. Гожий https://orcid.org/0000-0002-3517-580X (неавтентифікований)

DOI:

https://doi.org/10.34185/1562-9945-4-165-2026-04

Ключові слова:

розпізнавання пошкоджених будівель, згорткові нейронні мережі, комп’ютерний зір, семантична сегментація, Monte Carlo Dropout, ASPP, U-Net, Google Earth

Анотація

Історично згорткові нейронні мережі набули поширення для вирішення задач розпізнавання об’єктів на зображеннях, зокрема для попереднього аналізу пошкоджень після стихійних явищ. Архітектура U-Net стала одним із популярних рішень для сегментації зображень; за останні роки з’явилося багато досліджень і модифікацій даної моделі, що використовують як механізми уваги, так і окремі модулі для покращення результатів класифікації. Водночас дослідження оцінки невизначеності й пояснення роботи сегментаційних моделей все ще потребують поглиблення, чим і зумовлена актуальність даної роботи.

Хоча підвищення точності й ефективності є важливою складовою будь-якої моделі, в таких задачах як попередній аналіз пошкоджень і збитків оцінка впевненості, або невизначеності, є одним із вирішальних факторів, оскільки може бути використана для подальшого прийняття рішень. Мета дослідження полягає у побудові сегментаційної моделі модифікованої архітектури U-Net з модулем ASPP з урахуванням невизначеності шляхом множинного запуску моделі з різними масками відсіювання (Monter Carlo Dropout) для попереднього аналізу пошкоджених будівель на зображеннях.

В роботі представлено дослідження модифікованої архітектури U-Net із заміною bottleneck на модуль ASPP та застосуванням Monte Carlo Dropout. На основі розрахункових формул дисперсії, ентропії та взаємної інформації сформовано карти невизначеності, що застосовано для покращення сегментації. Показано, що ASPP підвищує точність визначення форм об’єктів, а комбінована функція втрат сприяє покращенню сегментації. У експериментах досягнуто приросту 3.8% середнього IoU, 4% для вцілілих і 5.3% для зруйнованих будівель. Маски невизначеності проаналізовано та використано в методі з двома пороговими значеннями впевненості й невизначеності моделі для виділення найбільш надійних ділянок. Для практичного впровадження описаних методів і підходів існує необхідність їх подальшого дослідження.

Посилання

Moreno González, C. L., Montoya, G. A., & Lozano Garzón, C. (2025). Toward reliable post-disaster assessment: Advancing building damage detection using You Only Look Once convolutional neural network and satellite imagery. Mathematics, 13, 1041. https://doi.org/10.3390/math13071041.

Liu, J., Luo, Y., Chen, S., Wu, J., & Wang, Y. (2024). BDHE-Net: A novel building dam-age heterogeneity enhancement network for accurate and efficient post-earthquake assessment using aerial and remote sensing data. Applied Sciences, 14, 3964. https://doi.org/10.3390/app14103964.

Mazurets, O., Molchanova, M., Shurypa, M., & Sobko, O. (2026). Devising a neural-network method for assessing the condition of destroyed buildings using images from un-manned aerial vehicles. Eastern-European Journal of Enterprise Technologies, 1(2(139)), 6–16. https://doi.org/10.15587/1729-4061.2026.351605

Deng, L., & Wang, Y. (2022). Post-disaster building damage assessment based on im-proved U-Net. Scientific Reports, 12, 15862. https://doi.org/10.1038/s41598-022-20114-w.

Yang, Q., Wang, Z., Liu, S., & Li, Z. (2024). Research on improved U-net based remote sensing image segmentation algorithm. arXiv. https://doi.org/10.48550/arXiv.2408.12672.

He, K., Zhang, X., Ren, S., & Sun, J. (2015). Spatial pyramid pooling in deep convolu-tional networks for visual recognition. IEEE Transactions on Pattern Analysis and Machine Intelligence, 37(9), 1904–1916. https://doi.org/10.48550/arXiv.1406.4729.

Gal, Y., & Ghahramani, Z. (2016). Dropout as a Bayesian approximation: Representing model uncertainty in deep learning. In Proceedings of the 33rd International Conference on Machine Learning (Vol. 48, pp. 1050–1059). https://doi.org/10.48550/arXiv.1506.02142.

Rey, M., Mnih, A., Neumann, M., Overlan, M., & Purves, D. (2025). Uncertainty evalua-tion of segmentation models for Earth observation. arXiv. https://doi.org/10.48550/arXiv.2510.19586.

Dechesne, C., Lassalle, P., & Lefèvre, S. (2021). Bayesian U-Net: Estimating uncertainty in semantic segmentation of Earth observation images. Remote Sensing, 13(19), 3836. https://doi.org/10.3390/rs13193836.

Saidu, C., & Csató, L. (2021). Active learning with Bayesian U-Net for efficient semantic image segmentation. Journal of Imaging, 7(2), 37. https://doi.org/10.3390/jimaging7020037.

Saifullah, S., & Dreżewski, R. (2026). Bayesian optimization-driven U-Net architecture tuning for brain tumor segmentation. In Proceedings of the 6th International Electronic Con-ference on Applied Sciences (Eng. Proc., 124(1), 22). https://doi.org/10.3390/engproc2026124022.