ОЦІНКА ЕФЕКТИВНОСТІ МОДЕЛЕЙ МЕРЕЖ ГЛИБИННОГО НАВЧАННЯ ПІДВИЩЕННЯ РОЗДІЛЬНОЇ ЗДАТНОСТІ ЗОБРАЖЕНЬ

Автор(и)

  • Anatoliy Demchyshyn

DOI:

https://doi.org/10.34185/1562-9945-5-124-2019-15

Ключові слова:

мережа глибинного навчання, згорткова нейронна мережа, роздільна здатність зображення, гістограма, ентропія, LZ77

Анотація

На сьогоднішній день мережі глибинного навчання демонструють значну перевагу перед іншими алгоритмами комп’ютерного бачення. Розглядається задача оцінки ефективності підвищення інформативності зображень, які отримано з використанням двох найновіших на даний час моделей нейронних мереж: Residual Dense Network for Image Super-Resolution та Enhanced Super-Resolution Generative Adversarial Network. В якості метрик інформативності зображення застосовано: функцію розподілу щільності вірогідності відтінків пікселів; значення ентропії, яке характеризує міру різноманітності кожного окремого пікселу вибірки; та значення ємності каналу для передачі повідомлення, яке стиснено на основі алгоритму LZ77.
Одержані результати свідчать про підвищення інформативності зображення у вигляді росту ентропії за Шенноном з 7.43 до 7.81 та 7.62 для мережі ESRGAN та RDN відповідно. Водночас, показано, що класична білінійна інтерполяція вибірки може з успіхом використовуватись для підвищення її інформативності (7.62). Продемонстровано, що метрика LZ77, яка вимірює ємність каналу для передачі повідомлення, є більш адекватною для оцінки візуальної цінності повідомлення, ніж метрика ентропії за Шенноном.

Посилання

The History of Artificial Intelligence / C. Smith, B. McGuire, T. Huang, G.Yanhg // History of Computing, Univ. of Washington. – 2006. – 27 p.

50 Years of Artificial Intelligence / M. Lungarella, F. Iida, J. Bongard, R.Pfeifer // Essays Dedicated to the 50th Anniversary of Artificial Intelligence. – Springer, 2007. – 399 p.

A Mathematical Theory of Communication / C. Shannon // Reprinted with corrections from The Bell System Technical Journal. – 1948. – Vol. 27. –

P. 379–423, 623–656.

NVIDIA Reinvents Computer Graphics with Turing Architecture [Internet resource] // Gail Laguna. – 2018. Rezhym dostupu do resursu: https://nvidianews.nvidia.com/news/nvidia-reinvents-computer-graphics-with-turing-architecture

Hnatushenko V.V. Rekonstruktsiia rastrovykh zobrazhen na osnovi yikh invariantnoi heometrychnoi modeli / V.V. Hnatushenko, O.V. Reuta // Prykladna heometriia ta inzhenerna hrafika / Pratsi Tavriiskoi derzhavnoi ahrotekhnichnoi akademii. – Melitopol: TDATA, 2004. – Issue. 4, vol. 24. – P.99–102.

Korchynskyi V.M. Analiz metodiv identyfikatsii heometrychnykh form na fotohrammetrychnykh tsyfrovykh zobrazhenniakh dystantsiinoho zonduvannia Zemli / V.M. Korchynskyi, O.V. Spirintseva // Prykladna heometriia ta inzhenerna hrafika / Pratsi Tavriiskoho derzhavnoho ahrotekhnichnoho universytetu. – Melitopol: TDATU, 2014. – Issue. 4, vol.58. – P. 50–57.

Hnatushenko V.V. Otsinka efektyvnosti heometrychnykh i radiometrychnykh peretvoren bahatokanalnykh tsyfrovykh zobrazhen / V.V.Hnatushenko, O.O. Safarov // Prykladna heometriia ta inzhenerna hrafika / Pratsi Tavriiskoho derzhavnoho ahrotekhnichnoho universytetu. – Melitopol: TDATU, 2014. – Issue. 4, vol. 58. – P. 29–33.

Hordiienko O.M. Syntez rastrovykh proektsiinykh zobrazhen na osnovi sumishchennia prostorovykh ta spektralnykh skladovykh / O.M. Hordiienko // Prykladna heometriia ta inzhenerna hrafika / Pratsi Tavriiskoi derzhavnoi ahrotekhnichnoi akademii. – Melitopol: TDATA, 2004. – Issue. 4, vol. 28. – P.109-113.

Tearing apart Googles TPU 3.0 AI coprocessor [Internet resource] // Paul Teich. – 2018. Source: https://www.nextplatform.com/2018/05/10/tearing-apart-googles-tpu-3-0-ai-coprocessor/

Residual Dense Network for Image Super-Resolution [Internet resource] / Yulun Zhang, Yapeng Tian, Yu Kong and others // arXiv. – 2018. – Source: https://arxiv.org/abs/1802.08797.

ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks [Elektronnyi resurs] / Xintao Wang, Ke Yu, Shixiang Wu ta in. // arXiv. – 2018. Source: https://arxiv.org/abs/1809.00219.

Image quality assessment: from error visibility to structural similarity / Zhou Wang, A. Bovik, H. Sheikh, E. Simoncelli // IEEE Transactions on Image Processing. – 2004. – vol. 13, no. 4. – P. 600–612.

Wang Z. Multiscale structural similarity for image quality assessment / Z.Wang, E.P. Simoncelli, A.C. Bovik // Conference Record of the Thirty-Seventh Asilomar Conference on Signals, Systems and Computers. – 2004. – Vol. 2. – P. 1398–1402.

Starovoitov V.V. Indeks SSIM ne iavliaetsia metrikoi i plokho otsenivaet skhodstvo izobrazhenii / V. V. Starovoitov // Sistemnii an. i prikladnaia informatika. – Minsk: BNTU, 2019. – № 2. – P. 12–17.

Avinery R. Universal and Accessible Entropy Estimation Using a Compression Algorithm / R. Avinery, M. Kornreich, R. Beck // Phys. Rev. Lett. 123, 178102, 2019. – 13p.

Завантаження

Опубліковано

2019-11-25