МЕТОД СИНХРОНІЗАЦІЇ ТЕМПОРАЛЬНИХ МУЛЬТИМОДАЛЬНИХ ДАНИХ ДЛЯ СТВОРЕННЯ ЦИФРОВОГО ДВІЙНИКА ГОРТАНІ

Автор(и)

  • Vladyslav Peschanskii
  • Yevgeniya Sulema

DOI:

https://doi.org/10.34185/1562-9945-5-154-2024-14

Ключові слова:

інженерія програмного забезпечення, програмне забезпечення, цифровий двійник, 3D-моделювання, синхронізація даних, відеоларингостробоскопія, акустичний аналіз, біомеханіка голосового апарату, персоналізована медицина.

Анотація

У статті запропоновано метод синхронізації темпоральних мультимодальних даних, який призначено для створення та оптимізацію цифрових двійників гортані людини. Метод надає можливість інтеграції діагностичних даних відеоларингостробоскопії та акустичного аналізу голосу для створення точної 3D-моделі гортані, яка відтворює фізіологічні характеристики та голосову функцію пацієнта. У статті описано метод, заснований на глибокому навчанні, який забезпечує точне вирівнювання часових маркерів фаз голосоутво-рення на всіх типах даних, відображаючи деталізовану біомеханіку гортані в динаміці. Ре-зультати дослідження свідчать про підвищення точності цифрового двійника. Застосуван-ня цифрового двійника гортані покликане спростити планування хірургічних втручань та інших лікувальних заходів.

Посилання

Yanase, J. and Triantaphyllou, E., 2019. A systematic survey of computer-aided diagnosis in medicine: Past and present developments. Expert Systems with Applications, 138, p.112821.

Lynn, L.A., 2019. Artificial intelligence systems for complex decision-making in acute care medicine: a review. Patient safety in Surgery, 13(1), p.6.

Bailly, L., Cochereau, T., Orgéas, L., Henrich Bernardoni, N., Rolland du Roscoat, S., McLeer-Florin, A., Robert, Y., Laval, X., Laurencin, T., Chaffanjon, P. and Fayard, B., 2018. 3D multiscale imaging of human vocal folds using synchrotron X-ray microtomography in phase retrieval mode. Scientific reports, 8(1), p.14003.

Woo, P., 2021. Stroboscopy and high-speed imaging of the vocal function. Plural publishing.

Soltanisehat, L., Alizadeh, R., Hao, H. and Choo, K.K.R., 2020. Technical, temporal, and spatial research challenges and opportunities in blockchain-based healthcare: A systematic literature re-view. IEEE Transactions on Engineering Management, 70(1), pp.353-368.

Steneker, M., 2016. Towards an empirical validation of the TIOBE Quality Indicator (Doctoral dissertation, Eindhoven University of Technology).

White, A.C. and Carding, P., 2022. Pre-and postoperative voice therapy for benign vocal fold lesions: factors influencing a complex intervention. Journal of Voice, 36(1), pp.59-67.

Rast, C., Unteregger, F., Honegger, F., Zwicky, S. and Storck, C., 2023. An Old Myth: Predic-tion of the Correct Singing Voice Classification. True or not?. Journal of Voice, 37(6), pp.968-e13.

Wu, X., Qu, P., Wang, S., Xie, L. and Dong, J., 2021. Extend the FFmpeg framework to analyze media content. arXiv preprint arXiv:2103.03539.

Demidenko, O.M., Aksionova, N.A., Varuyeu, A.V. and Kucharav, A.I., 2021, November. 3D-modeling of Augmented Reality objects using Shi-Tomasi corner detection algorithms. In Journal of Physics: Conference Series (Vol. 2091, No. 1, p. 012058). IOP Publishing.

Sun, Z., Sarma, P., Sethares, W. and Liang, Y., 2020, April. Learning relationships between text, audio, and video via deep canonical correlation for multimodal language analysis. In Proceed-ings of the AAAI Conference on Artificial Intelligence (Vol. 34, No. 05, pp. 8992-8999).

Завантаження

Опубліковано

2024-10-03