Адаптація фреймворку WORLD для пофреймового аналізу мовлення в реальному часі
https://doi.org/10.34185/1562-9945-5-148-2023-03
аналіз мови, синтез мови, обробка сигналу в реальному часі, спектральна огинаюча, оцінка F0Анотація
WORLD – це система для синтезу мовлення на основі вокодера, яка була розроблена М. Морісом та ін. і реалізована на C++. Було продемонстровано, дана система має високу ефективність та точність у порівнянні з аналогічними системами. Однак вона виявилася непридатною для викори-стання у певних сценаріях, наприклад, при потоковій обробці аудіо фрейм-за-фреймом. Ця стаття розглядає недоліки C++ імплементації системи WORLD та пропонує модифіковані версії її складових алгоритмів для вирішення вияв-лених проблем. Результуючий фреймворк було протестовано на синтетич-них сигналах та на реальних записах мовлення.
