АВТОМАТИЗОВАНЕ ВІДНОВЛЕННЯ ПРОДУКЦІЙНИХ ГРАМАТИК НА ОСНОВІ СТРУКТУРНОГО АНАЛІЗУ МАТЕМАТИЧНИХ ФОРМУЛ У ФОРМАТІ LATEX

Автор(и)

DOI:

https://doi.org/10.34185/1991-7848.itmm.2026.01.043

Ключові слова:

інформаційні технології, програмне забезпечення, конструктивно-продукційне моделювання, формальні граматики, структурний аналіз

Анотація

Досліджено проблему семантико-структурного аналізу математичних виразів у наукових текстах, поданих у форматі LaTeX. Проведено аналіз існуючих підходів у галузі Математичного інформаційного пошуку та виявлено їхні недоліки, пов'язані із залежністю від статичних словників або низькою інтерпретованістю. Запропоновано метод автоматизованого відновлення продукційних граматик на основі принципів конструктивно-продукційного моделювання. Розроблено алгоритм, який здійснює динамічний лексичний аналіз, побудову абстрактного синтаксичного дерева з урахуванням префіксних операторів, а також висхідне згортання дерева для генерації правил. Відмінністю підходу є динамічне виділення термінального носія і сигнатури конструкторів без попередньо заданих шаблонів. Результати є базовим етапом для створення прозорих алгоритмів кластеризації наукових документів на основі їхнього математичного апарату.

Посилання

Greiner-Petter R. et al. Discovering Mathematical Objects of Interest – A Study of Mathematical Notations // Proceedings of The Web Conference (WWW '20). ACM, 2020. P. 1445-1456.

Shynkarenko V. I., Ilman V. M. Constructive-Synthesizing Structures and Their Grammatical Interpretations. I. Generalized Formal Constructive-Synthesizing Structure // Cybernetics and Systems Analysis. — 2014. — Vol. 50, No. 5. — P. 655–662. DOI: 10.1007/s10559-014-9655-z.

Zhong J. et al. MathBERT: A Pre-Trained Model for Mathematical Formula Understanding // arXiv preprint arXiv:2105.00377. 2021. 12 p.

Завантаження

Опубліковано

2026-04-26

Номер

Розділ

Тези