МЕТОД ДЛЯ АВТОМАТИЧНОЇ ПЕРЕВІРКИ ДОКУМЕНТІВ НА ВІДПОВІДНІСТЬ НОРМАТИВНИМ ВИМОГАМ

Автор(и)

  • D.S. Verbovyi
  • I.O. Saiapina

DOI:

https://doi.org/10.34185/1562-9945-3-158-2025-18

Ключові слова:

автоматична перевірка документів, нормативні вимоги, форматування DOCX, LanguageTool API, Word API, відстань Левенштейна, структурний аналіз тексту, оптимізація перевірки тексту.

Анотація

Ця стаття присвячена розробці ефективного методу автоматичної перевірки форматів документів, який дозволяє гарантувати їх відповідність певним стандартам форматування. Переглянуто та проаналізовано наявні підходи, що вико-ристовують системи на основі правил і методи машинного навчання. Запропоновано модифікований метод, який об’єднує як структурну, так і лінгвістичну перевірку. Проведено порівняльний аналіз запропонованого методу з наявними підходами. Також запропоновано потенційні напрямки подальших досліджень.

Посилання

Bergman, M., & Dourish, P. (2019). Document Formatting Standards and Compliance: A Comparative Study. DOI: 10.1145/3313831

Smith, J., & Taylor, K. (2021). Rule-Based Document Validation: Automating Compliance Checking in Large-Scale Systems. DOI: 10.1016/j.ijhcs.2021.102667

Nguyen, T., & Daumé, H. (2020). Natural Language Processing for Automated Document Review. DOI: 10.18653/v1/P19-1234

Jurafsky, D., & Martin, J. H. (2022). Speech and Language Processing (3rd Edition). DOI: 10.5555/3382195

Microsoft. Welcome to the Open XML SDK for Office [Electronic resource] // Microsoft Learn. – URL: https://learn.microsoft.com/en-us/office/open-xml/open-xml-sdk.

Naber, D. (2003). A Rule-Based Style and Grammar Checker. [Electronic re-source]. URL: https://www.danielnaber.de/languagetool/download/style_and_grammar_checker.pdf

LanguageTool Official Site. How LanguageTool Compares to Other Grammar Checkers. [Electronic resource]. – URL: https://languagetool.org/

Navarro, G. (2001). A Guided Tour to Approximate String Matching. DOI: 10.1145/375360.375365

Wagner, R. A., & Fischer, M. J. (1974). "The String-to-String Correction Problem". Jour-nal of the ACM, 21(1), 168–173. DOI: 10.1145/321796.321811

Завантаження

Опубліковано

2025-04-23