Кластеризация информационных новостных сообщений на событийные группы
DOI:
https://doi.org/10.34185/1991-7848.itmm.2020.01.031Ключові слова:
ТЕКСТ, ИНФОРМАЦИЯ, НОВОСТИ, КЛАСТЕРИЗАЦИЯ, КЛАССИФИКАЦИЯАнотація
В работе рассмотрены вопросы обработки информационных сообщений. Выделение среди сообщений новостей, их классификацией по тематикам, формирование в группы новостных сюжетов, ранжирование новостных сюжетов по важности. Предложенный алгоритм основан на формировании для сообщений множества слов-маркеров и сравнением данных множеств, принадлежащих разным сообщениям между собой.
Посилання
Data Clustering Contest: Round 1 // site of Developer Challenges / Telegram. URL: https://contest.com/docs/data_clustering (access date: 21.02.2020)
The result of the algorithm’s functioning on test data // site of Developer Challenges / Data Clustering Contest / Telegram. URL: https://entry1178-dcround1.usercontent.dev (access date: 21.02.2020)