Кластеризация информационных новостных сообщений на событийные группы

Автор(и)

  • Dmytro Horobets

DOI:

https://doi.org/10.34185/1991-7848.itmm.2020.01.031

Ключові слова:

ТЕКСТ, ИНФОРМАЦИЯ, НОВОСТИ, КЛАСТЕРИЗАЦИЯ, КЛАССИФИКАЦИЯ

Анотація

В работе рассмотрены вопросы обработки информационных сообщений. Выделение среди сообщений новостей, их классификацией по тематикам, формирование в группы новостных сюжетов, ранжирование новостных сюжетов по важности. Предложенный алгоритм основан на формировании для сообщений множества слов-маркеров и сравнением данных множеств, принадлежащих разным сообщениям между собой.

Посилання

Data Clustering Contest: Round 1 // site of Developer Challenges / Telegram. URL: https://contest.com/docs/data_clustering (access date: 21.02.2020)

The result of the algorithm’s functioning on test data // site of Developer Challenges / Data Clustering Contest / Telegram. URL: https://entry1178-dcround1.usercontent.dev (access date: 21.02.2020)

Завантаження

Опубліковано

2020-03-25

Номер

Розділ

Статті