Кластеризація зашумленних часових рядів

Автор(и)

  • Anastasiia Yevhenivna Tkachenko
  • Liudmyla Olehivna Kyrychenko
  • Tamara Anatoliivna Radyvylova

DOI:

https://doi.org/10.34185/1562-9945-3-122-2019-15

Ключові слова:

кластеризация, временной ряд, функция расстояния, метод k-средних, метод DBSCAN

Анотація

Однією з актуальних задач машинного навчання є завдання кластеризації об'єктів. Кластеризація часових рядів використовується як самостійна дослідницька техніка, а також як частина більш складних методів інтелектуального аналізу даних, такі як виявлення правил, класифікація, виявлення аномалій і т.д.
Проведено порівняльний аналіз кластеризації зашумленних часових рядів вибірки. Вибірка для кластеризації містила часові ряди різних типів, серед яких були присутні нетипові об'єкти. Кластеризація проводилася методами k-середніх і DBSCAN з використанням різних функцій відстані для часових рядів.
В роботі була проведена кластеризація зашумленних часових рядів різних типів. Були використані методи DBSCAN і k-середніх з різними функціями відстані. Кращі результати показав метод DBSCAN з евклідової метрикою і CID-функцією.
Аналіз результатів кластеризації часових рядів дозволяє визначити ключові відмінності між методами: якщо можна визначити кількість кластерів і не потрібно відокремлювати нетипові тимчасові ряди, метод k-середніх показує досить хороші результати; якщо немає інформації про кількість кластерів і існує задача виділення нетипових рядів, целесобразно використовувати метод DBSCAN.

Посилання

Aghabozorgi S., Shirkhorshidi A.S., Wah, T.J.: Time-series clustering. A Decade Review Information systems 53, 16-38 (2015).

Aggarwal C., Reddy C.: Data Clustering: Algorithms and Applications. CRC Press (2013).

Liao T.W. Clustering of time series data – a survey. Pattern Recognition, 38 (11), 1857-1874 (2005).

Rani S., Sikka G.: Recent Techniques of Clustering of Time Series Data: A Survey. International Journal of Computer Applications 52 (15), 1-9 (2012). doi: 10.5120/8282-1278.

Grabusts P., Borisov A.: Clustering methodology for time series mining (2009). Scientific Journal of Riga Technical University 40, 81-86 (2009).

Barreto G., Aguayo, L.: Time Series Clustering for Anomaly Detection Using Competitive Neural Networks. In: Proceeding WSOM '09 Proceedings of the 7th International Workshop on Advances in Self-Organizing Maps, St. Augustine, FL, USA, 28-36 (2009).

Nascimento E.S., Tavares O.L., Souza A.F.: A Cluster-based Algorithm for Anomaly Detection in Time Series Using Mahalanobis. In: ICAI'2015 International Conference on Artificial Intelligence 2015, Las Vegas, USA 622-628 (2015).

Завантаження

Опубліковано

2019-10-10