Кластеризація зашумленних часових рядів
DOI:
https://doi.org/10.34185/1562-9945-3-122-2019-15Ключові слова:
кластеризация, временной ряд, функция расстояния, метод k-средних, метод DBSCANАнотація
Однією з актуальних задач машинного навчання є завдання кластеризації об'єктів. Кластеризація часових рядів використовується як самостійна дослідницька техніка, а також як частина більш складних методів інтелектуального аналізу даних, такі як виявлення правил, класифікація, виявлення аномалій і т.д.
Проведено порівняльний аналіз кластеризації зашумленних часових рядів вибірки. Вибірка для кластеризації містила часові ряди різних типів, серед яких були присутні нетипові об'єкти. Кластеризація проводилася методами k-середніх і DBSCAN з використанням різних функцій відстані для часових рядів.
В роботі була проведена кластеризація зашумленних часових рядів різних типів. Були використані методи DBSCAN і k-середніх з різними функціями відстані. Кращі результати показав метод DBSCAN з евклідової метрикою і CID-функцією.
Аналіз результатів кластеризації часових рядів дозволяє визначити ключові відмінності між методами: якщо можна визначити кількість кластерів і не потрібно відокремлювати нетипові тимчасові ряди, метод k-середніх показує досить хороші результати; якщо немає інформації про кількість кластерів і існує задача виділення нетипових рядів, целесобразно використовувати метод DBSCAN.
Посилання
Aghabozorgi S., Shirkhorshidi A.S., Wah, T.J.: Time-series clustering. A Decade Review Information systems 53, 16-38 (2015).
Aggarwal C., Reddy C.: Data Clustering: Algorithms and Applications. CRC Press (2013).
Liao T.W. Clustering of time series data – a survey. Pattern Recognition, 38 (11), 1857-1874 (2005).
Rani S., Sikka G.: Recent Techniques of Clustering of Time Series Data: A Survey. International Journal of Computer Applications 52 (15), 1-9 (2012). doi: 10.5120/8282-1278.
Grabusts P., Borisov A.: Clustering methodology for time series mining (2009). Scientific Journal of Riga Technical University 40, 81-86 (2009).
Barreto G., Aguayo, L.: Time Series Clustering for Anomaly Detection Using Competitive Neural Networks. In: Proceeding WSOM '09 Proceedings of the 7th International Workshop on Advances in Self-Organizing Maps, St. Augustine, FL, USA, 28-36 (2009).
Nascimento E.S., Tavares O.L., Souza A.F.: A Cluster-based Algorithm for Anomaly Detection in Time Series Using Mahalanobis. In: ICAI'2015 International Conference on Artificial Intelligence 2015, Las Vegas, USA 622-628 (2015).