ДОСЛІДЖЕННЯ ЕФЕКТИВНОСТІ РОЗПОДІЛЕНИХ АЛГОРИТМІВ МАШИННОГО НАВЧАННЯ

Автор(и)

  • Катерина Островська
  • Іван Стовпченко
  • Владислав Аніщенко

DOI:

https://doi.org/10.34185/1562-9945-1-132-2021-14

Ключові слова:

алгоритм, apache mahout, k-means, fuzzy k-means / c-means, нечітка кластеризація, машинне навчання, hadoop

Анотація

Робота присвячена дослідженню ефективності розподілених алгоритмів машинного навчання реалізованих в проекті Apache Mahout.
В результаті роботи був проведений аналіз ефективності алгоритмів машинного на-вчання за допомогою методу кластеризації к-середніх (k-Means) і методу нечіткої кластеризації к-середніх (fuzzy k-Means / c-Means), реалізованих в проекті Apache Mahout.
Отримано результати тестування обох методів кластеризації на однакових наборах даних.
Розглянуто точність кластеризації кожного методу, а також побудовані порівняльні діаграми результатів досліджуваних методів.

Посилання

Ralf Lammel. Google's MapReduce Programming Model - Revisited. 2017р., 42с.

URL: https://userpages.uni-koblenz.de/~laemmel/MapReduce/paper.pdf

Tom White. Hadoop: The Definitive Guide. THIRD EDITION. O'RELLY. - 2013р., 647c.

Чак Лем. Hadoop в дії. Москва. - 2012р., 448с.

MicheleNemschoff. Maximize Performance and Scalability Within Your Hadoop Architecture. 2014р.

URL: https://www.smartdatacollective.com/how-maximize-performance-and-scalability-within-your-hadoop-architecture /

Sea Owen, Robin Anil, Ted Dunning, Ellen Friedman. Mahout in action. MANNING. - 2012р., 341с.

Adam Coates, Andrew Y. Ng. Learning Feature Representations with K-means, Stanford University, 2012р., 20 стор.

URL: https://cs.stanford.edu/~acoates/papers/coatesng_nntot2012.pdf

Ershov K.S., Romanova T.N. Analysis and classification of clustering algorithms. MSTU. Not. Bauman. 2016 6s.

Tutorial spoint. Mahout - Clustering.

URL: https://www.tutorialspoint.com/mahout/mahout_clustering.htm

Alexander N. Gorban, Andrei Y. Zinovyev. Principal Graphs and Manifolds. University of Leicester. 36с.

URL: https://arxiv.org/ftp/arxiv/papers/0809/0809.0490.pdf

Kwok, T., Smith, K., Lozano, S., Taniar. Parallel Fuzzy c-Means Clustering for Large Data Sets, 2012р.

URL: http://num-meth.srcc.msu.ru/zhurnal/tom_2012/pdf/v13r207.pdf

Mikhalev A.I., Vinokurova E.A., Sotnik S.L. Computer methods of intelligent data pro-cessing: a textbook. - Dnepropetrovsk: NMetAU, IC "System Technologies", 2014. - 209 pages.

Завантаження

Опубліковано

2021-03-01