ДОСЛІДЖЕННЯ ЕФЕКТИВНОСТІ РОЗПОДІЛЕНИХ АЛГОРИТМІВ МАШИННОГО НАВЧАННЯ
DOI:
https://doi.org/10.34185/1562-9945-1-132-2021-14Ключові слова:
алгоритм, apache mahout, k-means, fuzzy k-means / c-means, нечітка кластеризація, машинне навчання, hadoopАнотація
Робота присвячена дослідженню ефективності розподілених алгоритмів машинного навчання реалізованих в проекті Apache Mahout.
В результаті роботи був проведений аналіз ефективності алгоритмів машинного на-вчання за допомогою методу кластеризації к-середніх (k-Means) і методу нечіткої кластеризації к-середніх (fuzzy k-Means / c-Means), реалізованих в проекті Apache Mahout.
Отримано результати тестування обох методів кластеризації на однакових наборах даних.
Розглянуто точність кластеризації кожного методу, а також побудовані порівняльні діаграми результатів досліджуваних методів.
Посилання
Ralf Lammel. Google's MapReduce Programming Model - Revisited. 2017р., 42с.
URL: https://userpages.uni-koblenz.de/~laemmel/MapReduce/paper.pdf
Tom White. Hadoop: The Definitive Guide. THIRD EDITION. O'RELLY. - 2013р., 647c.
Чак Лем. Hadoop в дії. Москва. - 2012р., 448с.
MicheleNemschoff. Maximize Performance and Scalability Within Your Hadoop Architecture. 2014р.
Sea Owen, Robin Anil, Ted Dunning, Ellen Friedman. Mahout in action. MANNING. - 2012р., 341с.
Adam Coates, Andrew Y. Ng. Learning Feature Representations with K-means, Stanford University, 2012р., 20 стор.
URL: https://cs.stanford.edu/~acoates/papers/coatesng_nntot2012.pdf
Ershov K.S., Romanova T.N. Analysis and classification of clustering algorithms. MSTU. Not. Bauman. 2016 6s.
Tutorial spoint. Mahout - Clustering.
URL: https://www.tutorialspoint.com/mahout/mahout_clustering.htm
Alexander N. Gorban, Andrei Y. Zinovyev. Principal Graphs and Manifolds. University of Leicester. 36с.
URL: https://arxiv.org/ftp/arxiv/papers/0809/0809.0490.pdf
Kwok, T., Smith, K., Lozano, S., Taniar. Parallel Fuzzy c-Means Clustering for Large Data Sets, 2012р.
URL: http://num-meth.srcc.msu.ru/zhurnal/tom_2012/pdf/v13r207.pdf
Mikhalev A.I., Vinokurova E.A., Sotnik S.L. Computer methods of intelligent data pro-cessing: a textbook. - Dnepropetrovsk: NMetAU, IC "System Technologies", 2014. - 209 pages.
Завантаження
Опубліковано
Номер
Розділ
Ліцензія
Ця робота ліцензується відповідно до ліцензії Creative Commons Attribution 4.0 International License.