使用聚类算法能够挖掘数据中潜在的分布规律。K-means 聚类算法是最常用的聚类算法。 本项目使用Java + MapRedcue 计算框架,实现 K-means 聚类算法并处理给定的数据集(未使用第三方库,例如 MLlib)。同时,用python以散点图的方式对结果进行可视化展示。 输入数据集 ...
In this repository you can find a MapReduce implementation of the K-Means algorithm. The code is written in Java since it has been developed for the Hadoop framework.
Application Programming,Centroid,Distributed Computing,Fault-tolerant,File Content,Iterative Algorithm,Iterative MapReduce,K-means,K-means Algorithm,Map Tasks,Master ...