理论原理部分可以看这一篇:http://www.cnblogs.com/charlesblc/p/6109551.html
这里是实战部分。参考了 http://www.cnblogs.com/shishanyuan/p/4747778.html
采用了三个案例,分别对应聚类、回归和协同过滤的算法。
我觉得很好,需要每一个都在实际系统中试一下。
更多api介绍可以参考 http://spark.apache.org/docs/2.0.1/ml-guide.html
时间: 2024-11-07 22:14:45