Spark快速大数据分析——机器学习_statistics.corr(rdd,method)-CSDN博客

网站介绍:文章浏览阅读460次。楔子《Spark快速大数据分析》学习11 基于MLlib的机器学习​ MLlib是Saprk中提供机器学习函数的库。它是专门在集群上并行的情况而设计的。MLlib中包含许多机器学习算法,可以在Spark支持的所有编程语言中使用。11.1 概述​ MLlib的设计里面非常简单:把数据已RDD的形式表示,然后在分布式数据集上调用各种算法。MLlib引入了一些数据类型(例如点和向量),不过..._statistics.corr(rdd,method)