Spark Machine Learning(SparkML):机器学习(部分一)_chisquaretest.test(df, "features", "label").head-CSDN博客

网站介绍:文章浏览阅读7.7k次,点赞12次,收藏43次。机器学习是现阶段实现人工智能应用的主要方法,它广泛应用于机器视觉、语音识别、自然语言处理、数据挖掘等领域。MLlib是Apache Spark的可伸缩机器学习库。官网地址:[http://spark.apache.org/docs/latest/ml-guide.html]Spark的机器学习(ML)库提供了许多分布式ML算法。这些算法包括特征选取、分类、回归、聚类、推荐等任务。ML还提供了用于构建工作流的ML管道、用于调优参数的交叉验证器以及用于保存和加载模型的模型持久性等工具。其目标是使实用的机器学_chisquaretest.test(df, "features", "label").head