大数据开发之机器学习总结(Mllib示例)(五)_"data.map{ line => val part = line.split(\"|\");la-CSDN博客

网站介绍:文章浏览阅读300次。大数据开发之机器学习总结(Mllib示例)(五)背景作为spark框架中支持机器学习的模块,其算法库核心内容如下可以看到,主要就是分类,回归,决策树等算法1. 分类算法分类算法属于监督式学习,使用类标签已知的样本建立一个分类函数或分类模型,应用分类模型,能把数据库中的类标签未知的数据进行归类分类在数据挖掘中是一项重要的任务,目前在商业上应用最多,常见的典型应用场景有流失预测、精确营销、客户获取、个性偏好等MLlib 目前支持分类算法有:逻辑回归、支持向量机、朴素贝叶斯和决策树导_"data.map{ line => val part = line.split(\"|\");labeledpoint(part(0).todouble,v"