kmeans-pyspark:Spark中分布式K-means聚类的Python实现_pyspark实现kmeans资源-CSDN文库

网站介绍:资源浏览查阅49次。kmeans-pyspark:Spark中分布式K-means聚类的Python实现,本地开发和运营依存关系确保您已将Python2.7和pip一起安装。然后运行:pipinstall-rrequirements.txt正在运行的工作使用中央作业运行程序模块src/index.py运行所有作业。您完全不需要编辑此文件。pythonsrc/index.py<job><k><file1><file2>参数:<job>src/spark_jobs.py定义的作业功能名称<k>生成的簇数<file1>数据文件的文件路径(可以是项目中的绝对路径或本地路径)这些作业可以占用多个文件。这些应仅附加到命令中。例如:pythonsrc/index.pyuser__reputation__to__upvotes_cast3tests/fixtures/users.xml新增工作所有作业均从src/s更多下载资源、学习资料请访问CSDN文库频道