Spark算子讲解(一)-CSDN博客

网站介绍:文章浏览阅读116次。1:Zip算子def zip[U](other: RDD[U])(implicit arg0: ClassTag[U]): RDD[(T, U)]将两个RDD做zip操作,如果当两个RDD分区数目不一样的话或每一个分区数目不一样的话则会异常。例如:val rdd1 = sc.parallelize(Array(1,2,3,4,5,6),2)val rdd2 = sc..._spark 的 toiterator的用处