网站介绍:文章浏览阅读2.6k次,点赞4次,收藏31次。1.spark生态:Spark Corespark 的核心计算 ,用于通用分布式数据处理的引擎。不依赖于任何其他组件,可以运行在任何商用服务器集群上。实现饿了 Spark 的基本功能,包含任务调度、内存管理、错误恢复,与存储系统交互等模块。还包含了对弹性分布式数据集(Resilient Distributed Dataset,简称RDD)的API 定义。Spark SQL是Spark用来操作结构化数据的程序包,可以使用SQL或者HQL来对历史数据做交互式查询(即席查询:用户根据自己的需求 自定义_spark知识点总结
- 链接地址:https://blog.csdn.net/Poolweet_/article/details/108472944
- 链接标题:Spark知识点全总结_spark知识点总结-CSDN博客
- 所属网站:blog.csdn.net
- 被收藏次数:1609
- 网站标签:spark知识点总结