以慕课网日志分析为例 进入大数据 Spark SQL 的世界 ---课程笔记--未完待续_大数据spark sql慕课网日志分析-CSDN博客网友收藏

以慕课网日志分析为例 进入大数据 Spark SQL 的世界 ---课程笔记--未完待续_大数据spark sql慕课网日志分析-CSDN博客

文章浏览阅读1.7k次。第一章 初探大数据 1、什么是大数据? 大数据特征:4V 数据量(Volume) PB、EB、ZB 给予高度分析的新价值(Value) 巨额数据里面提取需要的高价值数据 速度(Velocity) 实时流处理,电商推荐系统,在你浏览或......
阅读全文
基于Spark的网站日志分析-CSDN博客网友收藏

基于Spark的网站日志分析-CSDN博客

文章浏览阅读668次。本文只展示核心代码,完整代码见文末链接。Web Log Analysis提取需要的log信息,包括time, traffic, ip, web address进一步解析第一步获得的log信息,如把ip转换为对应的省份,从网址中提取出访问内容和内容ID,最后......
阅读全文