简述网络舆情之海量数据收集流程_海量大数据判定图-CSDN博客

网站介绍:文章浏览阅读1.9k次。一、大数据调查研究的流程1、明确问题:确定清晰的调研目标2、数据来源:选择数据,数据从哪里来,数据的获取3、数据处理:哪些数据有用,数据的处理、清洗·预处理——归一化——数据清洗——去除重复数据——连接4、特征工程:构建数据分析维度,知识图谱与知识库,给数据打上特征标签5、建立模型:构建分析指标及模型。模型是指对于某个实际问题或客观事务、规律进行抽象后的一种形式化表达方式,任何模型都有三个部分组成:目标、变量和关系6、评估及展示:数据可视化及成果应用·数据分析报告(调研报告):项目背景及目标_海量大数据判定图