数据湖,MariaDB AX开源分析解决方案,用Grafana为Elasticsearch做日志分析,library,url,c...
2024-01-23 13:32 阅读 阅读全文大数据”时代已经降临,在商业、经济及其他领域中,决策将日益基于数据和分析而作出,而并非基于经验和直觉。大数据在企业中的运用涉及到各个领域,商业模式、管理革新、人......
2024-02-26 18:02 阅读 阅读全文文章浏览阅读489次。本节将对数据挖掘的基本概念进行介绍,包括数据挖掘的定义、数据挖掘的价值类型和数据挖掘算法的类型等。什么是数据挖掘数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际数据中,提取......
2024-01-21 12:50 阅读 阅读全文资源浏览查阅74次。2.计算公式如下: 其中一项条件概率可以通过朴素贝叶斯条件独立展开3.如果 中的某一项数据挖掘面试更多下载资源、学习资料请访问CSDN文库频道....
2023-11-11 22:20 阅读 阅读全文文章浏览阅读1.1k次。数据质量分析是数据挖掘中数据准备过程重要的一环,是数据预处理的前提。数据质量分析的主要任务是检查原始数据中是否存在脏数据,脏数据包括缺失值,异常值,不一致的值等等。缺失值缺失值就是......
2024-01-23 23:26 阅读 阅读全文文章浏览阅读6k次,点赞3次,收藏13次。之前写算法太侧重于理解和推导,后面的算法将更侧重于在sklearn中使用和官方数据集测试,本篇讲聚类,聚类是一类算法的统称,属经典的无监督学习,无需样本训练得到模型后再适用于......
2024-01-22 23:16 阅读 阅读全文文章浏览阅读544次。目录决策树Q1:决策树是什么?Q2:信息增益中信息熵的概念是什么?Q3:在一个样本集中,其中有100个样本属于A,9900个样本属于B,若通过决策树算法来实现对A、B样本的分类,会遇到什么问题?Q4:什么是过拟合......
2024-01-23 03:15 阅读 阅读全文车库男孩擅长Linux,车库百科,大数据及数据挖掘,等方面的知识,车库男孩关注数据分析,机器学习,深度学习,神经网络领域....
2023-10-14 10:30 阅读 阅读全文文章浏览阅读801次。最近在完成一个分类模型在使用dataframe使用还有一些不是得心应手的地方,这里再次系统地总结dataframe使用以及数据探索、建模过程中的疑惑;DataFrame中groupbygroupby函数有很多妙用,从数据库得到的要分析的......
2024-01-22 23:14 阅读 阅读全文文章浏览阅读5.8k次,点赞5次,收藏12次。之前主要介绍单机器学习算法的理解和使用,实际场景多使用集成学习即组合的挖掘算法以达到最优效果,集成学习有2种:Boosting和Bagging,前者通过多个串行的弱学习器得到强学习器(G......
2024-01-22 23:16 阅读 阅读全文