当前位置:首页 > 数据挖掘 > 正文

数据挖掘的6个流程图


1. CRISP-DM(交叉行业过程数据挖掘方法论)
CRISP-DM 是数据挖掘行业中广泛采用的流程图。
它涵盖了从业务理解到部署和维护的六个阶段:
1. 业务理解
2. 数据理解
3. 数据准备
4. 建模
5. 评估
6. 部署
2. SEMMA(样本、探索、修正、建模、评估)
SEMMA 是 SAS(统计分析软件)开发的流程图。
它比 CRISP-DM 更简洁,有五个阶段:
1. 抽样
2. 探索
3. 修改
4. 建模
5. 评估
3. KDD(知识发现数据库)过程
KDD 流程图最初由 AAAI(美国人工智能协会)定义。
它包含九个阶段,涵盖了数据挖掘的整个生命周期:
1. 选择目标
2. 创建目标数据
3. 清理和预处理数据
4. 数据降维
5. 选择算法
6. 训练模型
7. 评估模型
8. 部署模型
9. 监控和维护模型
4. AMIE(分析模型改进引擎)
AMIE 是 IBM 开发的流程图,用于改进现有分析模型。
它包括四个阶段:
1. 评估模型性能
2. 识别模型改进的机会
3. 应用改进
4. 监控和维护更新后的模型
5. PMML(预测模型标记语言)
PMML 是一种标准化的 XML 语言,用于表示预测模型。
它允许模型在不同的软件平台之间轻松共享和部署。
6. DMML(数据挖掘标记语言)
DMML 是一种 XML 语言,用于表示整个数据挖掘过程。
它提供了对数据挖掘流程及其各个步骤的统一视图。