当前位置:首页 > 数据挖掘 > 正文

数据挖掘的常见任务有哪些

分类
二分类: 将数据点分为两组(例如,是/否、好/坏)
多分类: 将数据点分为多个组(例如,动物类型:猫、狗、鸟)
回归
线性回归: 预测连续变量(例如,收入)与一个或多个自变量(例如,教育程度)之间的关系
非线性回归: 预测变量之间的非线性关系(例如,指数增长)
聚类
k均值聚类: 将数据点划分为k个组(集群),使组内相似度最大化,组间相似度最小化
层次聚类: 通过建立层次结构来将数据点分组,从最相似到最不相似
关联规则挖掘
关联规则: 发现数据集中项目的集合之间的关联关系(例如,购买面包的人也经常购买牛奶)
频繁项集: 出现频率高于指定支持度(支持度是指在数据集中出现项集的频率)的项目集合
异常点检测
距离异常点: 检测与其他数据点距离较大的异常点
密度异常点: 检测数据密度较低区域的异常点