当前位置:首页 > 数据挖掘 > 正文

数据挖掘对象分类


根据数据类型
结构化数据:以表格形式组织的数据,具有明确的数据结构和数据类型(例如,关系数据库)。
非结构化数据:不遵循特定结构或数据类型的文本、图像、视频和音频等数据。
半结构化数据:介于结构化和非结构化数据之间,具有部分结构(例如,XML、JSON)。
根据数据来源
内部数据:公司或组织内部收集和维护的数据,例如客户交易历史、运营数据、财务数据。
外部数据:从外部来源(例如,社交媒体、公共数据集、市场研究)收集的数据。
混合数据:内部和外部数据源结合的数据。
根据数据尺寸
小数据:数据量较小(几十兆字节到几千兆字节),可以使用标准数据分析工具进行处理。
大数据:数据量大(几千兆字节到几拍字节),需要专门的工具和技术进行处理。
根据数据更新频率
静态数据:随着时间的推移保持相对稳定的数据(例如,人口统计数据)。
动态数据:随着时间的推移不断变化和更新的数据(例如,股票价格、社交媒体帖子)。
流式数据:实时生成和处理的数据(例如,传感器数据、物联网数据)。
根据数据复杂性
单一数据:仅包含一种数据类型的数据(例如,财务数据)。
多模态数据:包含多种数据类型的数据(例如,文本、图像、视频和音频)。
高维数据:具有大量特征或属性的数据(例如,基因数据)。
其他分类
业务数据:与业务运营相关的过程和活动的数据。
科学数据:用于科学研究和实验的数据。
社会数据:与人类互动和社会行为相关的数据。