Linux Scroll

Just another WordPress.com site

KDD

KDD:Knowledge Discovery in Databases 知识发现

KDD是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。知识发现将信息变为知识,从数据矿山中找到蕴藏的知识金块,将为知识创新和知识经济的发展作出贡献。

1. 对应用领域的开发和认识,并有相关的经验知识和从客户的角度识别数据库知识发现 (KDD) 过程的目标;
2. 创设一个数据集的目标:选择数据集,或者聚焦于一组用于发现的变量或数据样本;
3. 数据清洗和预处理。基本操作包括去除错误数据,收集必要的信息建模或处理缺失数据的策略以及信息时间顺序和变化;
4. 数据压缩和投影:根据任务的目的寻找有用的特征呈现数据。通过降维的方法,对有效的变量数目可能减少的数据表示;
5. 匹配过程目标:特别数据挖掘方法 (步骤1)的数据库知识发现 (KDD)。例如,总计、分类、回归、聚类和其它;
6. 建模和探索性分析与假设的选择:选择算法和数据挖掘并选择用于寻找数据模式的方法。最终用户对预测能力更有兴趣;
7. 数据挖掘:寻找一种特定的表现形式或一组这些表征的兴趣模式,包括分类规则或树型、回归与聚类;
8. 解释挖掘模式,可能为另外的迭代再回到步骤1至7之间的有些步骤。这一步包含提取模式和给予绘制模型的可视化数据;
9. 知识发现:直接利用知识结合另一个系统知识进一步地行动,或简单地记录并向利益相关者报告,检查和分辨之前冲突。

Advertisements

Comments are closed.

%d bloggers like this: