Linux Scroll

Just another WordPress.com site

数据挖掘方法

数据挖掘方法:

分类(Classification):是学习一种将某一项数据映射(分类)到几个预定义分类中的一种功能;
回归(Regression):是学习一种将某一项数据映射到取值为R的预测变量的功能;
聚类(Clustering):是一种常见的描述性任务旨在确定在一组有限级的类别或聚类来描述数据;
总计(Summarization):包括为一个数据集找到一种简洁描述的方法;
依赖(Dependency) 模型:是要找到一种模型来描述存在于两个层次上依赖模型之间显著的依赖性;
对变化和差异的检测集中在从先前的测量或规范值中发现最值得注意的数据;
数据挖掘算法的组件;
模型的表示是用来描述模式发现的语言;
评价标准是模型在一个特定的模式上如何满足数据库知识发现 (KDD) 过程的目标的定量语句(或功能调整);
搜索方法由两个组件组成:1)搜索参数;2)模型搜索;
一旦模型表示方法和模型评价标准建立起来,那么数据挖掘的问题就降至为仅仅是一种优化任务,找出模型优化标准。

Advertisements

Comments are closed.

%d bloggers like this: