数据挖掘十大算法之贝叶斯分类算法

1、引言

贝叶斯分类算法是统计学的一种分类方法,它是一类利用概率统计知识进行分类的算法。在许多场合,朴素贝叶斯(Nave Bayes,NB)分类算法可以与决策树和神经网络分类算法相媲美,该算法能运用到大型数据库中,而且方法简单、分类准确率高、速度快。由于贝叶斯定理假设一个属性值对给定类的影响独立于其它属性的值,而此假设在实际情况中经常是不成立的,因此其分类准确率可能会下降。为此,就衍生出许多降低独立性假设的贝叶斯分类算法,如TAN(tree augmented Bayes network)算法。

2、以一个实例来描述朴素贝叶斯分类算法:

题目:下面的例子分为3类: {Short,Tall,Medium},Height为连续属性,假定该属性服从高斯分布 ,数据集如表4-5所示,请用贝叶斯分类方法对例子t=(Adam,,M,1.95m)进行分类。

解:

数据样本用属性name,Gender和Height描述。类别标号属性Output具有{Short,Tall,Medium}三个不同值。

设:C1类对应于Output=”Short”,C2类对应于Output=”Tall”,C3类对应于Output=”Medium”

希望分类的已知样本为:t=(Adam,M,1.95m)

3、Word文档下载

(1)

原文作者:Joe Chael

原文地址:

大把大把的时光从指缝间遛走,

数据挖掘十大算法之贝叶斯分类算法

相关文章:

你感兴趣的文章:

标签云: