ML学习笔记之————朴素贝叶斯(Navie Bayesian Model)分类器
朴素贝叶斯分类器
贝叶斯分类是一系列分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。朴素贝叶斯算法(Naive Bayesian) 是其中应用最为广泛的分类算法之一。它是一种十分简单的分类算法,叫它朴素贝叶斯分类是因为这种方法的思想真的很朴素,朴素贝叶斯的思想基础是这样的:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别。
贝叶斯定理是贝叶斯分类器的基础,贝叶斯定理为:
条件概率公式为:
训练朴素贝叶斯分类器的算法流程:
所以最终需要计算的就是:
然而,全面的计算特征X的条件概率是不切实际的,因此假设X中每一维的特征之间都是相互独立的,因此可以得到:
这样就能快速的计算出特征X条件下结果是Y类的条件概率。
Tips:
- 一般情况下特征离散值可以直接估算每一维的条件概率,但是当特征出现连续值时,我们假定其服从高斯分布,利用高斯分布来表达他的概率。在压缩跟踪算法中,就是对特征进行了高斯分布的均值和方差更新,来判断具有最大概率的矩形框作为当前帧的检测结果。
- 对于训练集中没出现过的特征,对其概率进行计算时,分子为1。