Naive Bayes Classifier

Jun 19, 2016


面临一个分类问题,单个样本表示为,意思是n个特征

而其类别个可取值

根据贝叶斯定理

\begin{align} p(y|x) = \frac{p(y)p(x|y)}{p(x)} \end{align}

由于分母和无关,因此

\begin{align} p(y|x) &\propto p(y)p(x|y) \\ &= p(y)p(x_n|y)p(x_{n-1}|y,x_n)…p(x_1|y,x_2,x_3,…,x_n) \end{align}

在朴素贝叶斯中,认为各个特征互相独立,因此

\begin{align} p(y|x) &\propto p(y)\prod_{i=1}^np(x_i|y) \end{align}

也就是说

\begin{align} p(y|x) = \frac{1}{Z}p(y)\prod_{i=1}^np(x_i|y) \end{align}

用于保证

\begin{align} \sum_y p(y | x)=1 \end{align}

确定的时候是个常量

对于,其最终预测的类别

\begin{align} \hat{y} = \mathop{argmax}_y p(y)\prod_{i=1}^np(x_i|y) \end{align}