数学符号自我规范和朴素贝叶斯部分推导

29 Aug 2018

数学符号自我规范

输入空间用花体表示 $\mathcal{X}$ ,假设有 $M$ 个属性 , 每个属性有 $VM$ 个取值 , 则特征空间可以表示为:

\[\mathcal{X}=\{ (pv_{11},pv_{22},\cdots,pv_{M1})^T, (pv_{11},pv_{22},\cdots,pv_{M2})^T, \cdots, (pv_{11},pv_{22},\cdots,pv_{M(VM)})^T, \cdots, (pv_{m(V1)},pv_{m(V2)},\cdots,pv_{m(VM)})^T \cdots, (pv_{M(V1)},pv_{M(V2)},\cdots,pv_{M(VM)})^T \} \in \mathbb{R}^M \\ m=1,2,\cdots,M \\ Vi = 1,2,\cdots,VM\]

同理输出空间 $\mathcal{Y}$ ,假设有 $C$ 个类 ,每个类用 $y_i$ 表示。

\[\mathcal{Y} = \{ y_1,y_2,y_3,\cdots,y_C \} \in \mathbb{R} \space i=1,2,\cdots,C\]

朴素贝叶斯推导的例子

设特征空间为 $\mathcal{X}$ ,输出空间为 $\mathcal{Y}$ , 根据上面定义的 特征空间和 输出空间一样,输入为特征向量 $\overrightarrow{x} \in \mathcal{X}$ , 输出为类标记 $y \in \mathcal{y} $ . $ \overrightarrow{x}’ $ 是定义在 $\mathcal{X}$ 的随机变量 ,$y’$ 是定义在 $\mathcal{y}$ 上的随机变量 。

\[P(y'=y_i) \space i = 1,2,3,4,\cdots,C \\ P(\overrightarrow{x}'=(x_1,x_2,x_3,\cdots,x_M) | y'=y_i) \\ = P((\overrightarrow{x}')_1 = x_1 ,\cdot,(\overrightarrow{x}')_M = x_M | y'=y_i) \\\]

条件独立性假设之后,得到:

\[= \prod_j^MP((\overrightarrow{x}')_j = x_j| y'=y_i)\]

则根据贝叶斯公式得到:

\[P( y'=y_i | \overrightarrow{x}'=(x_1,x_2,x_3,\cdots,x_M) ) = P(y'=y_i) \prod_j^MP((\overrightarrow{x}')_j = x_j| y'=y_i)\]