贝叶斯学派的思想是用数据来更新特定假设的概率。
贝叶斯公式
举例说明:
某人去进行一项疾病检查,检测结果为阳性,因为检测并不会100%准确,那么真的患此病的概率为多少?
公式由贝叶斯公式给出:
\[P(患病 \vert 阳性) = \frac{P(阳性 \vert 患病)P(患病)}{P(阳性)}\]已知检查结果为阳性并且真的患病的后验概率$P(患病 \vert 阳性)$依赖于患病的先验概率$P(患病)$,另一方面后验概率还依赖于检查的准确程度$P(阳性 \vert 患病)$与$P(阴性 \vert 健康)$。
例1:
一辆出租车在夜晚肇事之后逃逸,一位目击证人辨认出肇事车辆是蓝色的。已知这座城市 85% 的出租车是绿色的,15% 是蓝色的。警察经过测试,认为目击者在当时可以正确辨认出这两种颜色的概率是 80%, 辨别错误的概率是 20%. 请问,肇事出租车是蓝色的概率是多少?
解:
令A为肇事出租车是蓝色,B为目击者辨认为蓝色。
\[\begin{aligned} P(A \vert B) = \frac {P(B \vert A) P(A)} {P(B)} &= \frac {P(B \vert A) P(A)} {P(B \vert A)P(A) + P(B \vert \bar A)P(\bar A)} \\ &= \frac {0.8 \times 0.15} {0.8 \times 0.15 + 0.2 \times 0.85} \approx 0.41 \end{aligned}\]例2:
一个汽车公司的产品,甲厂占40%,乙厂占60%,甲的次品率是1%,乙的次品率是2%,现在抽出一件汽车是次品,问是甲生产的可能性?
解:
令A为产品是甲生产的,B为该产品为次品。
\[P(A \vert B) = \frac {0.01 \times 0.4} {0.01 \times 0.4 + 0.02 \times 0.6} = 0.25\]似然函数
在统计学中,似然函数的定义是:
\[L(\theta \vert x) = P(x \vert \theta)\]