一个贝叶斯公式的常见误用 2012-04-16

@淘宝tmall-数据挖掘团队:贝叶斯公式:在酒吧里认识了一位漂亮的女郎,那么,她更可能是一个教师还是一个模特?我不假思索的认为她是个模特。然而贝叶斯告诉我们,因为社会上教师的概率大于模特很多,所以尽管教师队伍中美女的比例不高,但综合来看,还是更可能是一个教师。

这是一条来自@淘宝tmall-数据挖掘团队的微博,我的回复是:贝耶斯含笑九泉(¬_¬) 这条微博为如下来自病人检测的例子披上一个美丽的外壳:一种发病率0.01%的罕见疾病,医生检测错误(阳性检测为阴性或者相反)的概率是1%,就是说如果有病,那么检测结果99%会是阳性;如果没病,那么有1%的可能性结果会呈阳性。某病人检测结果为阳性,那也不要过分担心,因为没病的可能性还有0.1%99%/(99.9%1%+0.1%*99%)=91%.

其实这条微博没有考虑的是,社会上教师的概率大于模特很多,酒吧里教师的概率就比模特小得多了,漏掉了一个关键的条件概率,所以得到这样荒谬的结论。顺着他的思路就会得到:在爱尔兰遇到一个人,那么他更可能是一个爱尔兰人还是中国人呢?我不假思索认为他是个爱尔兰人,然儿贝叶斯告诉我们,因为世界上中国人的概率大于爱尔兰很多,所以尽管中国人在爱尔兰的比例不高,但综合来看,还是更可能是个中国人……



Powered by Jekyll on GitHub | ©2016 Meroa | Last modified: 2018-02-03