Skip to content

Instantly share code, notes, and snippets.

@shm007g
Last active November 30, 2022 02:35
Show Gist options
  • Star 0 You must be signed in to star a gist
  • Fork 0 You must be signed in to fork a gist
  • Save shm007g/c65ab370b8801faa193249ca30d906c0 to your computer and use it in GitHub Desktop.
Save shm007g/c65ab370b8801faa193249ca30d906c0 to your computer and use it in GitHub Desktop.

贝叶斯定理在检测吸毒者时很有用。假设一个常规的检测结果的敏感度与可靠度均为99%,也就是说,当被检者吸毒时,每次检测呈阳性(+)的概率为99%。而被检者不吸毒时,每次检测呈阴性(-)的概率为99%。

从检测结果的概率来看,检测结果是比较准确的,但是贝叶斯定理却可以揭示一个潜在的问题。

假设某公司将对其全体雇员进行一次鸦片吸食情况的检测,已知0.5%的雇员吸毒。我们想知道,每位医学检测呈阳性的雇员吸毒的概率有多高?

令“D”为雇员吸毒事件,“N”为雇员不吸毒事件,“+”为检测呈阳性事件。

可得:

  • P(D)代表雇员吸毒的概率,不考虑其他情况,该值为0.005。因为公司的预先统计表明该公司的雇员中有0.5%的人吸食毒品,所以这个值就是D的先验概率。
  • P(N)代表雇员不吸毒的概率,显然,该值为0.995,也就是1-P(D)。
  • P(+|D)代表吸毒者阳性检出率,这是一个条件概率,由于阳性检测准确性是99%,因此该值为0.99。
  • P(+|N)代表不吸毒者阳性检出率,也就是出错检测的概率,该值为0.01,因为对于不吸毒者,其检测为阴性的概率为99%,因此,其被误检测成阳性的概率为1-99%。
  • P(+)代表不考虑其他因素的影响的阳性检出率。该值为0.0149或者1.49%。我们可以通过全概率公式计算得到:此概率 = 吸毒者阳性检出率(0.5% x 99% = 0.00495)+ 不吸毒者阳性检出率(99.5% x 1% = 0.00995)。P(+)=0.0149是检测呈阳性的先验概率。

根据上述描述,我们可以计算某人检测呈阳性时确实吸毒的条件概率P(D|+):

  • P(D|+) = P(+|D)P(D)/(P(+|D)P(D)+P(+|N)P(N))=0.99 *0.005/0.0149=0.332215

由上可得出如下结论:如果某人检测呈阳性,那么此人是吸毒的概率只有 33.22% !。 即:尽管检测设备准确度很高可达99%,但在人群比率极小的情况下,可能带来检测结果置信度不高的问题。 我们测试的条件(本例中指D,雇员吸毒)越难发生,发生误判的可能性越大。

如何解决这个问题?重新测第二次!这时候人群比率显著提升,置信度也会显著提升!

很神奇对不对?这就是贝叶斯理论的奇妙之处,世界是概率的可置信的,不是确定的。

@shm007g
Copy link
Author

shm007g commented Nov 2, 2018

第二次检测,假设P(D) = 0.3, 最后P(D|+)=0.97.7。可信度接近100%。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment