1. 回顾超几何分布的定义
一般地,假设共有N件产品,其中M件次品,现在从中抽取n件做检查,抽到k件次品的概率分布服从超几何分布。
数学表达式如下:
2. 超几何分布的一个应用:求解overlap显著性
- 以一个实际的生物实验为例。
在上述实验中,我们假设总共的基因个数为20000个(假定为产品的总数),图中左边圈的总数为2005(1740+265)个(假定为次品的总个数),现从中抽取805(540+265)个,需要计算得到基因的个数(次品数量)大于等于265的概率。
思考过程:在次品个数是少数的情况下,overlap越高,从超几何分布来看,发生的概率越小。现在的overlap是265,可能会是过高的那种情况,那么现在计算overlap是265以及大于265的概率之和,如果这个概率很小,那就说明发生265这个事件不是随机的&#
更多推荐
overlap的显著性检验-超几何检验/Fisher`s 检验
发布评论