在概率论与统计学中,超几何分布是一种离散型的概率分布,它描述了在有限总体中进行不放回抽样时,某事件发生的次数所满足的概率规律。这种分布经常出现在实际问题中,比如从一批产品中抽取若干件来检查是否有次品,或者从一个群体中随机抽取样本以研究某些特征。
为了更好地理解超几何分布,我们首先需要明确几个关键概念:
1. 总体规模:假设总共有 \(N\) 个个体,其中包含 \(K\) 个具有某种特定属性的对象。
2. 样本大小:从中随机抽取 \(n\) 个个体。
3. 成功次数:设 \(X\) 表示在这 \(n\) 个个体中具有该特定属性的个体数量,则 \(X\) 的取值范围为 \(\{0, 1, 2, ..., min(n, K)\}\)。
4. 概率质量函数(PMF):给定上述条件,\(X\) 的概率质量函数可以表示为:
\[
P(X = k) = \frac{{C(K, k) \cdot C(N-K, n-k)}}{C(N, n)}
\]
其中,\(C(a, b)\) 表示组合数,即从 \(a\) 个不同元素中选取 \(b\) 个的方式总数。
超几何分布的特点
- 无放回抽样:与二项分布不同,超几何分布适用于不放回的情况,这意味着每次抽样都会改变剩余样本的状态。
- 依赖性:由于是不放回抽样,每次抽样的结果会影响后续抽样的可能性,因此这些事件之间存在一定的依赖关系。
- 适用场景广泛:无论是产品质量检验、生物医学实验还是社会调查等领域,只要涉及到有限总体中的随机抽样且关注某一属性的数量分布,都可以使用超几何分布建模。
示例应用
假设一家工厂生产的产品总数为 100 件,其中有 10 件是次品。如果随机抽取 5 件产品进行检测,那么抽到的具体次品数量 \(X\) 就服从超几何分布。通过计算相应的概率质量函数,我们可以得知抽到 0 到 5 件次品的概率分别是多少。
总之,超几何分布在处理有限总体内特定属性数量统计方面提供了重要的理论支持。理解和掌握这一概念有助于解决许多现实世界中的复杂问题。


