Explicación
La distribución hipergeométrica modela el número de éxitos en una muestra extraída sin reemplazo de una población finita. A diferencia de la binomial, que asume extracción con reemplazo (probabilidad constante en cada intento), la hipergeométrica tiene en cuenta que cada extracción modifica la composición del grupo restante, lo que hace que los ensayos no sean independientes. Cuando la población es muy grande en comparación con la muestra (N ≫ n), la hipergeométrica se aproxima bien a la binomial con p = K/N. Su media es n·K/N y su varianza es n·(K/N)·(1 − K/N)·(N − n)/(N − 1), donde el factor (N − n)/(N − 1) es la corrección por población finita que reduce la varianza respecto a la binomial.
Fórmula
\( P(X=x)=\frac{\binom{K}{x}\binom{N-K}{n-x}}{\binom{N}{n}} \)
Parámetros
- N: tamaño total de la población (número entero positivo).
- K: número de elementos de interés (éxitos) en la población. Debe cumplir 0 ≤ K ≤ N.
- n: tamaño de la muestra extraída sin reemplazo. Debe cumplir 0 ≤ n ≤ N.
Ejemplo resuelto
Situación: Un inspector de calidad audita un lote de \(N = 50\) unidades, de las cuales \(K = 10\) son defectuosas. Extrae sin reposición una muestra de \(n = 8\) unidades. Sea \(X\) el número de unidades defectuosas en la muestra; \(X \sim \text{Hipergeométrica}(50, 10, 8)\).
Pregunta 1: ¿Cuál es la probabilidad de encontrar exactamente 2 defectuosas en la muestra, \(P(X = 2)\)?
Solución: Aplicamos la PMF de la distribución hipergeométrica: \[ P(X = 2) = \frac{\binom{K}{k}\binom{N-K}{n-k}}{\binom{N}{n}} = \frac{\binom{10}{2}\binom{40}{6}}{\binom{50}{8}} \] Calculamos: \(\binom{10}{2} = 45\), \(\binom{40}{6} = 3\,838\,380\), \(\binom{50}{8} = 536\,878\,650\): \[ P(X = 2) = \frac{45 \times 3\,838\,380}{536\,878\,650} \approx \frac{172\,727\,100}{536\,878\,650} \approx 0{,}2936 \] Hay aproximadamente un 29,36 % de probabilidad de encontrar exactamente 2 defectuosas.
Pregunta 2: ¿Cuál es el número esperado de defectuosas en la muestra, \(E[X]\)?
Solución: La media de la hipergeométrica es: \[ E[X] = n \cdot \frac{K}{N} = 8 \times \frac{10}{50} = 8 \times 0{,}2 = 1{,}6 \text{ unidades} \] Se esperan en promedio 1,6 unidades defectuosas en cada muestra de 8.
Interpretación: A diferencia de la binomial (muestreo con reposición), la hipergeométrica refleja que cada extracción modifica las proporciones restantes. Con solo el 20 % de defectuosas en el lote (\(K/N = 0{,}2\)), el valor más probable en la muestra es 1 o 2 defectuosas, y la probabilidad de encontrar 4 o más es muy baja, lo que permite diseñar planes de muestreo de aceptación eficientes.