Calculadora

Distribución Hipergeométrica

Calcula PMF, CDF y cuantiles hipergeométricos para muestreo sin reemplazo.

Configuración

Calculadora enfocada en esta distribución.

Resultado y visualización

Calcula PDF/PMF, CDF y percentiles al instante.

Resultado pendiente…

Explicación

La distribución hipergeométrica modela el número de éxitos en una muestra extraída sin reemplazo de una población finita. A diferencia de la binomial, que asume extracción con reemplazo (probabilidad constante en cada intento), la hipergeométrica tiene en cuenta que cada extracción modifica la composición del grupo restante, lo que hace que los ensayos no sean independientes. Cuando la población es muy grande en comparación con la muestra (N ≫ n), la hipergeométrica se aproxima bien a la binomial con p = K/N. Su media es n·K/N y su varianza es n·(K/N)·(1 − K/N)·(N − n)/(N − 1), donde el factor (N − n)/(N − 1) es la corrección por población finita que reduce la varianza respecto a la binomial.

Fórmula

\( P(X=x)=\frac{\binom{K}{x}\binom{N-K}{n-x}}{\binom{N}{n}} \)

Parámetros

  • N: tamaño total de la población (número entero positivo).
  • K: número de elementos de interés (éxitos) en la población. Debe cumplir 0 ≤ K ≤ N.
  • n: tamaño de la muestra extraída sin reemplazo. Debe cumplir 0 ≤ n ≤ N.

Ejemplo resuelto

Situación: Un inspector de calidad audita un lote de \(N = 50\) unidades, de las cuales \(K = 10\) son defectuosas. Extrae sin reposición una muestra de \(n = 8\) unidades. Sea \(X\) el número de unidades defectuosas en la muestra; \(X \sim \text{Hipergeométrica}(50, 10, 8)\).

Pregunta 1: ¿Cuál es la probabilidad de encontrar exactamente 2 defectuosas en la muestra, \(P(X = 2)\)?

Solución: Aplicamos la PMF de la distribución hipergeométrica: \[ P(X = 2) = \frac{\binom{K}{k}\binom{N-K}{n-k}}{\binom{N}{n}} = \frac{\binom{10}{2}\binom{40}{6}}{\binom{50}{8}} \] Calculamos: \(\binom{10}{2} = 45\), \(\binom{40}{6} = 3\,838\,380\), \(\binom{50}{8} = 536\,878\,650\): \[ P(X = 2) = \frac{45 \times 3\,838\,380}{536\,878\,650} \approx \frac{172\,727\,100}{536\,878\,650} \approx 0{,}2936 \] Hay aproximadamente un 29,36 % de probabilidad de encontrar exactamente 2 defectuosas.

Pregunta 2: ¿Cuál es el número esperado de defectuosas en la muestra, \(E[X]\)?

Solución: La media de la hipergeométrica es: \[ E[X] = n \cdot \frac{K}{N} = 8 \times \frac{10}{50} = 8 \times 0{,}2 = 1{,}6 \text{ unidades} \] Se esperan en promedio 1,6 unidades defectuosas en cada muestra de 8.

Interpretación: A diferencia de la binomial (muestreo con reposición), la hipergeométrica refleja que cada extracción modifica las proporciones restantes. Con solo el 20 % de defectuosas en el lote (\(K/N = 0{,}2\)), el valor más probable en la muestra es 1 o 2 defectuosas, y la probabilidad de encontrar 4 o más es muy baja, lo que permite diseñar planes de muestreo de aceptación eficientes.

Cómo interpretar el resultado

La calculadora ofrece tres tipos de salida. La PMF, \( P(X = k) \), da la probabilidad de extraer exactamente \( k \) elementos de la clase de interés en una muestra de tamaño \( n \) tomada sin reemplazo de una población de tamaño \( N \) con \( K \) elementos de esa clase. A diferencia de la binomial, la distribución hipergeométrica tiene soporte acotado: \( k \) solo puede tomar valores entre \( \max(0, n+K-N) \) y \( \min(n, K) \). En la gráfica, las barras verticales muestran la probabilidad de cada conteo posible dentro de ese rango; el eje horizontal refleja exactamente los valores factibles.

La CDF, \( P(X \leq k) \), acumula las probabilidades desde el mínimo hasta \( k \). En control de calidad, si una partida contiene \( K \) unidades defectuosas entre \( N \) totales y se inspecciona una muestra de \( n \), entonces \( P(X \leq c) \) es la probabilidad de aceptar la partida con un plan de aceptación de número de aceptación \( c \). La cola derecha \( P(X > k) \) mide la probabilidad de detectar más de \( k \) defectos, lo que puede usarse como criterio de rechazo del lote. El área verde en la gráfica visualiza la probabilidad acumulada del rango seleccionado.

El resultado de percentil devuelve el menor entero \( k \) tal que \( P(X \leq k) \geq p \). Esto permite diseñar planes de muestreo: si quieres garantizar con un 90 % de probabilidad no encontrar más de \( k \) defectos en una partida con tasa de defectos dada, el percentil 90 te da ese valor de corte directamente. También es útil para evaluar la rareza de observaciones en auditorías y estudios epidemiológicos con poblaciones finitas pequeñas.

Preguntas frecuentes

  • ¿Qué significa P(X ≤ x)? Es la probabilidad acumulada hasta el valor x.
  • ¿Qué diferencia hay entre cola izquierda y derecha? La cola izquierda acumula hasta x, la derecha mide desde x hacia valores mayores.
  • ¿Qué es un percentil? Es el valor de la variable que deja por debajo una probabilidad acumulada concreta.

Referencia: Distribución hipergeométrica — Wikipedia