Explicación
La distribución Bernoulli modela el resultado de un único experimento aleatorio con exactamente dos posibles resultados: éxito (X = 1) con probabilidad p, y fracaso (X = 0) con probabilidad 1 − p. Es la distribución discreta más elemental y sirve de bloque fundamental para construir otras distribuciones: la suma de n ensayos Bernoulli independientes con la misma p da lugar a la distribución binomial. Se aplica siempre que una observación sea de tipo sí/no: un cliente compra o no compra, un componente falla o no falla, un correo es spam o no lo es. Su media es p y su varianza es p(1 − p), que alcanza su máximo en p = 0,5.
Fórmula
\( P(X=k)=p^{k}(1-p)^{1-k},\quad k\in\{0,1\} \)
Parámetros
- p: probabilidad de éxito, con 0 ≤ p ≤ 1.
- x: solo toma los valores 0 (fracaso) o 1 (éxito).
Ejemplo resuelto
Situación: Un sistema de detección de intrusiones analiza cada paquete de red de forma independiente. La probabilidad de que un paquete sea malicioso es \(p = 0{,}7\) en una red bajo ataque. Modelamos la clasificación de un único paquete como un ensayo Bernoulli con \(p = 0{,}7\).
Pregunta 1: ¿Cuál es la probabilidad de que el paquete sea malicioso, \(P(X = 1)\), y cuál es la probabilidad de que sea benigno, \(P(X = 0)\)?
Solución: Directamente de la definición de la distribución de Bernoulli: \[ P(X = 1) = p = 0{,}7 \qquad P(X = 0) = 1 - p = 0{,}3 \] Hay un 70 % de probabilidad de que el paquete sea malicioso y un 30 % de que sea benigno.
Pregunta 2: ¿Cuáles son la esperanza y la varianza de este ensayo individual?
Solución: Para la distribución de Bernoulli con parámetro \(p\): \[ E[X] = p = 0{,}7 \] \[ \text{Var}(X) = p(1-p) = 0{,}7 \times 0{,}3 = 0{,}21 \] La esperanza \(E[X] = 0{,}7\) se interpreta como que, en promedio, el 70 % de los paquetes son maliciosos. La varianza \(\text{Var}(X) = 0{,}21\) mide la incertidumbre de un único ensayo; se maximiza cuando \(p = 0{,}5\).
Interpretación: La Bernoulli es el bloque fundamental de toda la estadística discreta: al repetir \(n\) ensayos independientes idénticos, la suma de los resultados sigue una distribución Binomial(\(n, p\)). En este caso, si se analizan 100 paquetes, el número total de maliciosos seguiría una Binomial(100, 0,7) con media \(100 \times 0{,}7 = 70\) paquetes.