Parámetros de simulación
Muestra original
Histograma de la muestra con curva de densidad teórica
Distribución bootstrap del estadístico
Histograma de las B réplicas con el IC sombreado
¿Qué es el bootstrap?
El bootstrap es una técnica de remuestreo propuesta por Bradley Efron en 1979. Su nombre proviene de la expresión inglesa «pull yourself up by your own bootstraps» (literalmente «tirarte de tus propios cordones de las botas»), que hace referencia a la idea de obtener información sobre la variabilidad de un estimador utilizando únicamente los datos de la propia muestra, sin necesidad de conocer la distribución poblacional.
La intuición central es sencilla: si no conocemos la distribución poblacional \(F\), podemos usar la distribución empírica \(\hat{F}_n\) — que asigna probabilidad \(1/n\) a cada observación de la muestra — como sustituto. Si extraemos muchas muestras bootstrap de \(\hat{F}_n\) (es decir, con reemplazamiento de la muestra original) y calculamos el estadístico de interés en cada una, la variabilidad de esas réplicas aproxima la variabilidad del estimador real.
Formalmente, sea \(\hat{\theta} = T(X_1,\ldots,X_n)\) un estimador de \(\theta\). Cada réplica bootstrap \(\hat{\theta}^* = T(X_1^*,\ldots,X_n^*)\) se calcula sobre una muestra \((X_1^*,\ldots,X_n^*)\) extraída con reemplazamiento de la muestra original. La distribución de \(\hat{\theta}^* - \hat{\theta}\) aproxima la distribución de \(\hat{\theta} - \theta\).
donde \(\bar{\hat{\theta}}^* = \frac{1}{B}\sum_{b=1}^{B}\hat{\theta}^{*(b)}\) es la media de las réplicas bootstrap.
Cómo funciona el remuestreo
El algoritmo bootstrap no paramétrico sigue estos pasos:
- Toma la muestra original \(\mathbf{x} = (x_1, \ldots, x_n)\) de tamaño \(n\).
- Genera \(B\) muestras bootstrap \(\mathbf{x}^{*(1)}, \ldots, \mathbf{x}^{*(B)}\), cada una de tamaño \(n\), extrayendo con reemplazamiento de \(\mathbf{x}\). En cada réplica algunos valores originales aparecerán varias veces y otros no aparecerán (en promedio, aproximadamente \(1 - e^{-1} \approx 63.2\,\%\) de los valores originales están representados en cada réplica).
- Calcula el estadístico de interés \(\hat{\theta}^{*(b)} = T(\mathbf{x}^{*(b)})\) en cada réplica \(b = 1, \ldots, B\).
- Estima el error estándar como la desviación típica de las \(B\) réplicas (fórmula anterior).
- Construye el IC percentil al \((1-\alpha) \times 100\,\%\) como el intervalo entre los percentiles \(\alpha/2\) y \(1-\alpha/2\) de la distribución bootstrap:
El método percentil es el más sencillo y el que implementa este simulador. Para muestras pequeñas o estimadores sesgados, métodos más sofisticados como BCa (bias-corrected and accelerated) ofrecen mejor cobertura. En la práctica, \(B = 1000\) réplicas es suficiente para estimar el error estándar y construir intervalos de confianza con buena precisión; \(B = 5000\) proporciona mayor estabilidad en los percentiles extremos.
Cuándo usar el bootstrap
El bootstrap es especialmente útil cuando los métodos paramétricos clásicos no son directamente aplicables o sus supuestos no se cumplen:
- Muestras pequeñas con distribución desconocida: los métodos clásicos requieren normalidad o tamaños muestrales grandes para que el TCL garantice la aproximación. El bootstrap funciona razonablemente bien desde \(n \approx 15\text{–}20\), aunque la incertidumbre inherente de la muestra pequeña persiste.
- Estadísticos complejos: la mediana, la correlación de Pearson, el coeficiente de variación, los coeficientes de regresión en modelos no lineales o el estadístico de Kolmogorov-Smirnov no tienen expresiones analíticas sencillas para su error estándar. El bootstrap las evita.
- Datos no normales: si la distribución de los datos tiene colas pesadas o asimetría marcada, el intervalo de confianza clásico \(\bar{x} \pm z \cdot s/\sqrt{n}\) puede tener cobertura inferior a la nominal. El bootstrap percentil captura la asimetría de la distribución del estimador.
- Comparación con el IC paramétrico: para la media con datos normales y \(n\) grande, el IC bootstrap percentil y el IC clásico \(t\) son prácticamente idénticos. Las diferencias aparecen en distribuciones asimétricas o para estadísticos distintos de la media.
Limitaciones: el bootstrap no funciona bien con estadísticos que dependen de valores extremos (máximo, mínimo) en distribuciones con soporte acotado, ni con datos con dependencia temporal fuerte (para esto existe el block bootstrap). Tampoco «crea» información: si la muestra original es pequeña y poco representativa, el bootstrap solo puede distribuir la incertidumbre existente.
Preguntas frecuentes
¿El bootstrap siempre funciona?
No siempre. El bootstrap no paramétrico falla cuando el estadístico es sensible a los valores extremos de la distribución empírica. Un ejemplo clásico es el máximo de una muestra uniforme: la distribución bootstrap del máximo subestima sistemáticamente el parámetro. También falla con tamaños muestrales muy pequeños (\(n \leq 5\)), donde la distribución empírica es demasiado discreta para aproximar bien la distribución real. En esos casos es preferible recurrir a métodos bayesianos o a intervalos exactos.
¿Qué es el método BCa?
El método BCa (Bias-Corrected and Accelerated), también propuesto por Efron, corrige dos deficiencias del método percentil simple: el sesgo del estimador (diferencia entre \(\bar{\hat{\theta}}^*\) y \(\hat{\theta}\)) y la aceleración (variación del error estándar con el valor del parámetro). Los percentiles del IC se desplazan según estas correcciones, lo que mejora la cobertura real para estimadores sesgados o cuando la escala de la distribución del estimador no es constante. La aceleración se calcula habitualmente mediante el método del jackknife. Para la mayoría de aplicaciones prácticas con \(n \geq 30\) el BCa y el percentil dan resultados similares.
¿Cuántas réplicas B necesito?
Para estimar el error estándar bootstrap, \(B = 200\text{–}500\) réplicas suele ser suficiente. Para construir intervalos de confianza percentiles al 95 %, se recomienda \(B \geq 1000\). Para percentiles extremos (99 % o 99,9 %) o para el método BCa, se aconseja \(B = 5000\text{–}10\,000\). Más allá de \(B = 10\,000\), la ganancia de precisión es marginal y el coste computacional puede ser elevado con conjuntos de datos grandes. La variabilidad del IC bootstrap disminuye aproximadamente como \(1/\sqrt{B}\), análogamente al error de Monte Carlo.
¿Cuál es la diferencia entre bootstrap y jackknife?
El jackknife (Quenouille, 1949; popularizado por Tukey) es otra técnica de remuestreo que estima el sesgo y el error estándar de un estimador dejando fuera sistemáticamente una observación a la vez: genera exactamente \(n\) réplicas «leave-one-out». Es más rápido para datasets grandes pero menos general que el bootstrap. No captura bien la distribución completa del estimador ni sirve para construir IC percentiles. El bootstrap, por su aleatoriedad, requiere \(B \gg n\) réplicas para ser estable pero puede estimar la forma entera de la distribución del estimador y manejar estadísticos más complejos. El jackknife de primer orden es una linealización del bootstrap y converge a él cuando \(B \to \infty\).