Parámetros de simulación
Distribución original
Histograma de la distribución base con curva de densidad teórica
Distribución de la media muestral
Histograma de las medias muestrales con curva normal teórica N(μ, σ²/n)
¿Qué establece el teorema central del límite?
El teorema central del límite (TCL) es uno de los resultados fundamentales de la estadística matemática. Establece que, bajo condiciones generales, la distribución de la suma (o la media) de un gran número de variables aleatorias independientes e idénticamente distribuidas (i.i.d.) tiende a la distribución normal, independientemente de la distribución original de las variables.
Formalmente, sean \(X_1, X_2, \ldots, X_n\) variables aleatorias i.i.d. con media \(\mu\) y varianza finita \(\sigma^2 < \infty\). Entonces la media muestral \(\bar{X}_n = \frac{1}{n}\sum_{i=1}^{n} X_i\) satisface:
Equivalentemente, \(\bar{X}_n \approx \mathcal{N}\!\left(\mu,\, \frac{\sigma^2}{n}\right)\) para \(n\) suficientemente grande. La velocidad de convergencia depende de la asimetría (skewness) de la distribución original: cuanto más simétrica y «bien portada» sea la distribución, más rápido converge la media muestral a la normal. El teorema de Berry-Esseen cuantifica esta velocidad con una cota uniforme del error de aproximación:
donde \(\rho = \mathbb{E}[|X-\mu|^3]\) es el tercer momento absoluto centrado y \(C \approx 0.4748\). Esto implica que distribuciones con mayor asimetría requieren muestras más grandes para que la aproximación normal sea precisa.
¿Para qué tamaño n se cumple el TCL?
No existe un umbral único: la velocidad de convergencia depende de la distribución de origen. Como guía práctica:
- Distribuciones simétricas (Normal, Uniforme): con \(n = 2\) a \(5\) ya se obtiene una distribución de la media prácticamente normal. La Normal es, trivialmente, exacta para cualquier \(n\).
- Distribuciones moderadamente asimétricas (Exponencial, Poisson): la regla empírica habitual de \(n \geq 30\) suele ser suficiente. Con la exponencial (\(\text{coef. asimetría} = 2\)) ya con \(n = 30\) la aproximación es muy buena.
- Distribuciones discretas acotadas (Bernoulli): con probabilidades cercanas a 0 o 1 la asimetría es alta, pero al ser acotada la convergencia es relativamente rápida. Con \(n = 30\) la aproximación es excelente.
- Distribuciones de cola pesada (Chi-cuadrado con pocos grados de libertad): la asimetría es más pronunciada y puede requerirse \(n \geq 50\) para una aproximación satisfactoria.
- Distribuciones sin varianza finita (Cauchy): el TCL no se aplica en su forma estándar, pues la varianza no existe. En estos casos la ley de los grandes números tampoco converge.
La regla práctica \(n \geq 30\) que aparece en muchos libros de texto es una heurística conservadora válida para las distribuciones habituales en ciencias aplicadas. Sin embargo, para distribuciones muy sesgadas o con colas muy pesadas puede ser insuficiente.
Implicaciones prácticas del TCL
El TCL tiene consecuencias de largo alcance en la estadística aplicada:
- Justifica el uso de contrastes z y t: los test de medias (z-test, t-test) asumen que la media muestral sigue una distribución normal. Gracias al TCL, esto es válido incluso cuando los datos individuales no son normales, siempre que \(n\) sea suficientemente grande.
- Intervalos de confianza: la construcción de intervalos de confianza para la media poblacional se apoya directamente en el TCL, haciendo que \(\bar{X} \pm z_{\alpha/2}\,\sigma/\sqrt{n}\) sea una aproximación válida con independencia de la distribución original.
- Ubicuidad de la distribución normal: muchos fenómenos naturales y sociales son el resultado de la acumulación de muchos efectos independientes pequeños (errores de medida, variaciones genéticas, fluctuaciones económicas…), lo que explica por qué la distribución normal aparece con tanta frecuencia en la naturaleza.
- Extensión a sumas: dado que \(S_n = n\bar{X}_n\), el TCL se aplica igualmente a la suma de variables i.i.d.: \((S_n - n\mu)/(\sigma\sqrt{n}) \xrightarrow{d} \mathcal{N}(0,1)\). Esto es la base de la aproximación normal a la binomial.
- Diseño de experimentos y remuestreo: el TCL sustenta técnicas como el bootstrap y el análisis de potencia, al garantizar que los estadísticos basados en medias tienen distribuciones asintóticamente normales.
Preguntas frecuentes
¿El TCL dice que los datos individuales se distribuyen normal?
No. El TCL establece que la media muestral \(\bar{X}_n\) converge a una distribución normal cuando \(n \to \infty\). Los datos individuales \(X_i\) pueden seguir cualquier distribución con media y varianza finitas: exponencial, Bernoulli, Poisson, etc. Confundir la distribución de los datos con la distribución del estadístico es uno de los errores más frecuentes al interpretar el TCL.
¿Por qué la distribución de Bernoulli con n=30 parece tan normal?
La distribución de Bernoulli con \(p = 0.3\) tiene asimetría positiva finita (\(\gamma_1 = (1-2p)/\sqrt{p(1-p)} \approx 0.873\)). Aunque no es simétrica, al ser una variable acotada entre 0 y 1 todos sus momentos existen y son finitos. Esto hace que la convergencia en el TCL sea relativamente rápida. El efecto de promediado sobre \(n = 30\) variables independientes es suficientemente fuerte como para que el histograma de las medias luzca prácticamente normal. Con \(p\) más extremo (cercano a 0 o a 1) se necesitarían valores mayores de \(n\).
¿Qué pasa con distribuciones de cola muy pesada?
Si la varianza de la distribución es infinita, el TCL estándar no se aplica. El ejemplo más conocido es la distribución de Cauchy, cuya función de densidad es \(f(x) = 1/[\pi(1+x^2)]\). La Cauchy no tiene media ni varianza finitas, y la media muestral de \(n\) observaciones Cauchy independientes tiene exactamente la misma distribución Cauchy que una sola observación: no converge a la normal con ningún \(n\). Para estas distribuciones existe la versión generalizada del TCL basada en distribuciones \(\alpha\)-estables (Lévy), pero está fuera del alcance del uso estadístico habitual.
¿Necesito que las variables sean idénticamente distribuidas?
La versión clásica del TCL requiere variables i.i.d. (independientes e idénticamente distribuidas). Sin embargo, existen extensiones más generales: el teorema de Lindeberg-Lévy relaja la condición de distribución idéntica y solo requiere que ninguna variable individual domine la suma (condición de Lindeberg). Esta extensión es clave en econometría y en el análisis de series temporales.
¿Cómo afecta el tamaño de muestra a la varianza de la media muestral?
La varianza de la media muestral es exactamente \(\text{Var}(\bar{X}_n) = \sigma^2/n\), por lo que la desviación típica (\(= \sigma/\sqrt{n}\), también llamada error estándar) se reduce con la raíz cuadrada del tamaño muestral. Duplicar el tamaño de la muestra reduce el error estándar por un factor de \(\sqrt{2} \approx 1.41\). Para reducir el error estándar a la mitad, hay que cuadruplicar el tamaño muestral. Esta relación es visible en los histogramas del simulador: a mayor \(n\), la campana de la media muestral se hace más estrecha.