Calculadora
Introduce la desviación estándar muestral y el tamaño de muestra para obtener los intervalos de varianza y desviación típica.
Explicación
Mientras los intervalos para la media usan la distribución normal o t (que son simétricas), el intervalo para la varianza usa la distribución chi-cuadrado, que es asimétrica y positiva. Por eso los límites del intervalo no están equidistantes del estimador puntual \(s^2\).
Este intervalo es fundamental en control de procesos (SPC), donde importa no solo la media de un proceso sino también su variabilidad. También aparece en metaanálisis, diseño de experimentos y auditoría de procesos de medición.
Fórmula para la varianza
Denotamos por \(C\) el nivel de confianza y por \(\alpha=1-C\) el área total fuera del intervalo. Para un 95 % de confianza, \(C=0{,}95\), \(\alpha=0{,}05\) y \(\alpha/2=0{,}025\) en cada cola.
\( \left[\dfrac{(n-1)s^2}{\chi^2_{\alpha/2,\, n-1}},\;\; \dfrac{(n-1)s^2}{\chi^2_{1-\alpha/2,\, n-1}}\right] \)
- \(s^2\): varianza muestral (con divisor \(n-1\)).
- \(n\): tamaño de la muestra.
- \(\chi^2_{\alpha/2,\, n-1}\): percentil superior de la chi-cuadrado (cola derecha).
- \(\chi^2_{1-\alpha/2,\, n-1}\): percentil inferior de la chi-cuadrado (cola izquierda).
Fórmula para la desviación típica
\( \left[\sqrt{\dfrac{(n-1)s^2}{\chi^2_{\alpha/2,\, n-1}}},\;\; \sqrt{\dfrac{(n-1)s^2}{\chi^2_{1-\alpha/2,\, n-1}}}\right] \)
Se obtiene aplicando raíz cuadrada a cada extremo del IC de la varianza.
Ejemplo resuelto
Una línea de envasado llena botellas con \(s = 2{,}3\) ml a partir de \(n = 25\) mediciones. Con 95 % de confianza (\(C=0{,}95\), \(\alpha=0{,}05\), \(gl = 24\), \(\chi^2_{0,025} \approx 39{,}36\), \(\chi^2_{0,975} \approx 12{,}40\)):
\( \sigma^2 \in \left[\frac{24 \cdot 5{,}29}{39{,}36},\;\frac{24 \cdot 5{,}29}{12{,}40}\right] \approx [3{,}23,\; 10{,}24] \text{ ml}^2 \)
\( \sigma \in [1{,}80,\; 3{,}20] \text{ ml} \)
Supuestos del intervalo chi-cuadrado
Este intervalo asume que la variable subyacente sigue una distribución normal. A diferencia del IC para la media, el IC para la varianza no está protegido por el teorema central del límite: es muy sensible a desviaciones de la normalidad. Si los datos no son normales, considera transformaciones o métodos robustos.
Cómo interpretar el resultado
El intervalo para \(\sigma^2\) es el rango de valores de la varianza poblacional compatibles con los datos al nivel de confianza elegido. El intervalo para \(\sigma\) expresa la misma incertidumbre en las unidades originales de la variable: se obtiene simplemente aplicando la raíz cuadrada a cada límite. En términos frecuentistas, si repitieras el experimento muchas veces y construyeras el IC con el mismo método, una proporción \(C\) de esos intervalos contendría la verdadera varianza \(\sigma^2\). La distribución chi-cuadrado es asimétrica y solo toma valores positivos, por eso el intervalo no es simétrico: el límite superior está más alejado de \(s^2\) que el límite inferior.
En el gráfico, la región verde bajo la curva chi-cuadrado es la zona de confianza y las colas rojas (cada una con área \(\alpha/2\)) indican los percentiles inferior \(\chi^2_{\alpha/2,\,n-1}\) y superior \(\chi^2_{1-\alpha/2,\,n-1}\). Cuanto mayor sea \(n\), más simétrica y concentrada será la distribución chi-cuadrado y, en consecuencia, el intervalo será más estrecho y más próximo a la simetría.
- Amplitud e incertidumbre: un intervalo muy ancho refleja alta incertidumbre sobre la variabilidad real del proceso, habitualmente debida a un tamaño muestral pequeño. Con muestras grandes, el IC se estrecha considerablemente.
- Límite superior en control de calidad: si el objetivo es controlar la dispersión de un proceso, el límite superior \(U(\sigma^2)\) es el valor más relevante; superar un valor de especificación con ese límite indica que la variabilidad puede exceder lo tolerado incluso con los datos actuales.
- Conexión con el contraste: si un valor de referencia \(\sigma_0^2\) queda fuera del intervalo, los datos rechazarían \(H_0\!: \sigma^2 = \sigma_0^2\) al nivel \(\alpha = 1 - C\) en el contraste chi-cuadrado bilateral equivalente. Si \(\sigma_0^2\) está dentro del intervalo, no hay evidencia para rechazarlo.
Preguntas frecuentes
- ¿Por qué el intervalo no es simétrico respecto a s²? Porque la distribución chi-cuadrado es asimétrica; los percentiles superior e inferior no están equidistantes del centro.
- ¿Puedo usar este IC si los datos no son normales? No es recomendable; el intervalo chi-cuadrado es muy sensible a la no normalidad. Usa tests de normalidad primero.
- ¿Qué pasa si n es muy pequeño? El intervalo será muy amplio, reflejando la alta incertidumbre con pocas observaciones.