Calculadora
Introduce el cociente U/L máximo tolerable del IC y el nivel de confianza para obtener el tamaño muestral mínimo.
Explicación
El intervalo de confianza para la varianza \(\sigma^2\) utiliza la distribución chi-cuadrado y tiene la forma:
\( \left[\frac{(n-1)s^2}{\chi^2_{1-\alpha/2,\,n-1}},\;\; \frac{(n-1)s^2}{\chi^2_{\alpha/2,\,n-1}}\right] \)
A diferencia de los ICs para medias o proporciones, el ancho absoluto del IC para la varianza depende del valor desconocido de \(\sigma^2\), lo que impide expresar la precisión en unidades absolutas sin conocerla de antemano. La solución natural es especificar la precisión en términos relativos: el cociente \(U/L\) entre el límite superior e inferior del IC.
Este cociente solo depende de los cuantiles de la chi-cuadrado, y por tanto únicamente del tamaño muestral \(n\) y del nivel de confianza. No se necesita ningún supuesto sobre \(\sigma^2\).
Fórmula del cociente U/L
\( \frac{U}{L} = \frac{\chi^2_{1-\alpha/2,\,n-1}}{\chi^2_{\alpha/2,\,n-1}} \)
Para un nivel de confianza y un cociente \(R\) deseado, la calculadora busca el menor \(n\) tal que \(\chi^2_{1-\alpha/2,\,n-1}/\chi^2_{\alpha/2,\,n-1} \leq R\). No existe una fórmula cerrada: el resultado se obtiene por búsqueda iterativa sobre \(n\).
- R cercano a 1: IC muy estrecho → muestra enorme.
- R = 2: el límite superior dobla al inferior → muestra razonable (≈ 65 observaciones al 95 %).
- R = 3: el límite superior triplica al inferior → muestra mucho más pequeña (≈ 28 observaciones al 95 %).
Interpretación del cociente U/L
Un cociente \(R = 2{,}5\) significa que el límite superior del IC puede ser hasta 2,5 veces mayor que el límite inferior. Por ejemplo, si \(s^2 = 4{,}0\), el IC podría ir de 2,5 a 6,25 (una variabilidad de 2,5 a 1 entre los extremos). Cuanto menor sea \(R\), más estrecho y más informativo es el IC, pero más observaciones son necesarias.
Configuración rápida
- Cociente R: R entre 2 y 4 es habitual en estudios de control de calidad y procesos. R muy cercano a 1 requiere muestras prohibitivamente grandes.
- Nivel de confianza: 95 % es el estándar. Con 99 % el n necesario es significativamente mayor para el mismo R.
- Normalidad: asegúrate de que los datos sean compatibles con normalidad; el IC chi-cuadrado es muy sensible a este supuesto.
- Pérdidas esperadas: divide n entre (1 − tasa de pérdida) para obtener el número de sujetos a reclutar.
Ejemplo resuelto
Un laboratorio de metrología quiere estimar la varianza del error de medición de un instrumento para validar su calibración. Se establece que el IC al 95 % debe tener un cociente U/L no mayor que \(R = 2{,}5\) (el límite superior no puede ser más de 2,5 veces el inferior).
La calculadora busca el menor \(n\) tal que \(\chi^2_{0{,}975,\,n-1} / \chi^2_{0{,}025,\,n-1} \leq 2{,}5\). Para \(n = 39\) (gl = 38): \(\chi^2_{0{,}975,38} \approx 56{,}90\) y \(\chi^2_{0{,}025,38} \approx 22{,}88\), cociente \(\approx 2{,}49 \leq 2{,}5\). Para \(n = 38\): cociente \(\approx 2{,}52 > 2{,}5\). Resultado: \(n = 39\) observaciones.
Con esas 39 mediciones, si \(s = 0{,}12\) mm (varianza \(s^2 = 0{,}0144\) mm²), el IC al 95 % sería aproximadamente \([0{,}0144/2{,}49 \times r, \; 0{,}0144 \times r/1]\)... más precisamente, usando los cuantiles exactos: \([(38 \times 0{,}0144)/56{,}90,\; (38 \times 0{,}0144)/22{,}88] = [0{,}0096,\; 0{,}0239]\) mm². El cociente U/L real es \(0{,}0239/0{,}0096 \approx 2{,}49\).
Análisis de sensibilidad: si el laboratorio acepta \(R = 3\) (el límite superior puede triplicar al inferior), la muestra se reduce a \(n = 28\). Con \(R = 2\) la muestra sube a \(n \approx 65\). La elección de \(R\) tiene un impacto muy grande en el n necesario.
Usos frecuentes
- Control estadístico de procesos (SPC): estimación de la varianza del proceso para cartas de control.
- Validación de instrumentos de medición y estudios de reproducibilidad.
- Diseño de experimentos donde la variabilidad es la variable de interés principal.
- Auditoría de procesos productivos donde se necesita caracterizar la dispersión.
Supuestos del modelo
- La variable de interés sigue una distribución normal. El IC chi-cuadrado para la varianza es muy sensible a la no normalidad, más que cualquier IC para la media.
- Las observaciones son independientes entre sí.
- El cociente U/L objetivo debe ser mayor que 1; la búsqueda iterativa parte de \(n = 2\).
Cómo interpretar el resultado
El valor \(n\) garantiza que el intervalo de confianza para \(\sigma^2\) basado en la distribución chi-cuadrado tendrá un cociente entre el límite superior e inferior no mayor que el valor \(R\) especificado, con el nivel de confianza elegido. Esto asegura una precisión relativa: el límite superior del IC no superará \(R\) veces el límite inferior. Redondea siempre hacia arriba. Si prevés pérdidas o exclusiones durante la recogida, divide \(n\) entre \((1 - \text{tasa de pérdida})\); con un 10 % de pérdida, recluta \(\lceil n / 0{,}90 \rceil\) unidades.
El supuesto más crítico y delicado de este método es la normalidad de los datos: el IC chi-cuadrado para \(\sigma^2\) es muy sensible a desviaciones de la normalidad, mucho más que el IC para la media. Con distribuciones asimétricas o de colas pesadas, el IC real puede tener una cobertura muy inferior al nivel nominal (p. ej., un IC del 95 % puede cubrir el verdadero \(\sigma^2\) solo el 85 % de las veces). Antes de aplicar este resultado, verifica la normalidad con el test de Shapiro-Wilk o mediante Q-Q plots. La sensibilidad a \(R\): exigir un cociente \(R = 2\) (IC estrecho) requiere muchos más sujetos que \(R = 4\) (IC amplio); incrementar \(R\) en un 50 % puede reducir \(n\) a la mitad.
Si el \(n\) calculado es inviable, las alternativas son: (1) aceptar un cociente \(R\) mayor (IC más amplio), (2) reducir el nivel de confianza (p. ej., de 99 % a 95 %), o (3) si los datos no son normales, utilizar métodos de bootstrap para construir el IC de \(\sigma^2\) sin depender de la distribución chi-cuadrado. Una vez recogidos los datos, construye el IC real con la calculadora de IC para la varianza; si también quieres contrastar \(\sigma^2\) frente a un valor de referencia, usa la calculadora de tamaño muestral para contraste de una varianza.
Referencias y lecturas adicionales
- Zar, J. H. (2010). Biostatistical Analysis (5.ª ed.). Pearson. — cálculo de tamaño muestral para varianza.
- Montgomery, D. C. (2019). Introduction to Statistical Quality Control (8.ª ed.). Wiley. — aplicaciones en SPC.
- Wikipedia (en): Chi-squared distribution — propiedades y percentiles.
Preguntas frecuentes
- ¿Por qué necesito tanta muestra para un IC de varianza estrecho? Porque la distribución chi-cuadrado converge lentamente a la simetría. Con pocos grados de libertad, los cuantiles extremos están muy separados, produciendo ICs muy asimétricos y amplios.
- ¿Qué pasa si los datos no son normales? El IC chi-cuadrado puede tener una cobertura real muy distinta del nivel de confianza nominal. Aplica primero un test de normalidad (Shapiro-Wilk) y, si los datos no son normales, considera transformaciones o métodos bootstrap.
- ¿Puedo usar este resultado si quiero estimar σ en lugar de σ²? Sí. El IC para σ se obtiene aplicando raíz cuadrada a cada límite del IC de σ², y el cociente U/L es el mismo.