¿Qué significa R en el contraste de dos varianzas?

R = σ1/σ2 es la razón entre las desviaciones estándar reales de los dos grupos bajo la hipótesis alternativa. R=1,5 indica que el grupo 1 tiene un 50 % más de dispersión que el grupo 2.

¿Qué distribución utiliza el test F de varianzas?

El estadístico F = S1²/S2² sigue una distribución F(n-1, n-1) bajo H0. Bajo la alternativa R≠1, F/R² sigue una F(n-1, n-1) central, lo que permite calcular la potencia exacta sin distribuciones no centrales.

¿Por qué se asume el mismo tamaño en ambos grupos?

La calculadora asume grupos iguales por simetría (n1=n2=n), que es el diseño más eficiente para este contraste bilateral. El resultado n es el tamaño de cada grupo.

¿Qué supuestos requiere el test F de varianzas?

Normalidad en ambas poblaciones e independencia de las muestras. El test F de varianzas es especialmente sensible a la no normalidad; incluso pequeñas desviaciones pueden inflar la tasa de error tipo I.

Tamaño muestral dos varianzas

Calculadora

Introduce la razón R = σ₁/σ₂, el nivel de significación y la potencia deseada. Se asume el mismo tamaño en ambos grupos (n₁ = n₂ = n).

Razón R = σ₁/σ₂

Alfa (α)

Potencia (1-β)

Resultado pendiente…

Explicación

El test F de Snedecor-Fisher contrasta la igualdad de varianzas de dos poblaciones normales independientes mediante el estadístico \(F = S_1^2/S_2^2\), que bajo \(H_0\) sigue una distribución \(F(n_1-1, n_2-1)\).

Bajo la alternativa \(\sigma_1 = R \cdot \sigma_2\) con \(R \neq 1\), se tiene que \(F/R^2 \sim F(n_1-1, n_2-1)\), lo que permite calcular la potencia exacta sin necesidad de distribuciones F no centrales. La calculadora busca el menor \(n\) (por grupo) para que la potencia exacta bilateral alcance el objetivo.

Fórmula de potencia exacta

Para el contraste bilateral \(H_a: \sigma_1 \neq \sigma_2\) con grupos de igual tamaño \(n\):

\( \text{Potencia} = F_{F(df,df)}\!\left(\frac{F_{\alpha/2,\,df,\,df}}{R^2}\right) + 1 - F_{F(df,df)}\!\left(\frac{F_{1-\alpha/2,\,df,\,df}}{R^2}\right) \)

donde \(df = n-1\) y \(F_{p,df,df}\) es el cuantil \(p\) de la distribución \(F(df, df)\). La calculadora busca el menor \(n\) que satisface la potencia objetivo.

R > 1: σ₁ > σ₂ (el grupo 1 es más variable).
R < 1: equivale a R'=1/R con grupos intercambiados; la potencia es la misma por simetría.

Configuración rápida

R: usa siempre R > 1 (o equivale al inverso por simetría). R=1,5 es un efecto moderado; R=2 ya es grande.
α: 0,05 es el estándar; 0,01 para decisiones críticas sobre variabilidad.
Potencia: 0,80 como mínimo; 0,90 para estudios de validación.
Normalidad: el test F de varianzas es muy sensible a la no normalidad. Si los datos no son normales, considera el test de Levene o Bartlett.

Ejemplo resuelto

Un estudio compara la variabilidad de tiempos de reacción entre un grupo con y sin tratamiento farmacológico. El investigador considera relevante detectar diferencias de un 50 % o más en la desviación estándar (R = 1,5), con \(\alpha = 0{,}05\) y potencia del 80 %.

La calculadora devuelve aproximadamente n = 80 por grupo (160 en total). El test F con 79 grados de libertad en cada grupo tiene un 80 % de probabilidad de rechazar \(H_0\) cuando la razón real de desviaciones estándar es ≥ 1,5.

Análisis de sensibilidad: con R = 2 (varianza cuádruple) la muestra se reduce a n ≈ 22 por grupo. Para R = 1,25 se necesitan n ≈ 283 por grupo. El tamaño muestral es muy sensible a R en la región R ∈ (1, 2).

Supuestos del modelo

Dos muestras aleatorias independientes entre sí.
Ambas poblaciones son normales: el test \(F\) es sensible a la falta de normalidad.
Las observaciones dentro de cada grupo son independientes.
El tamaño muestral se deriva de la distribución \(F\) exacta para el cociente de varianzas.

Cómo interpretar el resultado

El valor \(n\) es el tamaño mínimo de cada grupo en un diseño balanceado para contrastar si dos varianzas poblacionales difieren mediante el test F de Snedecor. El tamaño total del estudio es \(2n\), y los grados de libertad del numerador y denominador son \(n - 1\) cada uno. Redondea siempre hacia arriba; una observación menos puede reducir los grados de libertad justo en el borde crítico. Si prevés pérdidas o rechazos, divide cada \(n\) entre \((1 - \text{tasa de pérdida})\) para obtener el número de reclutamiento real por grupo.

El efecto de interés es la razón de varianzas \(\lambda = \sigma_1^2 / \sigma_2^2\) (o su inversa si \(\lambda < 1\)). La sensibilidad del diseño a la especificación de \(\lambda\) es alta: si la razón real resulta ser más cercana a 1 de lo supuesto, el test tendrá menos potencia de la planificada. Realiza un análisis de sensibilidad calculando \(n\) para distintos valores de \(\lambda\) en un rango razonable. Es importante tener presente que el test F es extraordinariamente sensible a la no normalidad: incluso desviaciones moderadas de la normalidad pueden inflar gravemente la tasa de error de tipo I, haciendo que el p-valor sea infiable. Si los datos no son claramente normales, considera tests alternativos como Levene o Bartlett (más robustos a la no normalidad) y adapta el \(n\) en consecuencia.

Cuando el \(n\) calculado sea muy grande, suele indicar que el tamaño del efecto especificado (\(\lambda\) cercano a 1) es demasiado pequeño para ser detectado de forma eficiente con un test de razón de varianzas; valora si la diferencia entre varianzas tiene relevancia práctica. Si el objetivo es estimar la razón de varianzas con una precisión determinada en lugar de contrastarla, usa la calculadora de tamaño muestral para el IC de la varianza. Una vez recogidos los datos, analiza los resultados con el contraste F para dos varianzas.

Referencias

Zar, J. H. (2010). Biostatistical Analysis (5.ª ed.). Pearson.
Montgomery, D. C. & Runger, G. C. (2018). Applied Statistics and Probability for Engineers (7.ª ed.). Wiley.