Tamaño muestral

Calculadora de tamaño muestral para contraste de dos varianzas

Calcula el tamaño de muestra necesario para contrastar \(H_0: \sigma_1 = \sigma_2\) con una potencia objetivo mediante el test F exacto.

Calculadora

Introduce la razón R = σ₁/σ₂, el nivel de significación y la potencia deseada. Se asume el mismo tamaño en ambos grupos (n₁ = n₂ = n).

Resultado pendiente…

Explicación

El test F de Snedecor-Fisher contrasta la igualdad de varianzas de dos poblaciones normales independientes mediante el estadístico \(F = S_1^2/S_2^2\), que bajo \(H_0\) sigue una distribución \(F(n_1-1, n_2-1)\).

Bajo la alternativa \(\sigma_1 = R \cdot \sigma_2\) con \(R \neq 1\), se tiene que \(F/R^2 \sim F(n_1-1, n_2-1)\), lo que permite calcular la potencia exacta sin necesidad de distribuciones F no centrales. La calculadora busca el menor \(n\) (por grupo) para que la potencia exacta bilateral alcance el objetivo.

Fórmula de potencia exacta

Para el contraste bilateral \(H_a: \sigma_1 \neq \sigma_2\) con grupos de igual tamaño \(n\):

\( \text{Potencia} = F_{F(df,df)}\!\left(\frac{F_{\alpha/2,\,df,\,df}}{R^2}\right) + 1 - F_{F(df,df)}\!\left(\frac{F_{1-\alpha/2,\,df,\,df}}{R^2}\right) \)

donde \(df = n-1\) y \(F_{p,df,df}\) es el cuantil \(p\) de la distribución \(F(df, df)\). La calculadora busca el menor \(n\) que satisface la potencia objetivo.

  • R > 1: σ₁ > σ₂ (el grupo 1 es más variable).
  • R < 1: equivale a R'=1/R con grupos intercambiados; la potencia es la misma por simetría.

Configuración rápida

  • R: usa siempre R > 1 (o equivale al inverso por simetría). R=1,5 es un efecto moderado; R=2 ya es grande.
  • α: 0,05 es el estándar; 0,01 para decisiones críticas sobre variabilidad.
  • Potencia: 0,80 como mínimo; 0,90 para estudios de validación.
  • Normalidad: el test F de varianzas es muy sensible a la no normalidad. Si los datos no son normales, considera el test de Levene o Bartlett.

Ejemplo resuelto

Un estudio compara la variabilidad de tiempos de reacción entre un grupo con y sin tratamiento farmacológico. El investigador considera relevante detectar diferencias de un 50 % o más en la desviación estándar (R = 1,5), con \(\alpha = 0{,}05\) y potencia del 80 %.

La calculadora devuelve aproximadamente n = 80 por grupo (160 en total). El test F con 79 grados de libertad en cada grupo tiene un 80 % de probabilidad de rechazar \(H_0\) cuando la razón real de desviaciones estándar es ≥ 1,5.

Análisis de sensibilidad: con R = 2 (varianza cuádruple) la muestra se reduce a n ≈ 22 por grupo. Para R = 1,25 se necesitan n ≈ 283 por grupo. El tamaño muestral es muy sensible a R en la región R ∈ (1, 2).

Cómo interpretar el resultado

El valor \(n\) es el tamaño mínimo de cada grupo en un diseño balanceado para contrastar si dos varianzas poblacionales difieren mediante el test F de Snedecor. El tamaño total del estudio es \(2n\), y los grados de libertad del numerador y denominador son \(n - 1\) cada uno. Redondea siempre hacia arriba; una observación menos puede reducir los grados de libertad justo en el borde crítico. Si prevés pérdidas o rechazos, divide cada \(n\) entre \((1 - \text{tasa de pérdida})\) para obtener el número de reclutamiento real por grupo.

El efecto de interés es la razón de varianzas \(\lambda = \sigma_1^2 / \sigma_2^2\) (o su inversa si \(\lambda < 1\)). La sensibilidad del diseño a la especificación de \(\lambda\) es alta: si la razón real resulta ser más cercana a 1 de lo supuesto, el test tendrá menos potencia de la planificada. Realiza un análisis de sensibilidad calculando \(n\) para distintos valores de \(\lambda\) en un rango razonable. Es importante tener presente que el test F es extraordinariamente sensible a la no normalidad: incluso desviaciones moderadas de la normalidad pueden inflar gravemente la tasa de error de tipo I, haciendo que el p-valor sea infiable. Si los datos no son claramente normales, considera tests alternativos como Levene o Bartlett (más robustos a la no normalidad) y adapta el \(n\) en consecuencia.

Cuando el \(n\) calculado sea muy grande, suele indicar que el tamaño del efecto especificado (\(\lambda\) cercano a 1) es demasiado pequeño para ser detectado de forma eficiente con un test de razón de varianzas; valora si la diferencia entre varianzas tiene relevancia práctica. Si el objetivo es estimar la razón de varianzas con una precisión determinada en lugar de contrastarla, usa la calculadora de tamaño muestral para el IC de la varianza. Una vez recogidos los datos, analiza los resultados con el contraste F para dos varianzas.

Referencias

  • Zar, J. H. (2010). Biostatistical Analysis (5.ª ed.). Pearson.
  • Montgomery, D. C. & Runger, G. C. (2018). Applied Statistics and Probability for Engineers (7.ª ed.). Wiley.