Tamaño muestral

Calculadora de tamaño muestral para ANOVA

Determina cuántas observaciones necesitas por grupo para detectar diferencias entre k medias con la potencia deseada.

Calculadora

ANOVA de un factor balanceado. Introduce el número de grupos, el tamaño del efecto, alfa y potencia.

Resultado pendiente…

Explicación

El ANOVA de un factor (one-way ANOVA) contrasta la hipótesis nula de que las medias de k ≥ 2 grupos independientes son iguales frente a la alternativa de que al menos dos difieren. Cuando k = 2 es equivalente al test t de dos muestras, pero para k ≥ 3 ofrece control del error global de tipo I sin necesidad de múltiples comparaciones bilaterales.

El parámetro que resume el tamaño del efecto es la f de Cohen, definida como \(f = \sigma_{\text{medias}} / \sigma_{\text{residual}}\), donde \(\sigma_{\text{medias}}\) es la desviación estándar de las medias grupales y \(\sigma_{\text{residual}}\) la variabilidad dentro de los grupos. La f está relacionada con el \(\eta^2\) (eta cuadrado) mediante \(f = \sqrt{\eta^2/(1-\eta^2)}\).

El cálculo de potencia se basa en la distribución F no central: bajo H₁, el estadístico F sigue una F no central con parámetro de no centralidad \(\lambda = n \cdot k \cdot f^2\). Esta calculadora busca el mínimo n entero para el que la potencia supera el objetivo mediante búsqueda iterativa.

Fórmula y método de cálculo

Con n observaciones por grupo (diseño balanceado):

\( \lambda = n \cdot k \cdot f^2 \)

\( 1-\beta = P\!\left(F'(k-1,\;k(n-1),\;\lambda) > F_{\alpha,\,k-1,\,k(n-1)}\right) \)

Se incrementa n de 2 en adelante hasta que la potencia calculada supera el objetivo.

  • f: efecto de Cohen = \(\sigma_{\text{medias}} / \sigma_{\text{residual}}\). Referencia: 0,10 (pequeño), 0,25 (mediano), 0,40 (grande).
  • λ: parámetro de no centralidad; crece linealmente con n, k y cuadráticamente con f.
  • k−1 y k(n−1): grados de libertad del numerador y del denominador del estadístico F.

Cómo calcular f a partir de datos previos

Si conoces las medias esperadas de cada grupo \(\mu_1, \ldots, \mu_k\) y la desviación estándar residual común \(\sigma\):

\( \sigma_{\text{medias}} = \sqrt{\frac{1}{k}\sum_{i=1}^{k}(\mu_i - \bar{\mu})^2}, \quad f = \frac{\sigma_{\text{medias}}}{\sigma} \)

Alternativamente, si tienes \(\eta^2\) de un estudio previo: \(f = \sqrt{\eta^2/(1-\eta^2)}\).

Configuración rápida

  • f desconocido: usa f = 0,25 (mediano) como punto de partida conservador.
  • f desde medias y σ: calcula \(\sigma_{\text{medias}}\) a partir de las medias esperadas de cada grupo y divídela entre σ residual.
  • Número de grupos (k): incluye todos los grupos del diseño, aunque alguno sea control. Aumentar k reduce la potencia por grupo si n no crece.
  • Alfa: 0,05 es el estándar; 0,01 para estudios confirmatorios o con múltiples comparaciones post-hoc.
  • Potencia: 0,80 mínimo; 0,90 en estudios donde las comparaciones post-hoc son el objetivo principal.

Ejemplo sencillo

Ensayo comparando 3 dietas (k = 3) con efecto mediano (f = 0,25), α = 0,05 y potencia 0,80: n ≈ 52 por grupo (total ≈ 156). Con 4 grupos y mismo f: n ≈ 45 por grupo (total ≈ 180) — la muestra total crece al añadir grupos aunque el n por grupo baje.

Usos frecuentes

  • Comparación de 3 o más tratamientos, dosis o condiciones experimentales.
  • Diseños factoriales de un factor con varios niveles.
  • Estudios donde el análisis se completará con comparaciones post-hoc (Tukey, Bonferroni, etc.).
  • Psicología experimental, agronomía, farmacología, educación.

Supuestos del modelo

  • Los k grupos son independientes entre sí.
  • La variable sigue una distribución normal en cada grupo (o n es suficientemente grande).
  • Las varianzas de los grupos son iguales (homocedasticidad). Si no, considera Welch ANOVA.
  • Diseño balanceado (mismo n por grupo). Para grupos desiguales, usa el n armónico como aproximación.

Ejemplo resuelto

Un investigador en ciencias de la educación desea comparar el rendimiento académico obtenido con tres métodos de enseñanza distintos (\(k = 3\) grupos): clase magistral, aprendizaje basado en proyectos y aula invertida. De estudios previos se estima que la desviación estándar dentro de cada grupo es \(\sigma = 10\) puntos sobre 100. Se espera que las medias grupales sean aproximadamente 75, 80 y 85 puntos, con una media global de 80.

Para calcular el tamaño del efecto \(f\) de Cohen se obtiene primero la desviación estándar entre grupos:

\( \sigma_{\text{entre}} = \sqrt{\frac{(75-80)^2 + (80-80)^2 + (85-80)^2}{3}} = \sqrt{\frac{25 + 0 + 25}{3}} = \sqrt{\frac{50}{3}} \approx 4{,}08 \)

El tamaño del efecto es \(f = \sigma_{\text{entre}} / \sigma = 4{,}08 / 10 \approx 0{,}408\), considerado grande según los criterios de Cohen (\(f \geq 0{,}40\)). Con \(\alpha = 0{,}05\) y potencia del 80 %, la aproximación da un tamaño muestral de aproximadamente 21 participantes por grupo, es decir, 63 participantes en total.

Si las diferencias entre métodos fuesen más modestas —por ejemplo medias de 76, 80 y 84— la desviación estándar entre grupos sería \(\sqrt{(16+0+16)/3} \approx 3{,}27\), con \(f \approx 0{,}327\) (efecto mediano-grande). En ese caso serían necesarios aproximadamente 33 participantes por grupo (99 en total).

Nótese que el número de grupos \(k\) también influye en el cálculo: a igualdad de \(f\), añadir un cuarto grupo aumenta los grados de libertad del numerador en el ANOVA y modifica el tamaño muestral requerido. Por ello es recomendable utilizar la herramienta para explorar distintos escenarios antes de planificar la recogida de datos.

Cómo interpretar el resultado

El valor \(n\) es el tamaño mínimo por grupo en un diseño balanceado de ANOVA de un factor con \(k\) grupos. El número total de participantes a reclutar es \(k \times n\). Redondea siempre hacia arriba. Si prevés pérdidas o abandonos, calcula el número de reclutamiento por grupo como \(\lceil n / (1 - \text{tasa de pérdida}) \rceil\). Un aspecto clave del diseño ANOVA es que el desequilibrio entre grupos (diferente \(n\) por grupo) no invalida el análisis, pero sí reduce la potencia y complica la interpretación; si anticipas grupos desiguales, usa la fórmula para diseño no balanceado o aumenta el \(n\) del grupo más pequeño.

El tamaño del efecto \(f\) de Cohen (o la varianza entre medias \(\sigma_\mu^2\)) es el parámetro más difícil de especificar. Un valor \(f = 0{,}10\) se considera pequeño, \(f = 0{,}25\) mediano y \(f = 0{,}40\) grande. Pequeños errores en \(f\) tienen un impacto cuadrático en \(n\): si el efecto real es un 20 % menor de lo esperado, el \(n\) necesario aumenta aproximadamente un 56 \% \((1/0{,}8^2 \approx 1{,}56)\). Realiza un análisis de sensibilidad evaluando \(n\) para distintos valores de \(f\) o de la varianza intragrupo \(\sigma^2\). Tener en cuenta que el \(n\) calculado protege el nivel de significación global del contraste F del ANOVA, pero no las comparaciones post-hoc: si planeas hacer todas las comparaciones pareadas entre grupos con corrección de Bonferroni (\(\alpha/\binom{k}{2}\)), el \(n\) necesario para cada comparación individual es considerablemente mayor.

Cuando \(n\) sea muy pequeño por grupo (< 15), verifica que la normalidad de los residuos y la homocedasticidad son razonables, o utiliza el equivalente no paramétrico (test de Kruskal-Wallis) con su propio \(n\) ajustado. Si el \(n\) total \(kn\) resulta inviable, considera si el número de grupos \(k\) puede reducirse (consolidando grupos similares) o si el diseño puede ser más eficiente con un ANOVA de medidas repetidas. Con los datos recogidos, usa la calculadora de ANOVA para el análisis de varianza y los tests post-hoc pertinentes.

Referencias y lecturas adicionales

  • Wikipedia (en): One-way analysis of variance — fundamento teórico del ANOVA.
  • Wikipedia (en): Effect size — Cohen's f — definición y conversión con η².
  • Wikipedia (en): Noncentral F-distribution — distribución usada para el cálculo de potencia.
  • Cohen, J. (1988). Statistical Power Analysis for the Behavioral Sciences (2.ª ed.). Lawrence Erlbaum. — capítulo 8 sobre ANOVA de un factor.

Preguntas frecuentes

  • ¿Qué es f de Cohen y cómo se obtiene? f = σ_medias/σ_residual. Desde η²: f = √(η²/(1−η²)). Valores de referencia: 0,10 pequeño, 0,25 mediano, 0,40 grande.
  • ¿Funciona para ANOVA con grupos desiguales? Esta calculadora asume diseño balanceado. Para grupos desiguales usa el n armónico \(\tilde{n} = k/\sum(1/n_i)\) como aproximación.
  • ¿Cómo afecta aumentar k al n por grupo? Añadir grupos con el mismo f reduce el n por grupo porque hay más grados de libertad del error, pero el n total aumenta.
  • ¿El tamaño calculado garantiza potencia para comparaciones post-hoc? No; para múltiples comparaciones post-hoc puede necesitarse más muestra o un α corregido.