Contrastes de hipótesis

Calculadora online de ANOVA de un factor

Compara tres o más medias independientes y obtiene el estadístico F, p-valor, tabla ANOVA y tamaño de efecto.

¿Qué contrasta el ANOVA?

El ANOVA de un factor contrasta si varias poblaciones tienen la misma media. Es la extensión natural del contraste de dos medias cuando existen tres o más grupos independientes.

La hipótesis nula es \(H_0: \mu_1=\mu_2=\cdots=\mu_k\). La alternativa indica que al menos una media difiere, pero el ANOVA no especifica por sí solo qué par de grupos es diferente.

Calculadora

Introduce un grupo por línea. Dentro de cada línea separa observaciones con comas, espacios o punto y coma. Usa punto decimal si necesitas decimales.

Ejemplo: cada línea representa un tratamiento, segmento o grupo independiente.

Visualización del contraste F

La zona roja representa la región de rechazo de cola derecha para el nivel α elegido. La línea naranja marca el estadístico F observado.

Fórmulas del ANOVA de un factor

El ANOVA descompone la variabilidad total en variabilidad entre grupos y variabilidad dentro de los grupos:

\(SC_T = SC_{entre} + SC_{dentro}\)

\(F = \dfrac{CM_{entre}}{CM_{dentro}} = \dfrac{SC_{entre}/(k-1)}{SC_{dentro}/(N-k)}\)

\(\eta^2 = SC_{entre}/SC_T\)

Bajo \(H_0\), el estadístico F sigue aproximadamente una distribución F de Snedecor con \(k-1\) y \(N-k\) grados de libertad.

Ejemplo resuelto

Un agrónomo evalúa el efecto de tres tipos de fertilizante sobre el rendimiento (kg) de parcelas agrícolas. Se asignan aleatoriamente 5 parcelas a cada fertilizante, obteniéndose los siguientes datos: Fertilizante A: 32, 34, 31, 33, 35 (media \(\bar{x}_1 = 33\)); Fertilizante B: 28, 30, 27, 29, 31 (media \(\bar{x}_2 = 29\)); Fertilizante C: 36, 38, 35, 37, 39 (media \(\bar{x}_3 = 37\)).

La hipótesis nula es \(H_0: \mu_1 = \mu_2 = \mu_3\) (los tres fertilizantes producen el mismo rendimiento medio) frente a \(H_1\): al menos dos medias difieren. Se usa \(\alpha = 0{,}05\).

La media global es \(\bar{x} = (33 + 29 + 37)/3 = 33\) kg. La suma de cuadrados entre grupos (variación debida al fertilizante) es:

\( SC_{\text{entre}} = n \sum_{j=1}^{k}(\bar{x}_j - \bar{x})^2 = 5\left[(33-33)^2 + (29-33)^2 + (37-33)^2\right] = 5(0 + 16 + 16) = 160 \)

La varianza intragrupo de cada grupo es \(s^2 = 2{,}5\). La suma de cuadrados dentro de grupos es:

\( SC_{\text{dentro}} = \sum_{j=1}^{k}(n_j - 1)\,s_j^2 = 3 \times 4 \times 2{,}5 = 30 \)

Los grados de libertad son \(gl_{\text{entre}} = k - 1 = 2\) y \(gl_{\text{dentro}} = N - k = 15 - 3 = 12\). Las medias cuadráticas son \(CM_{\text{entre}} = 160/2 = 80\) y \(CM_{\text{dentro}} = 30/12 = 2{,}5\). El estadístico F resulta:

\( F = \frac{CM_{\text{entre}}}{CM_{\text{dentro}}} = \frac{80}{2{,}5} = 32 \)

El valor crítico para \(\alpha = 0{,}05\) con \((2,\, 12)\) grados de libertad es \(F_{0{,}05;\,2,\,12} \approx 3{,}89\), y el p-valor correspondiente a \(F = 32\) es \(p < 0{,}001\). Dado que \(F = 32 \gg 3{,}89\), se rechaza \(H_0\).

Conclusión: hay diferencias estadísticamente muy significativas entre los rendimientos medios producidos por los tres fertilizantes (\(p < 0{,}001\)). El tamaño del efecto es grande (\(\eta^2 = 160/190 \approx 0{,}84\)). Para determinar qué pares de fertilizantes difieren significativamente, se recomienda una prueba post hoc (Tukey HSD o Bonferroni).

Supuestos importantes

  • Independencia: las observaciones deben ser independientes dentro y entre grupos.
  • Normalidad aproximada: los residuos de cada grupo deberían ser razonablemente normales, especialmente con muestras pequeñas.
  • Homogeneidad de varianzas: las varianzas poblacionales deberían ser similares. Si no se cumple, considera alternativas como Welch ANOVA.

Después de un ANOVA significativo

Un ANOVA significativo indica que existe alguna diferencia, pero no cuál. Para identificar pares concretos se suelen aplicar comparaciones post hoc, como Tukey HSD, ajustando por comparaciones múltiples.

Cómo interpretar el resultado

Rechazar \(H_0\) (p-valor < α) indica que al menos una media grupal es distinta de las demás, pero el ANOVA no revela cuáles pares difieren ni en qué dirección. Para eso es necesario aplicar comparaciones post hoc (Tukey HSD, Bonferroni, Scheffé, etc.) que controlan el error de tipo I acumulado por comparaciones múltiples. La significación estadística no equivale a relevancia práctica: con muestras grandes, diferencias pequeñas entre medias pueden producir un F significativo. Reporta el tamaño del efecto \(\eta^2 = SS_\text{entre}/SS_\text{total}\) para cuantificar qué proporción de la variabilidad total explica el factor.

No rechazar \(H_0\) (p-valor ≥ α) no demuestra que todas las medias sean iguales; solo indica que los datos son compatibles con la igualdad al nivel elegido. Una potencia insuficiente —causada por pocos sujetos por grupo, alta variabilidad intragrupo o diferencias reales pequeñas— puede impedir detectar efectos reales. Examina los intervalos de confianza por grupo y el tamaño muestral para valorar si el estudio tenía potencia adecuada.

El estadístico F es el cociente entre la varianza explicada por el factor (media cuadrática entre grupos, \(MS_\text{entre}\)) y la varianza residual no explicada (media cuadrática dentro de grupos, \(MS_\text{dentro}\)). Un \(F\) próximo a 1 indica que la variabilidad entre medias es similar a la variabilidad aleatoria dentro de los grupos. En la visualización, la zona verde es la región de no rechazo, la zona roja es la cola crítica derecha y la línea ámbar señala el F observado. El ANOVA asume independencia, normalidad aproximada de los residuos y homogeneidad de varianzas (homocedasticidad); si esta última no se cumple, considera el ANOVA de Welch.

Preguntas frecuentes

  • ¿Puedo usar ANOVA con solo dos grupos? Matemáticamente sí, pero normalmente es más directo usar el contraste para dos medias.
  • ¿Qué significa η²? Es una medida de tamaño de efecto: proporción de variabilidad total explicada por la pertenencia al grupo.
  • ¿Qué es el tamaño mínimo detectable (MDE) en ANOVA? Es el tamaño de efecto más pequeño (por ejemplo en términos de \(f\) de Cohen o \(\eta^2\)) que el diseño puede detectar con potencia y \(\alpha\) fijados. Efectos menores al MDE suelen requerir más muestra para hacerse detectables.
  • ¿El ANOVA prueba que todas las medias son distintas? No. Solo prueba si hay evidencia de que al menos una media no coincide con las demás.

Referencia: Análisis de la varianza (ANOVA) — Wikipedia