Contrastes de hipótesis

Calculadora de contrastes sobre varianzas

Contrasta estabilidad y variabilidad en uno o dos grupos.

Calculadora

Calculadora online que calcula el estadístico, el p-valor y la decisión para contrastes sobre una varianza o sobre dos varianzas.

Resultado pendiente…

Explicación

El contraste de varianza se utiliza para comprobar si la variabilidad de una población es compatible con un valor teórico o de referencia. A diferencia de los contrastes sobre la media, este contraste no analiza si los datos son más altos o más bajos en promedio, sino si son más o menos dispersos de lo esperado.

En industria, laboratorio y control de calidad no solo importa el promedio: la varianza define riesgo, consistencia y estabilidad. Un proceso puede tener una media correcta y, aun así, ser demasiado irregular.

Por ejemplo, una máquina puede llenar botellas con una cantidad media correcta de líquido, pero hacerlo con demasiada variabilidad. Aunque el promedio sea adecuado, una varianza excesiva implicaría que algunas botellas se llenan demasiado y otras demasiado poco. El contraste de varianza permite comprobar si la dispersión observada en una muestra es compatible con la variabilidad considerada aceptable.

Para una única varianza se utiliza un contraste basado en la distribución chi-cuadrado. Para comparar dos varianzas se utiliza habitualmente un contraste basado en la distribución F. En ambos casos, los contrastes clásicos asumen que los datos proceden de poblaciones aproximadamente normales.

Hipótesis y estadístico

\(H_0: \sigma^2 = \sigma_0^2\)

\( \chi^2 = \frac{(n-1)s^2}{\sigma_0^2} \)

\(H_0: \sigma_1^2 = \sigma_2^2\)

\( F = \frac{s_1^2}{s_2^2} \)

  • \(s^2\): varianza muestral observada (test chi-cuadrado).
  • \(\sigma_0^2\): varianza de referencia bajo \(H_0\) (test chi-cuadrado).
  • \(n\): tamaño de la muestra; \(gl = n-1\) grados de libertad (test chi-cuadrado).
  • \(s_1^2, s_2^2\): varianzas muestrales de los dos grupos (test F).
  • \(n_1, n_2\): tamaños de los dos grupos; \(gl_1 = n_1-1\), \(gl_2 = n_2-1\) (test F).

Contraste rápido

En el contraste de una varianza, el estadístico compara la varianza muestral \(s^2\) con una varianza de referencia \(\sigma_0^2\). Bajo \(H_0\), el estadístico sigue una distribución chi-cuadrado con \(n-1\) grados de libertad:

\( \chi^2 = \frac{(n-1)s^2}{\sigma_0^2} \sim \chi^2_{n-1} \)

En la comparación de dos varianzas, el estadístico compara el cociente entre las dos varianzas muestrales. Bajo \(H_0\), sigue una distribución F:

\( F = \frac{s_1^2}{s_2^2} \sim F_{n_1-1,\;n_2-1} \)

Si el resultado es significativo, conviene revisar posibles fuentes de variación: lotes, turnos, instrumentación, cambios de proveedor, condiciones de medición o diferencias entre grupos.

Ejemplo resuelto

Se desea comparar la variabilidad de dos procesos de fabricación de tornillos. Proceso A: varianza muestral \(s_1^2 = 25\) mm², \(n_1 = 21\) piezas. Proceso B: varianza muestral \(s_2^2 = 16\) mm², \(n_2 = 16\) piezas. Se contrasta \(H_0\colon \sigma_1^2 = \sigma_2^2\) frente a \(H_1\colon \sigma_1^2 \neq \sigma_2^2\) con \(\alpha = 0{,}05\) bilateral, usando el test F de Snedecor.

El estadístico F se calcula como cociente de varianzas (mayor entre menor):

\( F = \dfrac{s_1^2}{s_2^2} = \dfrac{25}{16} = 1{,}5625 \)

Los grados de libertad son \(gl_1 = n_1 - 1 = 20\) y \(gl_2 = n_2 - 1 = 15\). Para un contraste bilateral con \(\alpha = 0{,}05\), el valor crítico superior es \(F_{0{,}025;\,20,\,15} \approx 2{,}76\). El valor crítico inferior es \(F_{0{,}975;\,20,\,15} \approx 1/F_{0{,}025;\,15,\,20} \approx 0{,}39\).

Como \(0{,}39 < F = 1{,}5625 < 2{,}76\), el estadístico no cae en ninguna de las dos colas de rechazo. El p-valor bilateral es \(p \approx 0{,}38 > 0{,}05\).

Conclusión: no se rechaza \(H_0\). Los datos no aportan evidencia significativa de que los dos procesos tengan varianzas distintas. Ambos procesos presentan una dispersión comparable al nivel de significación del 5 %.

Cómo interpretar el resultado

Rechazar \(H_0\) (p-valor < \(\alpha\)) significa que la varianza muestral \(s^2\) es estadísticamente incompatible con el valor hipotético \(\sigma^2_0\). En términos prácticos, hay evidencia de que la variabilidad del proceso o población es distinta de la de referencia. Sin embargo, el test chi-cuadrado para una varianza es notablemente sensible a desviaciones de la normalidad: un rechazo puede reflejar una distribución asimétrica o con colas pesadas en lugar de una varianza genuinamente distinta. Complementa siempre con un gráfico de los datos (histograma, Q-Q plot) y considera el contexto del problema.

No rechazar \(H_0\) (p-valor ≥ \(\alpha\)) no prueba que \(\sigma^2 = \sigma^2_0\); solo indica que los datos son compatibles con ese valor al nivel elegido. Con muestras pequeñas la potencia para detectar cambios en varianza es generalmente baja. El intervalo de confianza para \(\sigma^2\) —basado en percentiles de la distribución chi-cuadrado con \(n-1\) grados de libertad— ofrece una perspectiva más completa del rango de valores plausibles.

El estadístico chi-cuadrado \(\chi^2 = (n-1)s^2/\sigma^2_0\) mide cuánto se aleja la varianza muestral de la hipotética. En la visualización, la zona verde representa la región de no rechazo y las zonas rojas las regiones críticas (unilateral o bilateral según la alternativa elegida); la línea ámbar marca el estadístico observado. A diferencia de los tests de media, la distribución chi-cuadrado no es simétrica, por lo que los valores críticos difieren en las dos colas incluso para el mismo \(\alpha\).

Preguntas frecuentes

  • ¿Cuándo uso el contraste de una varianza? Cuando quieres comprobar si la varianza poblacional es compatible con un valor teórico o de referencia.
  • ¿Cuándo uso el contraste de dos varianzas? Cuando quieres comparar si dos poblaciones o condiciones tienen la misma dispersión.
  • ¿Qué supuesto es importante? Los contrastes clásicos de varianza asumen que los datos proceden de poblaciones aproximadamente normales.
  • ¿Puede haber la misma media y distinta varianza? Sí. Dos procesos pueden tener el mismo promedio y, sin embargo, una variabilidad muy diferente.
  • ¿Qué cola debo elegir? Bilateral si buscas cualquier diferencia; cola derecha si quieres comprobar si la varianza es mayor; cola izquierda si quieres comprobar si la varianza es menor.

Referencia: Prueba F de igualdad de varianzas — Wikipedia