Calculadora
Introduce la correlación muestral r, el tamaño de muestra, el valor nulo ρ₀ y el nivel de significación para obtener el estadístico, p-valor, decisión e intervalo de confianza para ρ.
Explicación
El contraste de hipótesis para la correlación de Pearson permite evaluar si la correlación poblacional \(\rho\) es compatible con un valor hipotético \(\rho_0\). El caso más frecuente es contrastar \(H_0\colon \rho = 0\) (ausencia de correlación lineal), pero también es posible contrastar frente a cualquier otro valor.
La elección del procedimiento depende del valor nulo: si \(\rho_0 = 0\) se emplea un test t exacto; si \(\rho_0 \neq 0\) se recurre a la transformación z de Fisher (arctanh), que estabiliza la varianza y produce una estadística aproximadamente normal.
Hipótesis y estadísticos
\(H_0\colon \rho = \rho_0\)
Cuando \(\rho_0 = 0\):
\( t = \dfrac{r\,\sqrt{n-2}}{\sqrt{1-r^2}}, \quad gl = n-2 \)
Cuando \(\rho_0 \neq 0\) (transformación z de Fisher):
\( z = \left(\operatorname{arctanh}(r) - \operatorname{arctanh}(\rho_0)\right)\cdot\sqrt{n-3} \)
El intervalo de confianza al \(100(1-\alpha)\%\) para \(\rho\) siempre se construye con Fisher:
\( \hat{\rho}_{\text{inf}} = \tanh\!\left(\operatorname{arctanh}(r) - \dfrac{z_{\alpha/2}}{\sqrt{n-3}}\right) \)
\( \hat{\rho}_{\text{sup}} = \tanh\!\left(\operatorname{arctanh}(r) + \dfrac{z_{\alpha/2}}{\sqrt{n-3}}\right) \)
Guía rápida de interpretación
- Si el p-valor es menor que \(\alpha\), se rechaza \(H_0\): hay evidencia de que \(\rho \neq \rho_0\).
- Si el p-valor es mayor o igual que \(\alpha\), la evidencia es insuficiente para rechazar \(H_0\).
- Con muestras grandes, correlaciones pequeñas pueden ser significativas: reporta siempre el IC y \(r^2\) (coeficiente de determinación).
- Si el IC para \(\rho\) no incluye \(\rho_0\), coincide con rechazar \(H_0\) al nivel \(\alpha\).
¿Por qué la transformación de Fisher?
La distribución muestral de \(r\) es asimétrica cuando \(\rho \neq 0\): los valores de \(r\) están acotados en \([-1,1]\) y la distribución se comprime cerca de los extremos. Fisher demostró en 1915 que \(\operatorname{arctanh}(r)\) tiene una distribución aproximadamente normal con varianza \(1/(n-3)\), independientemente del valor de \(\rho\). Esta propiedad hace la transformación esencial para construir intervalos de confianza y para contrastar \(H_0\colon \rho = \rho_0\) con \(\rho_0 \neq 0\).
Ejemplo resuelto
Se dispone de \(n = 30\) observaciones y se obtiene una correlación muestral \(r = 0{,}45\). Se contrasta \(H_0\colon \rho = 0\) frente a \(H_1\colon \rho \neq 0\) con \(\alpha = 0{,}05\).
Como \(\rho_0 = 0\), se usa el test t con \(gl = 28\):
\( t = \dfrac{0{,}45\,\sqrt{28}}{\sqrt{1 - 0{,}2025}} = \dfrac{0{,}45 \times 5{,}292}{\sqrt{0{,}7975}} \approx \dfrac{2{,}381}{0{,}893} \approx 2{,}667 \)
El p-valor bilateral es \(p \approx 0{,}012\). Como \(p = 0{,}012 < \alpha = 0{,}05\), se rechaza \(H_0\).
El IC al 95 % para \(\rho\) mediante Fisher es aproximadamente \([0{,}11,\, 0{,}70]\), que no incluye 0, confirmando la decisión del contraste.
Cómo interpretar el resultado
Rechazar \(H_0\) (p-valor < α) indica que el coeficiente de correlación muestral \(r\) es estadísticamente incompatible con el valor hipotético \(\rho_0\). El caso más común es \(\rho_0 = 0\): rechazar \(H_0\) significa que hay evidencia de asociación lineal entre las dos variables. Sin embargo, con muestras grandes incluso correlaciones muy débiles (por ejemplo, \(r = 0{,}10\)) pueden ser altamente significativas. El coeficiente de determinación \(r^2\) —que indica qué fracción de la variabilidad de una variable explica la otra— es la métrica clave para valorar la relevancia práctica: un \(r^2 = 0{,}01\) significa que solo el 1% de la varianza está compartido, lo cual puede carecer de importancia sustantiva.
No rechazar \(H_0\) (p-valor ≥ α) no implica que \(\rho = \rho_0\); solo que los datos son compatibles con ese valor. Con muestras pequeñas la potencia es limitada: correlaciones moderadas (\(r \approx 0{,}3\)) pueden no resultar significativas con menos de 30–40 observaciones. Examina el intervalo de confianza para \(\rho\): si es amplio, la incertidumbre sobre la correlación real es grande.
El estadístico t (para \(\rho_0=0\)) o el estadístico z de Fisher (para \(\rho_0 \neq 0\)) aparecen en la herramienta. En la visualización, la zona verde es la región de no rechazo, las zonas rojas son las regiones críticas y la línea ámbar señala el estadístico observado. Recuerda que el test asume distribución normal bivariada e independencia de pares; ante alejamientos de la normalidad con \(n\) grande el test sigue siendo robusto, pero en muestras pequeñas considera métodos de remuestreo.
Preguntas frecuentes
- ¿Cuándo se usa el test t y cuándo Fisher? El test t cuando \(\rho_0=0\); la transformación z de Fisher cuando \(\rho_0 \neq 0\) porque la distribución de r no es simétrica.
- ¿Qué supuestos requiere? Distribución normal bivariada, independencia de observaciones y relación lineal. Robusto con n grande.
- ¿Cómo se interpreta el IC para ρ? Se construye con la transformación arctanh y se devuelve a escala original con tanh. Si no incluye ρ₀, hay evidencia de diferencia.
- ¿Puede r pequeño ser significativo? Sí, con n grande. Reporta siempre r, su IC y r² para valorar relevancia práctica.
- ¿Alternativa no paramétrica? Correlación de rangos de Spearman o tau de Kendall cuando no se puede asumir normalidad bivariada.
Referencia: Coeficiente de correlación de Pearson — Wikipedia