¿Qué es la transformación z de Fisher?

Es una transformación que estabiliza la varianza del coeficiente de correlación: z = arctanh(ρ). Permite usar aproximaciones normales para el contraste y el cálculo de tamaño muestral.

¿Qué correlación mínima debo indicar?

La correlación más pequeña que consideras relevante detectar. Valores de referencia: ρ = 0,10 (pequeña), ρ = 0,30 (moderada), ρ = 0,50 (grande).

¿Cuándo usar contraste unilateral?

Cuando tienes una hipótesis direccional previa (solo te interesa detectar correlaciones positivas o solo negativas). Si la dirección es incierta, usa bilateral.

¿El tamaño muestral es exacto?

No; es la aproximación basada en la transformación de Fisher, válida para muestras de tamaño moderado-grande.

Tamaño muestral correlación | Calculadora

Calculadora

Introduce la correlación mínima a detectar, el alfa, la potencia y el tipo de contraste.

Correlación mínima a detectar (ρ)

Alfa (α)

Potencia (1-β)

Tipo de contraste

Referencia rápida de ρ

Resultado pendiente…

Explicación

Este cálculo determina cuántos pares de observaciones (n) se necesitan para detectar una correlación poblacional \(\rho\) diferente de cero con una potencia y un nivel de significación dados. La lógica es diferente a la de las calculadoras de medias o proporciones: aquí se utiliza la transformación z de Fisher, que estabiliza la varianza de \(\hat{\rho}\).

El estimador muestral \(\hat{\rho}\) (correlación de Pearson) tiene una distribución sesgada y asimétrica cuando \(\rho \neq 0\), con varianza que depende del propio \(\rho\). La transformación \(z = \operatorname{arctanh}(\hat{\rho})\) convierte esta distribución en aproximadamente normal con varianza \(1/(n-3)\), independiente de \(\rho\). Esto permite derivar n de forma directa a partir del cociente señal-ruido.

Fórmula de tamaño muestral

Sea \(z_\rho = \operatorname{arctanh}(\rho) = \frac{1}{2}\ln\!\left(\frac{1+\rho}{1-\rho}\right)\). Entonces:

\( n = \left\lceil \frac{(Z_{\alpha/2} + Z_\beta)^2}{z_\rho^2} \right\rceil + 3 \)

donde \(Z_{\alpha/2}\) es el cuantil normal para contraste bilateral (o \(Z_\alpha\) para unilateral) y \(Z_\beta = \Phi^{-1}(1-\beta)\).

ρ: correlación mínima de interés (en valor absoluto). El signo no importa para el tamaño muestral.
z_ρ: la transformación arctanh actúa como el "efecto estandarizado"; correlaciones pequeñas producen z_ρ pequeños y n grandes.
+3: corrección estándar derivada de la distribución exacta de \(\hat{\rho}\); mejora la aproximación para n pequeños.
Referencia (Cohen, 1988): ρ = 0,10 (pequeña), 0,30 (moderada), 0,50 (grande).

Configuración rápida

ρ desconocido: usa ρ = 0,30 como referencia conservadora de efecto moderado.
Contraste bilateral: usa cuando no tienes hipótesis direccional previa.
Contraste unilateral: solo si tienes razones sólidas para esperar una correlación positiva (o negativa) — reduce n pero exige justificación a priori.
Potencia: 0,80 es el mínimo habitual; 0,90 para estudios confirmatorios o validación psicométrica.

Ejemplo sencillo

Quieres detectar una correlación de al menos ρ = 0,30 con α = 0,05 bilateral y potencia 0,80. La transformación da z_ρ = arctanh(0,30) ≈ 0,3095. Necesitas aproximadamente 85 pares de observaciones.

Ejemplo resuelto

Un equipo de investigación educativa quiere estudiar si existe una correlación entre las horas semanales de estudio autónomo y la calificación obtenida en el examen final. Basándose en la literatura previa, estiman que la correlación de Pearson poblacional es \(\rho \approx 0{,}40\) (correlación moderada). El contraste es bilateral con \(\alpha = 0{,}05\) y se desea una potencia del 80 % para detectar correlaciones de magnitud \(\rho \geq 0{,}40\).

El primer paso es aplicar la transformación de Fisher \(z_r\) para estabilizar la varianza:

\( z_r = \frac{1}{2} \ln\!\left(\frac{1 + \rho}{1 - \rho}\right) = \frac{1}{2} \ln\!\left(\frac{1{,}40}{0{,}60}\right) = \frac{1}{2} \ln(2{,}333) = \frac{1}{2} \times 0{,}8473 \approx 0{,}424 \)

Con \(z_{\alpha/2} = 1{,}960\) y \(z_{\beta} = 0{,}842\), el tamaño muestral se obtiene como:

\( n = \frac{(z_{\alpha/2} + z_{\beta})^2}{z_r^2} + 3 = \frac{(1{,}960 + 0{,}842)^2}{(0{,}424)^2} + 3 = \frac{7{,}851}{0{,}1798} + 3 \approx 43{,}7 + 3 = 46{,}7 \)

Redondeando al entero superior, se necesitan 47 participantes para alcanzar el 80 % de potencia al detectar \(\rho = 0{,}40\) con \(\alpha = 0{,}05\) bilateral.

Si la correlación esperada fuese más débil, por ejemplo \(\rho = 0{,}25\), la transformación de Fisher daría \(z_r = 0{,}5 \times \ln(1{,}25/0{,}75) \approx 0{,}5 \times 0{,}5108 = 0{,}2554\). En ese caso:

\( n = \frac{7{,}851}{(0{,}2554)^2} + 3 = \frac{7{,}851}{0{,}0652} + 3 \approx 120{,}4 + 3 = 124 \)

Se precisarían 124 participantes, casi el triple que para \(\rho = 0{,}40\). Este contraste ilustra la alta sensibilidad del tamaño muestral al valor de la correlación esperada, especialmente en el rango \(\rho < 0{,}30\).

Supuestos del modelo

Normalidad bivariada: la fórmula asume que (X, Y) sigue una distribución normal bivariada. Desviaciones severas afectan la distribución de \(\hat{\rho}\).
Independencia: cada par (x_i, y_i) es independiente de los demás.
Relación lineal: la correlación de Pearson mide únicamente asociación lineal; una relación curvilínea fuerte con ρ ≈ 0 no sería detectada.
Ausencia de valores atípicos influyentes: los outliers pueden distorsionar gravemente \(\hat{\rho}\); en muestras pequeñas es especialmente relevante.

Usos frecuentes

Validación de escalas psicométricas y cuestionarios (correlación ítem-total, fiabilidad test-retest).
Estudios de asociación entre dos variables continuas (biomarcadores, escalas clínicas, parámetros fisiológicos).
Análisis de concordancia inter-observador mediante correlación de Pearson o intraclase.
Estudios de validación de métodos de medición (p. ej. comparación de dos técnicas de laboratorio).

Cómo interpretar el resultado

El valor \(n\) es el número mínimo de pares de observaciones (sujetos con las dos medidas requeridas) para detectar una correlación de Pearson \(\rho_1\) cuando la hipótesis nula es \(\rho = \rho_0\) (habitualmente \(\rho_0 = 0\)) con la potencia y el nivel de significación especificados. Redondea siempre hacia arriba. Si prevés que algunos sujetos no podrán ser medidos en ambas variables (pérdidas de seguimiento, datos faltantes), divide \(n\) entre \((1 - \text{tasa de pérdida})\) para obtener el reclutamiento necesario.

La fórmula utiliza la transformación \(z\) de Fisher \(z = \frac{1}{2}\ln\!\left(\frac{1+\rho}{1-\rho}\right)\) para estabilizar la varianza. Esta transformación es más precisa cuando \(n \geq 10\) y \(|\rho| < 0{,}9\); para correlaciones muy altas (\(|\rho| > 0{,}9\)) la aproximación puede subestimar el \(n\) necesario. Realiza un análisis de sensibilidad variando \(\rho_1\) en ±0,10: una correlación esperada de 0,5 en lugar de 0,6 puede exigir un 40–60 % más de pares. Si la correlación real resulta ser mayor de la esperada, el test tendrá más potencia de la planificada (lo que generalmente es una buena noticia), pero si resulta ser menor, el estudio puede quedar infrapotenciado.

Cuando el \(n\) calculado resulte muy pequeño (< 20 pares), verifica que la relación entre las variables es razonablemente lineal y que no hay valores atípicos influyentes, ya que la correlación de Pearson es sensible a ambos factores. Si los datos presentan no linealidad o colas pesadas, considera la correlación de Spearman y ajusta el \(n\) con un factor de eficiencia relativa. Con los datos recogidos, calcula la correlación y su IC con la calculadora de contraste de hipótesis para la correlación o realiza el contraste formal con la herramienta correspondiente.

Referencias externas

Coeficiente de correlación de Pearson (Wikipedia en español)
Fisher transformation (Wikipedia en inglés) — transformación arctanh y su uso para inferencia sobre ρ
Pearson correlation coefficient (Wikipedia en inglés)
Sample size determination (Wikipedia en inglés)
Cohen, J. (1988). Statistical Power Analysis for the Behavioral Sciences (2ª ed.). Lawrence Erlbaum Associates. — referencia de los umbrales ρ = 0,10/0,30/0,50.

Preguntas frecuentes

¿Qué es la transformación z de Fisher? z = arctanh(ρ) = ½·ln((1+ρ)/(1−ρ)); convierte la distribución sesgada de r̂ en aproximadamente normal con varianza 1/(n−3), lo que permite aplicar la aproximación normal para derivar n directamente.
¿Correlación negativa? El módulo |ρ| es lo que determina el tamaño muestral; la dirección (positiva o negativa) no afecta a n, aunque sí al tipo de contraste (usa unilateral si tienes una hipótesis direccional).
¿Qué diferencia hay entre bilateral y unilateral? Bilateral (H₁: ρ ≠ 0) usa Z_{α/2} y es apropiado cuando no tienes hipótesis previa sobre el signo. Unilateral (H₁: ρ > 0) usa Z_α y da n ligeramente menor, pero exige justificación a priori.
¿Funciona para correlación de Spearman o tau? La fórmula de Fisher es estricta para la correlación de Pearson con normalidad bivariada. Para Spearman puede usarse como aproximación, aunque con menor precisión.
¿El tamaño muestral es exacto? Es una aproximación; funciona bien para n > 20. Para n muy pequeños, métodos exactos (simulación o tablas de potencia) son más precisos.