Tamaño muestral

Calculadora de tamaño muestral para correlación de Pearson

Calcula cuántos pares de observaciones necesitas para detectar una correlación mínima significativa.

Calculadora

Introduce la correlación mínima a detectar, el alfa, la potencia y el tipo de contraste.

Resultado pendiente…

Explicación

Este cálculo determina cuántos pares de observaciones (n) se necesitan para detectar una correlación poblacional \(\rho\) diferente de cero con una potencia y un nivel de significación dados. La lógica es diferente a la de las calculadoras de medias o proporciones: aquí se utiliza la transformación z de Fisher, que estabiliza la varianza de \(\hat{\rho}\).

El estimador muestral \(\hat{\rho}\) (correlación de Pearson) tiene una distribución sesgada y asimétrica cuando \(\rho \neq 0\), con varianza que depende del propio \(\rho\). La transformación \(z = \operatorname{arctanh}(\hat{\rho})\) convierte esta distribución en aproximadamente normal con varianza \(1/(n-3)\), independiente de \(\rho\). Esto permite derivar n de forma directa a partir del cociente señal-ruido.

Fórmula de tamaño muestral

Sea \(z_\rho = \operatorname{arctanh}(\rho) = \frac{1}{2}\ln\!\left(\frac{1+\rho}{1-\rho}\right)\). Entonces:

\( n = \left\lceil \frac{(Z_{\alpha/2} + Z_\beta)^2}{z_\rho^2} \right\rceil + 3 \)

donde \(Z_{\alpha/2}\) es el cuantil normal para contraste bilateral (o \(Z_\alpha\) para unilateral) y \(Z_\beta = \Phi^{-1}(1-\beta)\).

  • ρ: correlación mínima de interés (en valor absoluto). El signo no importa para el tamaño muestral.
  • zρ: la transformación arctanh actúa como el "efecto estandarizado"; correlaciones pequeñas producen zρ pequeños y n grandes.
  • +3: corrección estándar derivada de la distribución exacta de \(\hat{\rho}\); mejora la aproximación para n pequeños.
  • Referencia (Cohen, 1988): ρ = 0,10 (pequeña), 0,30 (moderada), 0,50 (grande).

Supuestos del modelo

  • Normalidad bivariada: la fórmula asume que (X, Y) sigue una distribución normal bivariada. Desviaciones severas afectan la distribución de \(\hat{\rho}\).
  • Independencia: cada par (xi, yi) es independiente de los demás.
  • Relación lineal: la correlación de Pearson mide únicamente asociación lineal; una relación curvilínea fuerte con ρ ≈ 0 no sería detectada.
  • Ausencia de valores atípicos influyentes: los outliers pueden distorsionar gravemente \(\hat{\rho}\); en muestras pequeñas es especialmente relevante.

Configuración rápida

  • ρ desconocido: usa ρ = 0,30 como referencia conservadora de efecto moderado.
  • Contraste bilateral: usa cuando no tienes hipótesis direccional previa.
  • Contraste unilateral: solo si tienes razones sólidas para esperar una correlación positiva (o negativa) — reduce n pero exige justificación a priori.
  • Potencia: 0,80 es el mínimo habitual; 0,90 para estudios confirmatorios o validación psicométrica.

Ejemplo sencillo

Quieres detectar una correlación de al menos ρ = 0,30 con α = 0,05 bilateral y potencia 0,80. La transformación da zρ = arctanh(0,30) ≈ 0,3095. Necesitas aproximadamente 85 pares de observaciones.

Usos frecuentes

  • Validación de escalas psicométricas y cuestionarios (correlación ítem-total, fiabilidad test-retest).
  • Estudios de asociación entre dos variables continuas (biomarcadores, escalas clínicas, parámetros fisiológicos).
  • Análisis de concordancia inter-observador mediante correlación de Pearson o intraclase.
  • Estudios de validación de métodos de medición (p. ej. comparación de dos técnicas de laboratorio).

Referencias externas

Ejemplo resuelto

Un equipo de investigación educativa quiere estudiar si existe una correlación entre las horas semanales de estudio autónomo y la calificación obtenida en el examen final. Basándose en la literatura previa, estiman que la correlación de Pearson poblacional es \(\rho \approx 0{,}40\) (correlación moderada). El contraste es bilateral con \(\alpha = 0{,}05\) y se desea una potencia del 80 % para detectar correlaciones de magnitud \(\rho \geq 0{,}40\).

El primer paso es aplicar la transformación de Fisher \(z_r\) para estabilizar la varianza:

\( z_r = \frac{1}{2} \ln\!\left(\frac{1 + \rho}{1 - \rho}\right) = \frac{1}{2} \ln\!\left(\frac{1{,}40}{0{,}60}\right) = \frac{1}{2} \ln(2{,}333) = \frac{1}{2} \times 0{,}8473 \approx 0{,}424 \)

Con \(z_{\alpha/2} = 1{,}960\) y \(z_{\beta} = 0{,}842\), el tamaño muestral se obtiene como:

\( n = \frac{(z_{\alpha/2} + z_{\beta})^2}{z_r^2} + 3 = \frac{(1{,}960 + 0{,}842)^2}{(0{,}424)^2} + 3 = \frac{7{,}851}{0{,}1798} + 3 \approx 43{,}7 + 3 = 46{,}7 \)

Redondeando al entero superior, se necesitan 47 participantes para alcanzar el 80 % de potencia al detectar \(\rho = 0{,}40\) con \(\alpha = 0{,}05\) bilateral.

Si la correlación esperada fuese más débil, por ejemplo \(\rho = 0{,}25\), la transformación de Fisher daría \(z_r = 0{,}5 \times \ln(1{,}25/0{,}75) \approx 0{,}5 \times 0{,}5108 = 0{,}2554\). En ese caso:

\( n = \frac{7{,}851}{(0{,}2554)^2} + 3 = \frac{7{,}851}{0{,}0652} + 3 \approx 120{,}4 + 3 = 124 \)

Se precisarían 124 participantes, casi el triple que para \(\rho = 0{,}40\). Este contraste ilustra la alta sensibilidad del tamaño muestral al valor de la correlación esperada, especialmente en el rango \(\rho < 0{,}30\).

Cómo interpretar el resultado

El valor \(n\) es el número mínimo de pares de observaciones (sujetos con las dos medidas requeridas) para detectar una correlación de Pearson \(\rho_1\) cuando la hipótesis nula es \(\rho = \rho_0\) (habitualmente \(\rho_0 = 0\)) con la potencia y el nivel de significación especificados. Redondea siempre hacia arriba. Si prevés que algunos sujetos no podrán ser medidos en ambas variables (pérdidas de seguimiento, datos faltantes), divide \(n\) entre \((1 - \text{tasa de pérdida})\) para obtener el reclutamiento necesario.

La fórmula utiliza la transformación \(z\) de Fisher \(z = \frac{1}{2}\ln\!\left(\frac{1+\rho}{1-\rho}\right)\) para estabilizar la varianza. Esta transformación es más precisa cuando \(n \geq 10\) y \(|\rho| < 0{,}9\); para correlaciones muy altas (\(|\rho| > 0{,}9\)) la aproximación puede subestimar el \(n\) necesario. Realiza un análisis de sensibilidad variando \(\rho_1\) en ±0,10: una correlación esperada de 0,5 en lugar de 0,6 puede exigir un 40–60 % más de pares. Si la correlación real resulta ser mayor de la esperada, el test tendrá más potencia de la planificada (lo que generalmente es una buena noticia), pero si resulta ser menor, el estudio puede quedar infrapotenciado.

Cuando el \(n\) calculado resulte muy pequeño (< 20 pares), verifica que la relación entre las variables es razonablemente lineal y que no hay valores atípicos influyentes, ya que la correlación de Pearson es sensible a ambos factores. Si los datos presentan no linealidad o colas pesadas, considera la correlación de Spearman y ajusta el \(n\) con un factor de eficiencia relativa. Con los datos recogidos, calcula la correlación y su IC con la calculadora de contraste de hipótesis para la correlación o realiza el contraste formal con la herramienta correspondiente.

Preguntas frecuentes

  • ¿Qué es la transformación z de Fisher? z = arctanh(ρ) = ½·ln((1+ρ)/(1−ρ)); convierte la distribución sesgada de r̂ en aproximadamente normal con varianza 1/(n−3), lo que permite aplicar la aproximación normal para derivar n directamente.
  • ¿Correlación negativa? El módulo |ρ| es lo que determina el tamaño muestral; la dirección (positiva o negativa) no afecta a n, aunque sí al tipo de contraste (usa unilateral si tienes una hipótesis direccional).
  • ¿Qué diferencia hay entre bilateral y unilateral? Bilateral (H₁: ρ ≠ 0) usa Z_{α/2} y es apropiado cuando no tienes hipótesis previa sobre el signo. Unilateral (H₁: ρ > 0) usa Z_α y da n ligeramente menor, pero exige justificación a priori.
  • ¿Funciona para correlación de Spearman o tau? La fórmula de Fisher es estricta para la correlación de Pearson con normalidad bivariada. Para Spearman puede usarse como aproximación, aunque con menor precisión.
  • ¿El tamaño muestral es exacto? Es una aproximación; funciona bien para n > 20. Para n muy pequeños, métodos exactos (simulación o tablas de potencia) son más precisos.