Tamaño muestral

Calculadora de tamaño muestral para chi-cuadrado de independencia

Calcula el tamaño de muestra necesario para el test chi-cuadrado de independencia con una potencia objetivo, usando la \(w\) de Cohen y la distribución chi-cuadrado no central exacta.

Calculadora

Introduce la w de Cohen, los grados de libertad de la tabla, el nivel de significación y la potencia deseada.

Resultado pendiente…
Asistente para tablas 2×2: calcular w desde p₁ y p₂

Introduce las proporciones de los dos grupos para calcular automáticamente w y actualizarla en el campo superior.

Explicación

El test chi-cuadrado de independencia contrasta si dos variables categóricas son independientes en una tabla de contingencia \(r \times c\). Bajo \(H_0\) el estadístico \(\chi^2\) sigue una distribución chi-cuadrado con \(df = (r-1)(c-1)\) grados de libertad.

Bajo la alternativa, \(\chi^2\) sigue una distribución chi-cuadrado no central con parámetro de no centralidad \(\lambda = N \cdot w^2\), donde \(N\) es el tamaño total de la muestra y \(w\) es la \(w\) de Cohen.

Parámetro de no centralidad y potencia

\( \lambda = N \cdot w^2 \)

\( \text{Potencia} = 1 - F_{\chi^2_{df,\,\lambda}}\!\left(\chi^2_{1-\alpha,\,df}\right) \)

La distribución chi-cuadrado no central se evalúa exactamente mediante la mezcla de Poisson de chi-cuadrados centrales:

\( F_{\chi^2_{df,\lambda}}(x) = \sum_{k=0}^{\infty} \frac{e^{-\lambda/2}(\lambda/2)^k}{k!} \cdot F_{\chi^2_{df+2k}}(x) \)

W de Cohen para tablas 2×2

Con \(p_1\) y \(p_2\) las proporciones en los dos grupos y \(\bar{p} = (p_1+p_2)/2\):

\( w = \frac{|p_1 - p_2|}{2\sqrt{\bar{p}(1-\bar{p})}} \)

Valores orientativos según Cohen (1988): \(w = 0{,}1\) (efecto pequeño), \(w = 0{,}3\) (mediano), \(w = 0{,}5\) (grande).

Configuración rápida

  • w: 0,1 para efectos sutiles, 0,3 para efectos moderados (el más habitual), 0,5 para efectos grandes. Para tablas 2×2 usa el asistente.
  • df: (número de filas − 1) × (número de columnas − 1). Para tablas 2×2, df=1.
  • α: 0,05 es el estándar.
  • Potencia: 0,80 como mínimo frecuente; 0,90 para estudios confirmatorios.

Ejemplo resuelto

Un investigador quiere estudiar si existe asociación entre el género (2 categorías) y la preferencia por tres tipos de producto (3 categorías), es decir, una tabla 2×3. Espera un efecto mediano (\(w = 0{,}3\)) con \(\alpha = 0{,}05\) y potencia del 80 %. Los grados de libertad son \(df = (2-1)(3-1) = 2\).

La calculadora devuelve aproximadamente \(N = 107\) observaciones en total. Con esa muestra, si la asociación real tiene un tamaño de efecto \(w \geq 0{,}3\), el test la detectará el 80 % de las veces.

Tabla 2×2 con asistente: si p₁ = 0,40 y p₂ = 0,60, la \(\bar{p} = 0{,}50\) y \(w = |0{,}40-0{,}60|/(2\sqrt{0{,}5 \times 0{,}5}) = 0{,}20/1{,}00 = 0{,}20\). Con df=1, α=0,05 y potencia=0,80 se necesitan N ≈ 197 observaciones.

Cómo interpretar el resultado

El valor \(N\) es el número total de observaciones (suma de todas las celdas de la tabla de contingencia) para que el test chi-cuadrado de independencia detecte la asociación especificada con la potencia y el nivel de significación deseados. Redondea siempre hacia arriba. En un diseño donde se fija el tamaño de cada fila (p. ej., grupos de estudio y control), divide \(N\) entre el número de filas para obtener el tamaño de cada grupo; en un muestreo irrestricto, \(N\) es simplemente el total de sujetos. Añade un margen por pérdidas dividiendo entre \((1 - \text{tasa de pérdida})\).

El tamaño del efecto \(w\) de Cohen se calcula a partir de las frecuencias esperadas bajo \(H_1\): \(w = \sqrt{\sum_{ij}(p_{1,ij} - p_{0,ij})^2 / p_{0,ij}}\), donde \(p_{0,ij} = p_{i\cdot} \times p_{\cdot j}\) son las proporciones bajo independencia. Los valores de referencia son \(w = 0{,}10\) (efecto pequeño), \(w = 0{,}30\) (mediano) y \(w = 0{,}50\) (grande). La condición de aplicabilidad más importante es que las frecuencias esperadas en cada celda bajo \(H_0\) —calculadas como \(N \times p_{0,ij}\)— sean todas \(\geq 5\); si no, el estadístico chi-cuadrado puede no seguir la distribución chi-cuadrado y el p-valor sería poco fiable. Cuando varias celdas tengan frecuencias esperadas bajas, fusiona categorías con sentido sustantivo y reduce los grados de libertad \((r-1)(c-1)\) del test.

Si el \(N\) resultante es inviable, revisa si el tamaño del efecto especificado es realista: una asociación muy débil puede requerir miles de observaciones. Considera si puede ampliarse el rango de variación de alguna de las variables categóricas o si algunas categorías pueden fusionarse para concentrar el efecto. Cuando la tabla es \(2 \times 2\) y el \(N\) es pequeño, el test exacto de Fisher es más apropiado que el chi-cuadrado; en ese caso, usa la calculadora de tamaño muestral para el test de Fisher. Con los datos recogidos, realiza el análisis con la calculadora de chi-cuadrado de independencia e interpreta los residuos tipificados de cada celda para localizar la fuente de la asociación.

Referencias

  • Cohen, J. (1988). Statistical Power Analysis for the Behavioral Sciences (2.ª ed.). Lawrence Erlbaum Associates.
  • Agresti, A. (2013). Categorical Data Analysis (3.ª ed.). Wiley.