¿Qué es la w de Cohen?

Es una medida de tamaño de efecto para tests chi-cuadrado: w = sqrt(χ²/N). Valores orientativos: 0,1 (pequeño), 0,3 (mediano), 0,5 (grande). Para tablas 2×2 puede calcularse a partir de las proporciones de los dos grupos.

¿Cómo elijo los grados de libertad?

Para una tabla r×c, los grados de libertad son df=(r-1)(c-1). Para una tabla 2×2 es df=1; para 2×3 es df=2; para 3×3 es df=4, etc.

¿Cómo calculo w a partir de dos proporciones en una tabla 2×2?

Con p1 y p2 las proporciones en los dos grupos: w = |p1-p2| / (2·sqrt(p_media·(1-p_media))) donde p_media = (p1+p2)/2. La calculadora incluye un asistente para este cálculo.

¿Qué distribución se usa para calcular la potencia?

La potencia se calcula usando la distribución chi-cuadrado no central con parámetro de no centralidad λ=N·w². Esta distribución se aproxima mediante la mezcla de Poisson de chi-cuadrados centrales.

Tamaño muestral chi-cuadrado independencia

Calculadora

Introduce la w de Cohen, los grados de libertad de la tabla, el nivel de significación y la potencia deseada.

Tamaño de efecto w de Cohen

Grados de libertad df = (r−1)(c−1)

Alfa (α)

Potencia (1-β)

Resultado pendiente…

Asistente para tablas 2×2: calcular w desde p₁ y p₂

Introduce las proporciones de los dos grupos para calcular automáticamente w y actualizarla en el campo superior.

Proporción grupo 1 (p₁)

Proporción grupo 2 (p₂)

Explicación

El test chi-cuadrado de independencia contrasta si dos variables categóricas son independientes en una tabla de contingencia \(r \times c\). Bajo \(H_0\) el estadístico \(\chi^2\) sigue una distribución chi-cuadrado con \(df = (r-1)(c-1)\) grados de libertad.

Bajo la alternativa, \(\chi^2\) sigue una distribución chi-cuadrado no central con parámetro de no centralidad \(\lambda = N \cdot w^2\), donde \(N\) es el tamaño total de la muestra y \(w\) es la \(w\) de Cohen.

Parámetro de no centralidad y potencia

\( \lambda = N \cdot w^2 \)

\( \text{Potencia} = 1 - F_{\chi^2_{df,\,\lambda}}\!\left(\chi^2_{1-\alpha,\,df}\right) \)

La distribución chi-cuadrado no central se evalúa exactamente mediante la mezcla de Poisson de chi-cuadrados centrales:

\( F_{\chi^2_{df,\lambda}}(x) = \sum_{k=0}^{\infty} \frac{e^{-\lambda/2}(\lambda/2)^k}{k!} \cdot F_{\chi^2_{df+2k}}(x) \)

W de Cohen para tablas 2×2

Con \(p_1\) y \(p_2\) las proporciones en los dos grupos y \(\bar{p} = (p_1+p_2)/2\):

\( w = \frac{|p_1 - p_2|}{2\sqrt{\bar{p}(1-\bar{p})}} \)

Valores orientativos según Cohen (1988): \(w = 0{,}1\) (efecto pequeño), \(w = 0{,}3\) (mediano), \(w = 0{,}5\) (grande).

Configuración rápida

w: 0,1 para efectos sutiles, 0,3 para efectos moderados (el más habitual), 0,5 para efectos grandes. Para tablas 2×2 usa el asistente.
df: (número de filas − 1) × (número de columnas − 1). Para tablas 2×2, df=1.
α: 0,05 es el estándar.
Potencia: 0,80 como mínimo frecuente; 0,90 para estudios confirmatorios.

Ejemplo resuelto

Un investigador quiere estudiar si existe asociación entre el género (2 categorías) y la preferencia por tres tipos de producto (3 categorías), es decir, una tabla 2×3. Espera un efecto mediano (\(w = 0{,}3\)) con \(\alpha = 0{,}05\) y potencia del 80 %. Los grados de libertad son \(df = (2-1)(3-1) = 2\).

La calculadora devuelve aproximadamente \(N = 107\) observaciones en total. Con esa muestra, si la asociación real tiene un tamaño de efecto \(w \geq 0{,}3\), el test la detectará el 80 % de las veces.

Tabla 2×2 con asistente: si p₁ = 0,40 y p₂ = 0,60, la \(\bar{p} = 0{,}50\) y \(w = |0{,}40-0{,}60|/(2\sqrt{0{,}5 \times 0{,}5}) = 0{,}20/1{,}00 = 0{,}20\). Con df=1, α=0,05 y potencia=0,80 se necesitan N ≈ 197 observaciones.

Supuestos del modelo

Muestra aleatoria de observaciones independientes.
Dos variables categóricas cruzadas en una tabla de contingencia; cada unidad contribuye a una sola celda.
Frecuencias esperadas \(\ge 5\) en la mayoría de las celdas.
Efecto medido con la \(w\) de Cohen y \((\text{filas}-1)(\text{columnas}-1)\) grados de libertad sobre la chi-cuadrado no central.

Cómo interpretar el resultado

El valor \(N\) es el número total de observaciones (suma de todas las celdas de la tabla de contingencia) para que el test chi-cuadrado de independencia detecte la asociación especificada con la potencia y el nivel de significación deseados. Redondea siempre hacia arriba. En un diseño donde se fija el tamaño de cada fila (p. ej., grupos de estudio y control), divide \(N\) entre el número de filas para obtener el tamaño de cada grupo; en un muestreo irrestricto, \(N\) es simplemente el total de sujetos. Añade un margen por pérdidas dividiendo entre \((1 - \text{tasa de pérdida})\).

El tamaño del efecto \(w\) de Cohen se calcula a partir de las frecuencias esperadas bajo \(H_1\): \(w = \sqrt{\sum_{ij}(p_{1,ij} - p_{0,ij})^2 / p_{0,ij}}\), donde \(p_{0,ij} = p_{i\cdot} \times p_{\cdot j}\) son las proporciones bajo independencia. Los valores de referencia son \(w = 0{,}10\) (efecto pequeño), \(w = 0{,}30\) (mediano) y \(w = 0{,}50\) (grande). La condición de aplicabilidad más importante es que las frecuencias esperadas en cada celda bajo \(H_0\) —calculadas como \(N \times p_{0,ij}\)— sean todas \(\geq 5\); si no, el estadístico chi-cuadrado puede no seguir la distribución chi-cuadrado y el p-valor sería poco fiable. Cuando varias celdas tengan frecuencias esperadas bajas, fusiona categorías con sentido sustantivo y reduce los grados de libertad \((r-1)(c-1)\) del test.

Si el \(N\) resultante es inviable, revisa si el tamaño del efecto especificado es realista: una asociación muy débil puede requerir miles de observaciones. Considera si puede ampliarse el rango de variación de alguna de las variables categóricas o si algunas categorías pueden fusionarse para concentrar el efecto. Cuando la tabla es \(2 \times 2\) y el \(N\) es pequeño, el test exacto de Fisher es más apropiado que el chi-cuadrado; en ese caso, usa la calculadora de tamaño muestral para el test de Fisher. Con los datos recogidos, realiza el análisis con la calculadora de chi-cuadrado de independencia e interpreta los residuos tipificados de cada celda para localizar la fuente de la asociación.

Referencias

Cohen, J. (1988). Statistical Power Analysis for the Behavioral Sciences (2.ª ed.). Lawrence Erlbaum Associates.
Agresti, A. (2013). Categorical Data Analysis (3.ª ed.). Wiley.