¿Qué significa el margen de error E para la diferencia de proporciones?

Es la máxima desviación tolerable entre la diferencia estimada p̂₁−p̂₂ y la diferencia poblacional real p₁−p₂. Por ejemplo, E=0,08 significa que la estimación puede diferir del valor real en como mucho 8 puntos porcentuales.

¿Qué valores usar si no conozco p₁ y p₂?

El escenario más conservador es p₁=0,5 y p₂=0,5, que maximiza la varianza de la diferencia y da el mayor tamaño muestral para cualquier margen de error dado.

¿El tamaño muestral es exacto?

No. Depende de los valores supuestos de p₁ y p₂, que deben estimarse de datos piloto o de la literatura. Añade un margen del 10–20 % para compensar pérdidas.

Tamaño muestral diferencia proporciones

Calculadora

Calcula el número mínimo de observaciones por grupo (asignación 1:1) para estimar p₁ − p₂ con precisión objetivo.

Proporción esperada grupo 1 (p₁)

Proporción esperada grupo 2 (p₂)

Margen de error (E)

Nivel de confianza

Resultado pendiente…

Explicación

Esta calculadora determina el número mínimo de observaciones por grupo para estimar la diferencia \(p_1 - p_2\) entre dos proporciones independientes con un margen de error absoluto máximo \(E\) y un nivel de confianza dado. Es el punto de partida para planificar estudios comparativos entre dos grupos antes de recoger los datos.

Los dos parámetros clave son las proporciones esperadas en cada grupo. Si no dispones de estimaciones previas, el escenario conservador es \(p_1 = p_2 = 0{,}5\), que maximiza la suma \(p_1(1-p_1) + p_2(1-p_2)\) y por tanto el tamaño muestral. En la práctica, usar proporciones informadas de datos piloto o literatura reduce considerablemente la muestra necesaria.

La fórmula asume asignación equilibrada (mismo número de sujetos en cada grupo) y muestreo aleatorio de dos poblaciones muy grandes. El margen de error \(E\) se aplica a la diferencia \(p_1-p_2\), no a cada proporción por separado.

Fórmula de tamaño muestral

\( n = \frac{Z^2 \cdot \left[p_1(1-p_1) + p_2(1-p_2)\right]}{E^2} \)

n: número mínimo de observaciones por grupo (total N = 2n).
Z: cuantil normal — 1,645 (90 %), 1,960 (95 %), 2,576 (99 %).
\(p_1, p_2\): proporciones esperadas en cada grupo.
E: margen de error absoluto máximo para la diferencia \(p_1 - p_2\).

Interpretación del margen de error

Un margen \(E = 0{,}10\) significa que la diferencia estimada \(\hat{p}_1 - \hat{p}_2\) puede diferir del valor poblacional real \(p_1 - p_2\) en como mucho ±10 puntos porcentuales con la confianza elegida. Si la diferencia esperada entre grupos es pequeña, el margen de error debe serlo también, lo que requiere muestras más grandes. Compara siempre el margen de error con la diferencia real esperada: un E mayor que esa diferencia hace el estudio inútil para detectarla.

Configuración rápida

p₁ y p₂: tómalas de datos piloto o de la literatura. Si no tienes información, usa ambas en 0,5.
Margen de error E: defínelo en puntos porcentuales absolutos. Para diferencias esperadas de 10–20 pp, un margen de ±5–8 pp suele ser razonable.
Nivel de confianza: 95 % es el estándar habitual.
Pérdidas esperadas: divide n por grupo entre (1 − tasa de pérdida). Con 15 % de abandono: n_reclutar = n / 0,85.
Desigualdad entre grupos: si necesitas un número diferente en cada grupo, la fórmula con ratio de asignación k = n₂/n₁ es más adecuada.

Ejemplo resuelto

Un investigador quiere estimar la diferencia en la tasa de adherencia a tratamiento entre dos intervenciones: la intervención A tiene una adherencia esperada de \(p_1 = 0{,}60\) y la B de \(p_2 = 0{,}40\), según datos de estudios similares. Se fija un margen de error de \(E = 0{,}10\) (±10 pp) con nivel de confianza del 95 % (\(Z = 1{,}960\)).

Aplicamos la fórmula:

\( n = \frac{(1{,}960)^2 \cdot [0{,}60 \cdot 0{,}40 + 0{,}40 \cdot 0{,}60]}{(0{,}10)^2} = \frac{3{,}8416 \times 0{,}48}{0{,}01} = \frac{1{,}844}{0{,}01} = 184{,}4 \rightarrow n = 185 \text{ por grupo} \)

Se necesitan 185 participantes por grupo, es decir 370 en total. Con una tasa de abandono esperada del 12 %, el número a reclutar por grupo es 185 / 0,88 ≈ 210, y el total a reclutar 420.

Análisis de sensibilidad: si el margen se reduce a ±5 pp (E = 0,05), la muestra sube a n = 3,8416 × 0,48 / 0,0025 = 737 por grupo (1 474 total). Definir bien el margen es crítico para la viabilidad del estudio.

Escenario conservador: sin información previa (\(p_1 = p_2 = 0{,}5\)), con E = 0,10: n = 3,8416 × 0,50 / 0,01 = 193 por grupo.

Supuestos del modelo

Muestreo aleatorio simple e independiente en dos poblaciones muy grandes.
Las dos muestras son independientes entre sí (no hay emparejamiento unidad a unidad).
La aproximación normal es adecuada cuando \(n_i \hat{p}_i \geq 5\) y \(n_i(1-\hat{p}_i) \geq 5\) en ambos grupos.
Asignación equilibrada 1:1. Si se necesitan grupos de distinto tamaño, ajusta la fórmula con el ratio de asignación.

Usos frecuentes

Comparación de tasas de satisfacción, adherencia o conversión entre dos grupos o segmentos.
Estimación de la diferencia en prevalencia entre dos poblaciones (hombres vs. mujeres, regiones, periodos).
Diseño de encuestas comparativas antes/después en estudios epidemiológicos transversales.
Planificación de experimentos A/B descriptivos donde el objetivo es caracterizar la diferencia, no contrastar hipótesis.

Cómo interpretar el resultado

El valor \(n\) es el mínimo de observaciones válidas por grupo para que el intervalo de confianza de la diferencia \(p_1 - p_2\) tenga un semiancho máximo de \(E\) con el nivel de confianza elegido. En un diseño balanceado, el número total de participantes a reclutar es \(2n\). Redondea siempre hacia arriba y añade el margen por pérdidas dividiendo entre \((1 - \text{tasa de abandono})\) por grupo; con un 10 % de abandono esperado, planifica \(\lceil n / 0{,}90 \rceil\) individuos por grupo.

Las proporciones \(p_1\) y \(p_2\) son los parámetros más críticos e inciertos. La varianza de la diferencia depende de \(p_1(1-p_1) + p_2(1-p_2)\), que es máxima cuando ambas están cerca de 0,5. Realiza un análisis de sensibilidad variando \(p_1\) y \(p_2\) en ±0,10 alrededor de los valores esperados: cuando ambas sean extremas (\(<0{,}10\) o \(>0{,}90\)), la varianza disminuye y el \(n\) puede ser menor de lo que se esperaría intuitivamente. Si no tienes información previa, usa \(p_1 = p_2 = 0{,}5\) para el escenario más conservador. También evalúa distintos valores de \(E\): reducir el margen de error a la mitad cuadruplica \(n\).

Este enfoque (IC) difiere del de contraste de hipótesis: aquí el objetivo es estimar la magnitud de la diferencia con cierta precisión, no decidir si existe. Si lo que necesitas es detectar si \(p_1 \neq p_2\) con determinada potencia, usa la calculadora de contraste para dos proporciones. Una vez recogidos los datos, construye el IC real con la calculadora de intervalo de confianza para diferencia de proporciones. Si las frecuencias esperadas en alguna celda son pequeñas (< 5), considera el test exacto de Fisher.

Referencias y lecturas adicionales

Fleiss, J. L., Levin, B., & Paik, M. C. (2003). Statistical Methods for Rates and Proportions (3.ª ed.). Wiley.
Newcombe, R. G. (1998). Interval estimation for the difference between independent proportions, Statistics in Medicine, 17, 873–890.
Wikipedia (en): Sample size determination — derivación para diferencia de proporciones.

Preguntas frecuentes

¿Cuándo es conservador usar p₁=p₂=0,5? Siempre que no tengas información previa. Maximiza la varianza de cada grupo y por tanto el tamaño muestral necesario.
¿Qué pasa si los grupos son muy distintos en tamaño? Si no puedes tener el mismo n en cada grupo, la eficiencia disminuye. Con ratio k=n₂/n₁, el n por grupo mayor crece en proporción.
¿Este cálculo sirve para contrastar hipótesis? No directamente. Para detectar una diferencia con potencia y nivel de significación dados, usa la calculadora de dos proporciones para contraste H0.