¿Es válido para grupos dependientes?

No; para datos emparejados se necesita un método específico para proporciones apareadas.

¿Qué mide exactamente?

Si la diferencia observada entre \(p_1\) y \(p_2\) puede explicarse por azar bajo \(H_0\).

¿Qué tamaño de muestra se recomienda?

Cuanto mayor, mejor precisión; con muestras pequeñas la potencia puede ser limitada.

¿Qué debo reportar además del p-valor?

Diferencia de proporciones, intervalo de confianza y contexto práctico de la decisión.

¿Aquí también hay caso de desviación típica poblacional conocida?

No como en contrastes de medias. En dos proporciones la variabilidad bajo \(H_0\) se estima con la proporción combinada \(\hat{p}\), por eso no se elige entre test z o t según \(\sigma\).

Contraste de hipótesis para dos proporciones

Calculadora

Calculadora online: introduce éxitos y tamaño muestral de cada grupo para obtener p-valor y decisión.

Éxitos grupo 1 (x₁)

Tamaño grupo 1 (n₁)

Éxitos grupo 2 (x₂)

Tamaño grupo 2 (n₂)

Tipo de contraste

Nivel de significación (α)

Resultado pendiente…

Explicación

Se usa cuando comparas dos grupos independientes con resultados binarios. En \(H_0\), se asume \(p_1 = p_2\) y se utiliza una proporción combinada para el error estándar, porque bajo la hipótesis nula ambos grupos comparten la misma probabilidad de éxito.

Este planteamiento permite evaluar de forma coherente si la diferencia observada responde a una fluctuación muestral o a un cambio estructural entre condiciones.

Hipótesis y estadístico

\(H_0: p_1 - p_2 = 0\)

\( z = \frac{\hat{p}_1 - \hat{p}_2}{\sqrt{\hat{p}(1-\hat{p})(1/n_1 + 1/n_2)}} \)

\(\hat{p}=\frac{x_1+x_2}{n_1+n_2}\)

\(\hat{p}_1 = x_1/n_1\): proporción muestral observada en el grupo 1.
\(\hat{p}_2 = x_2/n_2\): proporción muestral observada en el grupo 2.
\(x_1, x_2\): número de éxitos en cada grupo.
\(n_1, n_2\): tamaños de los grupos 1 y 2.
\(\hat{p}\): proporción combinada bajo \(H_0\) (estimación conjunta de la proporción común a ambos grupos).

Contraste rápido

Bajo \(H_0\), ambas muestras comparten la misma proporción poblacional desconocida. La estimación conjunta natural de esa proporción común es \(\hat{p}=(x_1+x_2)/(n_1+n_2)\).

Por eso el error estándar del contraste se construye con \(\hat{p}\), coherente con la hipótesis nula de igualdad \(p_1=p_2\).

Ejemplo resuelto: comparación de conversiones

Una versión A consigue 420 conversiones de 10.000 visitas y una versión B consigue 480 de 10.000. Introduce éxitos y tamaños de ambos grupos para obtener z, p-valor y decisión. Además de significación, revisa la diferencia absoluta: 4,8% − 4,2% = 0,6 puntos porcentuales.

Cómo interpretar el resultado

Rechazar \(H_0\) (p-valor < α) indica que la diferencia observada entre \(\hat{p}_1\) y \(\hat{p}_2\) es estadísticamente incompatible con la hipótesis de igualdad poblacional. En términos prácticos, hay evidencia de que las dos condiciones, grupos o versiones producen tasas de éxito distintas. Sin embargo, la magnitud de la diferencia importa tanto como su significación: en A/B testing, una diferencia de 0,5 puntos porcentuales puede ser estadísticamente significativa con tráfico masivo pero tener un impacto de negocio despreciable. Reporta la diferencia estimada \(\hat{p}_1 - \hat{p}_2\) y su intervalo de confianza para contextualizar el resultado.

No rechazar \(H_0\) (p-valor ≥ α) no prueba que las proporciones sean iguales: solo indica que los datos son compatibles con esa igualdad al nivel elegido. Con muestras pequeñas, el test puede no tener potencia suficiente para detectar diferencias reales. Antes de concluir que no existe efecto, comprueba que el tamaño muestral era adecuado para detectar la diferencia mínima de interés práctico.

El estadístico z mide cuántos errores estándar se aleja la diferencia muestral de cero, usando la proporción combinada \(\hat{p}\) para estimar la varianza bajo \(H_0\). En la visualización, la zona verde corresponde a la región de no rechazo, las zonas rojas son las regiones críticas y la línea ámbar señala el estadístico observado. Para reforzar la interpretación, considera calcular el riesgo relativo o el número necesario a tratar (NNT), que ofrecen una perspectiva más directa del impacto práctico.

Preguntas frecuentes

¿Es válido para grupos dependientes? No; para datos emparejados se necesita un método específico para proporciones apareadas.
¿Qué mide exactamente? Si la diferencia observada entre \(p_1\) y \(p_2\) puede explicarse por azar bajo \(H_0\).
¿Qué tamaño de muestra se recomienda? Cuanto mayor, mejor precisión; con muestras pequeñas la potencia puede ser limitada.
¿Qué debo reportar además del p-valor? Diferencia de proporciones, intervalo de confianza y contexto práctico de la decisión.
¿Aquí también hay caso de desviación típica poblacional conocida? No como en contrastes de medias. En dos proporciones la variabilidad bajo \(H_0\) se estima con la proporción combinada \(\hat{p}\), por eso no se elige entre test z o t según \(\sigma\).