¿Puedo introducir p̂ directamente en lugar de x?

Introduce x = p̂ × n redondeado al entero más cercano; el resultado será equivalente.

¿Qué pasa si x = 0 o x = n?

Wald da un intervalo de anchura cero, lo cual no es útil. Wilson maneja estos casos correctamente.

¿Cuándo se cumple la condición de normalidad?

Cuando n·p̂ ≥ 5 y n·(1−p̂) ≥ 5. La calculadora te avisa si no se cumple.

Intervalo de confianza para una proporción

Calculadora

Introduce el número de éxitos y el tamaño muestral para obtener ambos intervalos.

Número de éxitos (x)

Tamaño muestral (n)

Nivel de confianza

Método

Nivel de confianza personalizado (0–1)

Resultado pendiente…

Explicación

Cuando queremos estimar la proporción real de una característica en una población (tasa de defectos, porcentaje de usuarios satisfechos, prevalencia de una enfermedad…), el intervalo de confianza para una proporción nos da el rango plausible para ese valor.

La proporción muestral \(\hat{p} = x/n\) (éxitos entre observaciones) es el estimador. Existen varios métodos para construir el intervalo; los más habituales son Wald (aproximación normal) y Wilson (más preciso para proporciones extremas o muestras pequeñas).

Denotamos por \(C\) el nivel de confianza y por \(\alpha=1-C\) el área total fuera del intervalo. Para un 95 % de confianza, \(C=0{,}95\), \(\alpha=0{,}05\) y \(\alpha/2=0{,}025\) en cada cola.

Método de Wald (aproximación normal)

Wald aplica directamente la aproximación normal a la proporción muestral \(\hat{p}\). Es el intervalo más sencillo y el más fácil de calcular a mano:

\( \hat{p} \pm z_{\alpha/2} \cdot \sqrt{\dfrac{\hat{p}(1-\hat{p})}{n}} \)

Funciona razonablemente bien cuando la muestra es grande y la proporción no está cerca de 0 ni de 1. Como regla práctica, conviene exigir \(n\hat{p} \geq 5\) y \(n(1-\hat{p}) \geq 5\), aunque con muestras moderadas esta regla no siempre garantiza una cobertura real buena.

Su principal limitación es que centra el intervalo exactamente en \(\hat{p}\) y usa un error estándar estimado solo con \(\hat{p}\). Por eso puede producir límites por debajo de 0 o por encima de 1, y puede subestimar la incertidumbre cuando hay pocos éxitos, pocos fracasos o proporciones extremas.

Método de Wilson (score, recomendado)

Wilson parte del contraste score para una proporción y resuelve qué valores de \(p\) serían compatibles con los datos. No se limita a sumar y restar el mismo margen alrededor de \(\hat{p}\); el centro del intervalo se desplaza ligeramente hacia valores menos extremos y los límites quedan dentro de \([0,1]\).

\( \dfrac{\hat{p} + \dfrac{z^2}{2n} \pm z\sqrt{\dfrac{\hat{p}(1-\hat{p})}{n} + \dfrac{z^2}{4n^2}}}{1 + \dfrac{z^2}{n}} \)

Wilson suele recomendarse porque mantiene mejor la cobertura real del nivel de confianza, especialmente con muestras pequeñas o proporciones cercanas a 0 o 1. También maneja correctamente casos extremos como \(x=0\) o \(x=n\), donde Wald puede dar intervalos degenerados o poco informativos.

Ejemplo resuelto

En una encuesta a 200 clientes, 134 declaran estar satisfechos. \(\hat{p} = 134/200 = 0{,}67\). Con 95 % de confianza (\(C=0{,}95\), \(\alpha=0{,}05\), \(z_{0{,}025}=1{,}960\)):

Con Wald, el error estándar es \(\sqrt{0{,}67\cdot0{,}33/200}\approx0{,}03325\), y el intervalo queda:

\( 0{,}67 \pm 1{,}960 \cdot 0{,}03325 \approx [0{,}605,\; 0{,}735] \)

Con Wilson, aplicando la fórmula score al mismo \(x=134\), \(n=200\) y \(z=1{,}960\), se obtiene:

\( IC_{Wilson} \approx [0{,}602,\;0{,}731] \)

En este ejemplo ambos métodos son parecidos porque la muestra es grande y la proporción no es extrema. Si hubiéramos observado muy pocos éxitos, muy pocos fracasos o una muestra pequeña, la diferencia sería mayor y Wilson sería la opción más fiable.

Supuestos para el IC de una proporción

Los datos deben proceder de ensayos Bernoulli: cada observación se clasifica como éxito o fracaso.
Las observaciones deben ser independientes; si se muestrea sin reemplazo en una población finita, la muestra debería ser pequeña respecto a la población o aplicarse una corrección específica.
La probabilidad de éxito debe ser la misma para todas las observaciones dentro del grupo analizado.
Para Wald se necesitan suficientes éxitos y fracasos: \(n\hat p\ge 5\) y \(n(1-\hat p)\ge 5\). Wilson es más fiable cuando esta condición es dudosa.

Diferencias entre Wald y Wilson

Aspecto	Wald	Wilson
Idea	Aproximación normal directa de \(\hat{p}\).	Intervalo score: valores de \(p\) compatibles con los datos.
Centro	Centrado en \(\hat{p}\).	Centro ajustado hacia valores menos extremos.
Límites	Puede salir de \([0,1]\).	Permanece dentro de \([0,1]\).
Cuándo usarlo	Muestras grandes, proporciones no extremas y cálculo rápido.	Uso general recomendado; especialmente si \(n\) es pequeño, \(\hat{p}\) es extrema o hay pocos éxitos/fracasos.

En resumen: Wald es útil como aproximación didáctica y rápida; Wilson es preferible como resultado principal porque respeta mejor la naturaleza binomial de los datos y evita límites imposibles.

¿Cuándo usar cada método?

Usa Wilson por defecto si quieres un intervalo robusto para la mayoría de situaciones.
Usa Wald solo como aproximación rápida cuando \(n\) es grande y hay suficientes éxitos y fracasos.
Evita Wald si \(x=0\), \(x=n\), \(n\) es pequeño o \(\hat{p}\) está cerca de 0 o 1.
Compara ambos si estás en una zona intermedia: si difieren mucho, interpreta Wald con cautela y prioriza Wilson.

Cómo interpretar el resultado

El intervalo \([L, U]\) es el rango de valores de la proporción poblacional \(p\) compatibles con los datos observados al nivel de confianza elegido. En términos frecuentistas: si repitieras el muestreo muchas veces y construyeras el IC con el mismo método, una proporción \(C\) de esos intervalos contendría el verdadero valor de \(p\). La amplitud depende del tamaño muestral \(n\) y de la propia proporción estimada \(\hat{p}\): la variabilidad es máxima cuando \(\hat{p} = 0{,}5\) y decrece al alejarse de ese valor. En el gráfico, la región verde bajo la curva normal estándar es la zona de confianza y las colas rojas (área \(\alpha/2\) cada una) delimitan los valores críticos \(\pm z_{\alpha/2}\).

Para reducir la amplitud del intervalo a la mitad manteniendo el mismo nivel de confianza, necesitas cuadruplicar el tamaño muestral, ya que el margen de error es proporcional a \(1/\sqrt{n}\). Aumentar la confianza del 95 % al 99 % amplía el intervalo porque \(z_{0{,}005} = 2{,}576 > z_{0{,}025} = 1{,}960\); es decir, exigir más certeza tiene el coste de una estimación menos precisa.

Wald vs. Wilson: cuando la condición \(n\hat{p} \geq 5\) y \(n(1-\hat{p}) \geq 5\) se cumple en ambos extremos, los dos métodos suelen dar resultados muy parecidos. Si la proporción es extrema o la muestra es pequeña, Wilson es más fiable porque el centro del intervalo se desplaza ligeramente hacia valores menos extremos y los límites siempre permanecen en \([0, 1]\).
Conexión con el contraste: si un valor de referencia \(p_0\) queda fuera del intervalo, los datos rechazarían \(H_0\!: p = p_0\) al nivel \(\alpha = 1 - C\) en el contraste bilateral equivalente. Si \(p_0\) queda dentro, no hay evidencia suficiente para rechazarlo.
Relevancia práctica: un IC muy estrecho indica alta precisión, pero recuerda que la precisión estadística y la relevancia práctica son conceptos distintos. Un intervalo del 67 % al 68 % es muy preciso pero podría ser irrelevante en contextos donde solo importa superar el 70 %.

Preguntas frecuentes

¿Puedo introducir p̂ directamente en lugar de x? Introduce x = p̂ × n redondeado al entero más cercano; el resultado será equivalente.
¿Qué pasa si x = 0 o x = n? Wald da un intervalo de anchura cero, lo cual no es útil. Wilson maneja estos casos correctamente.
¿Cuándo se cumple la condición de normalidad? Cuando n·p̂ ≥ 5 y n·(1−p̂) ≥ 5. La calculadora te avisa si no se cumple.

Referencia: Intervalo de confianza para una proporción — Wikipedia