Tamaño muestral

Calculadora de tamaño muestral para una proporción

Calcula el tamaño mínimo de muestra para estimar una proporción con un margen de error deseado.

Calculadora

Introduce tus supuestos y obtén el tamaño muestral mínimo recomendado para una proporción.

Resultado pendiente…

Explicación

Esta calculadora aplica la fórmula de Cochran para determinar el número mínimo de observaciones necesarias para estimar una proporción poblacional \(p\) con una precisión preestablecida. El objetivo es que el intervalo de confianza resultante tenga un semiancho máximo igual al margen de error \(E\).

El parámetro más influyente es la proporción esperada \(p\): la varianza de una proporción es \(p(1-p)\), que alcanza su máximo en \(p = 0{,}5\). Por eso, si no tienes información previa, usar \(p = 0{,}5\) garantiza que la muestra será suficiente cualquiera que sea el valor real.

Esta fórmula asume muestreo aleatorio simple en una población muy grande. Si la muestra representará más del 5 % del total, usa la calculadora con corrección por población finita.

Fórmula de tamaño muestral

\( n = \frac{Z^2 \cdot p \cdot (1-p)}{E^2} \)

  • n: tamaño muestral mínimo (siempre se redondea al entero superior).
  • Z: cuantil normal para el nivel de confianza elegido — 1,645 (90 %), 1,960 (95 %), 2,576 (99 %).
  • p: proporción esperada. Usa 0,5 si no tienes información previa.
  • E: margen de error absoluto (semiancho del intervalo de confianza deseado).

Interpretación del margen de error

Un margen E = 0,05 significa que tu estimación muestral \(\hat{p}\) puede diferir del valor poblacional real en ±5 puntos porcentuales, con la probabilidad marcada por el nivel de confianza. Por ejemplo, si obtienes \(\hat{p} = 0{,}62\) con E = 0,05 al 95 %, puedes afirmar con 95 % de confianza que la proporción verdadera está entre el 57 % y el 67 %. Reducir E a la mitad cuadruplica la muestra necesaria, ya que n es proporcional a 1/E².

Configuración rápida

  • Si no conoces p: usa 0,5 — es el escenario conservador que maximiza la varianza y, por tanto, el tamaño muestral.
  • Si tienes datos piloto: usa la proporción observada; la muestra resultante será menor si \(p\) se aleja de 0,5.
  • Nivel de confianza: 95 % es el estándar en ciencias sociales y de la salud; usa 99 % en decisiones de alto impacto.
  • Margen de error E: entre 0,03 y 0,05 es habitual en encuestas; en estudios de prevalencia clínica puede necesitarse E = 0,01–0,02.
  • Pérdidas esperadas: divide n entre (1 − tasa de no respuesta esperada). Con 15 % de abandono: n_reclutado = n / 0,85.

Ejemplo sencillo

Quieres estimar el porcentaje de clientes satisfechos. Con p = 0,5, 95 % de confianza y error máximo ±5 % (E = 0,05) el resultado es n ≈ 385. Si reduces el margen a ±3 % (E = 0,03), la muestra sube a 1 068.

Usos frecuentes

  • Encuestas de satisfacción, opinión y preferencias del consumidor.
  • Estimación de tasas de prevalencia o incidencia en salud pública.
  • Control de calidad: porcentaje de defectos o no conformidades.
  • Sondeos electorales e intención de voto.

Supuestos del modelo

  • Muestreo aleatorio simple (cada unidad tiene la misma probabilidad de selección).
  • Población muy grande respecto a la muestra (n/N < 5 %). Si no se cumple, aplica la corrección por población finita.
  • La aproximación normal es válida cuando n·p ≥ 5 y n·(1−p) ≥ 5.

Ejemplo resuelto

Una tienda de comercio electrónico quiere estimar la proporción de visitantes que completan una compra (tasa de conversión). Datos de sesiones anteriores sugieren que esta proporción es de aproximadamente \(p = 0{,}08\) (8 %). El equipo de analítica quiere una estimación con un margen de error de \(E = 0{,}02\) (±2 puntos porcentuales) y un nivel de confianza del 95 % (\(Z = 1{,}960\)).

Aplicamos la fórmula de Cochran con los valores conocidos:

\( n = \frac{Z^2 \cdot p \cdot (1-p)}{E^2} = \frac{(1{,}960)^2 \times 0{,}08 \times 0{,}92}{(0{,}02)^2} = \frac{3{,}8416 \times 0{,}0736}{0{,}0004} = \frac{0{,}2828}{0{,}0004} = 707 \)

Se necesitan al menos 707 visitantes observados. Dado que no todos los visitantes tendrán un seguimiento completo de la sesión (abandonos, fallos de tracking), se anticipa una tasa de no respuesta o datos incompletos del 10 %. Por tanto, el número de sesiones a registrar es:

\( n_{\text{ajustado}} = \frac{707}{1 - 0{,}10} = \frac{707}{0{,}90} \approx 786 \text{ sesiones} \)

El equipo configurará el sistema de analítica para recoger datos de 786 sesiones consecutivas, con lo que espera poder estimar la tasa de conversión con una precisión de ±2 puntos porcentuales al 95 % de confianza.

Escenario conservador (p desconocida): si no se dispusiese de datos previos sobre la tasa de conversión, la práctica habitual es usar \(p = 0{,}5\), que maximiza la varianza \(p(1-p)\) y por tanto el tamaño muestral necesario: \( n = (1{,}960)^2 \times 0{,}5 \times 0{,}5 / (0{,}02)^2 = 3{,}8416 \times 0{,}25 / 0{,}0004 = 2\,401 \). Esta muestra conservadora garantiza precisión de ±2 pp independientemente del valor real de la proporción, a costa de requerir más de tres veces más sesiones que la estimación informada.

Cómo interpretar el resultado

El \(n\) calculado es el mínimo de respuestas válidas necesarias para que el intervalo de confianza no supere el margen de error \(E\) especificado. Siempre redondea hacia arriba. Ten en cuenta que este \(n\) representa respuestas completas y aprovechables, no simplemente el número de encuestas enviadas o individuos contactados. Si esperas una tasa de no respuesta o de exclusión del \(r\,\%\), el número de individuos a contactar es \(\lceil n / (1 - r) \rceil\); con un 20 % de pérdida, por ejemplo, deberás contactar a \(\lceil n / 0{,}80 \rceil\) personas.

La proporción \(p\) es el parámetro más influyente y, a menudo, el más incierto. La función \(p(1-p)\) alcanza su máximo en \(p = 0{,}5\), que es también el escenario más conservador: usar \(p = 0{,}5\) cuando se desconoce la proporción real garantiza que \(n\) nunca sea insuficiente. Si dispones de un estudio piloto o datos previos que apuntan a un valor diferente de \(p\), úsalo para obtener un \(n\) más ajustado, pero haz un análisis de sensibilidad variando \(p\) entre \(\pm 0{,}1\) para ver cuánto varía el resultado; en la zona central (\(p\) entre 0,3 y 0,7) la variación de \(n\) suele ser modesta, pero en los extremos (\(p < 0{,}1\) o \(p > 0{,}9\)) una pequeña diferencia en \(p\) puede alterar \(n\) de forma importante.

Si el \(n\) resultante es inviable, las palancas disponibles son: (1) aumentar \(E\) (aceptar menor precisión), (2) reducir el nivel de confianza (p. ej., pasar del 95 % al 90 %), o (3) restringir la población objetivo para que sea más homogénea. Una vez recopilados los datos, utiliza la calculadora de intervalo de confianza para una proporción para obtener el IC real; o la calculadora de contraste de hipótesis si quieres comparar \(\hat{p}\) frente a un valor de referencia.

Referencias y lecturas adicionales

  • Wikipedia: Tamaño de la muestra — fórmulas generales y contexto estadístico.
  • Wikipedia: Margen de error — definición e interpretación en encuestas.
  • Wikipedia (en): Sample size determination — derivación completa y variantes de la fórmula.
  • Cochran, W. G. (1977). Sampling Techniques (3.ª ed.). Wiley. — referencia clásica de la fórmula.

Preguntas frecuentes

  • ¿Por qué p = 0,5 da el mayor tamaño muestral? Porque la varianza p(1−p) se maximiza en p = 0,5, haciendo la estimación más difícil.
  • ¿Qué pasa si p es muy pequeña (ej. 0,02)? La muestra cae mucho, pero la aproximación normal puede no ser adecuada. Considera intervalos exactos de Wilson o Clopper-Pearson.
  • ¿Cuándo aplico la corrección por población finita? Cuando la fracción de muestreo n/N supera el 5 %. Si N = 500 y n estimado es 50, la corrección es relevante.
  • ¿El resultado es exacto? Es la muestra mínima teórica bajo los supuestos indicados. Las condiciones reales pueden requerir ajustes (estratificación, conglomerados, etc.).