¿Qué es el margen de error?

Es la precisión máxima tolerada respecto al valor real.

¿Qué significa nivel de confianza?

El porcentaje de veces que el procedimiento capturaría el valor poblacional verdadero.

¿Qué es la potencia estadística?

La probabilidad de detectar un efecto real cuando existe.

¿El tamaño muestral es exacto?

No, depende de supuestos y redondeos prácticos de diseño.

Calculadora de tamaño muestral para una media

Calculadora

Calcula el tamaño muestral necesario para estimar una media con precisión objetivo.

Desviación estándar (σ)

Margen de error (E)

Nivel de confianza

Resultado pendiente…

Explicación

Esta calculadora determina el número mínimo de observaciones para estimar una media poblacional \(\mu\) con un margen de error absoluto máximo \(E\) y un nivel de confianza dado. Es el cálculo análogo al de una proporción, pero para variables cuantitativas continuas.

El parámetro clave que debes conocer de antemano es la desviación estándar \(\sigma\). Si no la tienes, puedes estimarla de datos históricos, de la literatura o de un estudio piloto. Una regla práctica conservadora cuando la distribución es aproximadamente normal: \(\sigma \approx \text{rango} / 4\) (un cuarto del rango probable de los datos).

Esta fórmula usa el cuantil normal Z, lo que supone que \(\sigma\) es conocida o que la muestra es suficientemente grande para que el cuantil t converja a Z. Para muestras pequeñas (< 30) con \(\sigma\) desconocida, el n real puede ser algo mayor (usa el cuantil t con n−1 grados de libertad de forma iterativa).

Fórmula de tamaño muestral

\( n = \left(\frac{Z \cdot \sigma}{E}\right)^2 \)

n: tamaño muestral mínimo (redondeado al entero superior).
Z: cuantil normal — 1,645 (90 %), 1,960 (95 %), 2,576 (99 %).
\(\sigma\): desviación estándar esperada de la variable.
E: margen de error absoluto máximo tolerable (en las mismas unidades que \(\sigma\)).

Relación entre σ, E y n

El tamaño muestral crece cuadráticamente con la precisión exigida: reducir E a la mitad cuadruplica n. También crece cuadráticamente con \(\sigma\): si la variabilidad de la población es el doble, necesitas cuatro veces más observaciones para la misma precisión. Comprueba siempre que E sea razonable en términos prácticos: un E muy pequeño puede hacer el estudio inviable.

Configuración rápida

Desviación estándar (σ): tómala de estudios previos, de la literatura o de una muestra piloto de 10–30 observaciones.
Si no tienes σ: usa la regla del rango dividido por 4 o por 6 como estimación inicial conservadora.
Nivel de confianza: 95 % es el estándar en la mayoría de disciplinas científicas.
Error máximo E: defínelo en términos prácticos — ¿a partir de qué diferencia respecto a la media real tomarías una decisión diferente?
Pérdidas esperadas: divide n entre (1 − tasa de abandono esperada).

Ejemplo resuelto

Un hospital quiere estimar la estancia media (en días) de sus pacientes post-quirúrgicos para optimizar la planificación de camas. De registros anteriores se sabe que la desviación estándar de la estancia es \(\sigma \approx 4{,}2\) días. El equipo de gestión establece que la estimación debe ser precisa dentro de \(E = 0{,}5\) días con un nivel de confianza del 95 % (\(Z = 1{,}960\)).

Aplicamos la fórmula directamente:

\( n = \left(\frac{Z \cdot \sigma}{E}\right)^2 = \left(\frac{1{,}960 \times 4{,}2}{0{,}5}\right)^2 = (16{,}464)^2 = 271{,}06 \rightarrow n = 272 \)

Se necesitan al menos 272 historiales clínicos válidos. Sin embargo, en estudios hospitalarios es habitual un porcentaje de datos incompletos o de exclusión por criterios médicos. Si se estima una tasa de pérdida del 15 %, el número de pacientes a reclutar inicialmente es:

\( n_{\text{reclutar}} = \frac{272}{1 - 0{,}15} = \frac{272}{0{,}85} \approx 320 \text{ pacientes} \)

El equipo planificará la recogida de datos en 320 pacientes consecutivos post-quirúrgicos, esperando disponer de al menos 272 registros completos y obtener así una estimación de la estancia media con precisión de ±0,5 días al 95 % de confianza.

Análisis de sensibilidad: si el hospital decidiese que una precisión de ±1 día es suficiente para la toma de decisiones, la muestra necesaria se reduce drásticamente: \( n = (1{,}960 \times 4{,}2 / 1{,}0)^2 = (8{,}232)^2 = 67{,}77 \rightarrow n = 68 \). Esto muestra que duplicar el margen de error tolerable reduce la muestra en un factor de 4, haciendo el estudio mucho más factible en entornos con recursos limitados.

Supuestos del modelo

Muestreo aleatorio simple de una población muy grande (o infinita).
La variable sigue aproximadamente una distribución normal, o n es suficientemente grande para que el TLC garantice la normalidad del estimador.
La desviación estándar \(\sigma\) es conocida o se estima de forma fiable.
Si la población es finita y n/N > 5 %, aplica la corrección por población finita.

Usos frecuentes

Estimación de tiempos medios de proceso o servicio.
Medición de consumo o gasto medio en clientes o usuarios.
Control estadístico de procesos en manufactura y calidad.
Encuestas sobre variables continuas (peso, altura, puntuación).

Cómo interpretar el resultado

El valor \(n\) que devuelve la calculadora es el mínimo de observaciones válidas que debes recoger para que el intervalo de confianza resultante tenga, como máximo, el margen de error \(E\) especificado. Redondea siempre hacia arriba (nunca hacia abajo), porque trabajar con una sola observación menos ya hace que el margen real supere el objetivo. Si prevés que algún participante abandonará el estudio o que ciertas observaciones quedarán fuera por criterios de exclusión, divide \(n\) entre \((1 - \text{tasa de pérdida})\) para obtener el número de reclutamiento; por ejemplo, con una pérdida esperada del 15 %, recluta \(\lceil n / 0{,}85 \rceil\) sujetos.

La sensibilidad de \(n\) a los parámetros de entrada es asimétrica: \(n\) crece con el cuadrado de \(\sigma\) y decrece con el cuadrado de \(E\). Esto significa que si la desviación estándar real resulta ser un 20 % mayor de lo esperado, necesitarás aproximadamente un 44 % más de sujetos \((1{,}2^2 = 1{,}44)\). Por ello se recomienda un análisis de sensibilidad: calcula \(n\) para \(\sigma - 25\,\%\), \(\sigma\) y \(\sigma + 25\,\%\) y utiliza el valor mayor como margen de seguridad. Reducir \(E\) a la mitad cuadruplica \(n\), de modo que si el tamaño calculado resulta inviable es preferible relajar la precisión requerida antes que bajar el nivel de confianza.

Cuando el \(n\) obtenido sea muy pequeño (por ejemplo, < 30), comprueba que los datos son razonablemente normales o que el teorema central del límite puede aplicarse, ya que la fórmula se basa en la distribución normal. Si \(n\) resulta inasumible por restricciones de tiempo o coste, considera aceptar un margen de error mayor o una confianza del 90 % en lugar del 95 %. Una vez recogida la muestra, usa la calculadora de intervalo de confianza para la media para obtener el IC real con los datos observados.

Referencias y lecturas adicionales

Wikipedia: Tamaño de la muestra — fórmulas para media y proporción.
Wikipedia (en): Sample size determination — derivación para medias y otras variantes.
Wikipedia (en): Standard deviation — cómo estimar σ de datos previos.
Montgomery, D. C. (2019). Introduction to Statistical Quality Control (8.ª ed.). Wiley. — aplicaciones de tamaño muestral en control de procesos.

Preguntas frecuentes

¿Qué hago si no conozco σ? Usa una muestra piloto de 15–30 observaciones para estimarla, o busca σ en literatura similar. Como fallback conservador, usa rango/4.
¿Cuándo debo usar t en lugar de Z? Cuando n < 30 y σ es desconocida. Para esos casos, itera: calcula n con Z, luego reemplaza Z por t(n−1) y recalcula hasta convergencia.
¿El resultado es exacto? Es la muestra mínima teórica. En la práctica, añade un colchón del 10–20 % para compensar observaciones inválidas o perdidas.
¿Qué es el nivel de confianza? El porcentaje de veces que el intervalo de confianza calculado con ese procedimiento contendría el verdadero valor poblacional si repitiéramos el muestreo.