Calculadoras de tamaño muestral por objetivo
Primero elige si tu estudio necesita estimar un parámetro con un margen de error o plantear un contraste de hipótesis con una potencia determinada. Son problemas distintos y usan supuestos diferentes.
Para estimar el valor de un parámetro
Usa estas herramientas cuando el resultado principal será un intervalo de confianza para una media, una proporción o una diferencia. Debes fijar nivel de confianza, margen de error y variabilidad esperada.
- Una proporción (IC)
- Dos proporciones (IC)
- Diferencia de proporciones (IC)
- Una media (IC)
- Dos medias (IC)
- Medias apareadas (IC)
- Odds ratio (IC)
- Varianza (IC)
- Proporción (población finita) (IC)
- Media (población finita) (IC)
Para diseñar un contraste de hipótesis
Usa estas herramientas cuando quieres detectar una diferencia, asociación o efecto mínimo relevante. Debes fijar nivel de significación, potencia y tamaño del efecto.
- Una proporción (H0)
- Una media (H0)
- Medias apareadas (H0)
- Proporciones apareadas (H0)
- ANOVA (k grupos) (H0)
- Correlación de Pearson (H0)
- No inferioridad / Equivalencia (H0)
- Odds ratio (caso-control) (H0)
- Una varianza (H0)
- Dos varianzas (H0)
- Chi-cuadrado independencia (H0)
- Chi-cuadrado bondad de ajuste (H0)
- Test exacto de Fisher (H0)
- Kolmogorov–Smirnov (H0)
- Shapiro–Wilk (H0)
¿Qué es el tamaño muestral y por qué importa?
El tamaño muestral es el número de observaciones que hay que recoger para responder una pregunta de investigación con una precisión y una fiabilidad predefinidas. Calcularlo antes de iniciar el estudio es esencial: una muestra demasiado pequeña produce resultados poco fiables (no detecta efectos reales, genera intervalos de confianza amplios); una muestra excesiva malgasta recursos sin aportar ganancia apreciable.
La fórmula genérica varía según el objetivo, pero en todos los casos n crece cuando se exige más precisión o más potencia, y disminuye cuando el efecto esperado es grande o la variabilidad baja. La lógica matemática subyacente es siempre la misma: controlar los errores de estimación o de decisión a un coste aceptable.
Dos enfoques principales
Estimación (precisión)
Quieres conocer el valor de un parámetro (media, proporción) con un margen de error máximo. Se fija el nivel de confianza \(1-\alpha\) y el error admisible \(E\); la muestra mínima garantiza que el intervalo de confianza no supere ese ancho.
Calculadoras: una proporción, dos proporciones, una media, dos medias, medias apareadas, población finita.
Contraste de hipótesis (potencia)
Quieres detectar una diferencia, asociación o efecto si realmente existe. Se fijan el nivel de significación \(\alpha\), la potencia \(1-\beta\) y el tamaño del efecto mínimo relevante. La muestra asegura que, con esa probabilidad, el contraste rechazará \(H_0\) cuando sea falsa.
Calculadoras: dos proporciones, dos medias, medias/proporciones apareadas, ANOVA, correlación, no inferioridad y odds ratio.
Conceptos clave
- Nivel de significación (\(\alpha\)): probabilidad máxima de cometer error tipo I (rechazar una hipótesis nula verdadera). El valor habitual es 0,05, que equivale a un nivel de confianza del 95 %.
- Potencia (\(1-\beta\)): probabilidad de detectar un efecto real cuando existe. Los valores más frecuentes son 80 % y 90 %. Aumentar la potencia requiere muestras más grandes.
- Error tipo II (\(\beta\)): probabilidad de no detectar una diferencia real (falso negativo). Es complementario a la potencia: \(\beta = 1 - (1-\beta)\).
- Tamaño del efecto: magnitud mínima relevante que se quiere detectar (diferencia de medias, diferencia de proporciones, correlación…). Cuanto más pequeño es el efecto, más grande debe ser la muestra.
- Margen de error (\(E\)): en estudios de estimación, es la máxima desviación tolerable entre el estimador muestral y el valor poblacional.
- Variabilidad: dispersión esperada de la variable (desviación estándar \(\sigma\) para medias, \(p(1-p)\) para proporciones). Valores más inciertos obligan a usar supuestos conservadores.
- Población finita: cuando la muestra representa una fracción apreciable del total (\(n/N > 5\,\%\)), se aplica un factor de corrección que reduce el tamaño muestral necesario.
¿Qué calculadora elegir?
Responde estas preguntas para ir directamente a la herramienta correcta sin mezclar objetivos de estimación y contraste.
-
¿Cuál es tu variable principal?
- Porcentaje o tasa → calculadoras de proporciones.
- Valor continuo (peso, tiempo, puntuación) → calculadoras de medias.
-
Si vas a contrastar hipótesis, ¿cuántos grupos tienes?
- Si solo quieres estimar un parámetro → una proporción, dos proporciones, una media, dos medias o medias apareadas.
- Dos grupos independientes para contrastar diferencias → una proporción (H0) o una media (H0).
- Dos mediciones en el mismo sujeto (antes/después, pares) → medias apareadas o proporciones apareadas.
- Tres o más grupos (k grupos) → ANOVA.
-
¿Hay un objetivo especial de diseño?
- Detectar una correlación entre dos variables continuas → correlación de Pearson.
- Demostrar que un tratamiento no es peor o es intercambiable → no inferioridad / equivalencia.
- Estudio caso-control con odds ratio como medida de efecto → odds ratio (caso-control).
-
¿La población total es conocida y relativamente pequeña?
- Sí → aplica la corrección por población finita (proporción) o población finita (media).
- No (o es muy grande) → usa las calculadoras estándar.
Guía rápida para planificar una muestra
Antes de calcular \(n\), define con precisión qué quieres medir y con qué garantías. Cambiar el objetivo a mitad del estudio invalida el cálculo inicial.
- Define la métrica primaria antes de recoger datos. Un estudio con múltiples variables primarias requiere calcular \(n\) para cada una y tomar la muestra más grande, o ajustar el nivel de significación.
- Usa supuestos conservadores si no tienes datos piloto. Para proporciones sin información previa, usa \(p = 0{,}5\) (máxima variabilidad). Para medias, busca estimaciones de \(\sigma\) en literatura similar.
- Considera las pérdidas esperadas. Una vez obtenido \(n\), divídelo por \((1 - \text{tasa de abandono})\). Por ejemplo, si esperas un 15 % de pérdidas, recluta \(n / 0{,}85\) sujetos.
- Redondea siempre hacia arriba. El tamaño muestral es un número entero; nunca truncues.
- Documenta los supuestos. Registra el margen de error y el nivel de confianza (si estimas un parámetro), o \(\alpha\), potencia, efecto esperado y variabilidad (si diseñas un contraste), para poder justificar el diseño y recalcular si las condiciones cambian.
Ejemplos resueltos
Ejemplo 1: encuesta de satisfacción (una proporción)
Quieres estimar el porcentaje de clientes satisfechos con un margen de error máximo de ±5 % y un nivel de confianza del 95 %. Sin información previa usas \(p = 0{,}5\). La fórmula es:
\( n = \frac{z_{\alpha/2}^{2}\, p\,(1-p)}{E^{2}} = \frac{(1{,}96)^2 \cdot 0{,}5 \cdot 0{,}5}{(0{,}05)^2} \approx 385 \)
Necesitas al menos 385 respuestas válidas. Si la empresa tiene solo 1 000 clientes, aplica la corrección por población finita y la muestra se reduce a unos 278.
Ejemplo 2: ensayo clínico (dos medias independientes)
Buscas detectar una diferencia de 5 puntos en una escala de dolor entre tratamiento y control, con desviación estándar estimada de 10 puntos, potencia del 80 % y \(\alpha = 0{,}05\) bilateral. La fórmula por grupo es:
\( n = \frac{2\,\sigma^2\,(z_{\alpha/2}+z_{\beta})^2}{\delta^2} = \frac{2 \cdot 100 \cdot (1{,}96+0{,}84)^2}{25} \approx 63 \)
Necesitas 63 sujetos por grupo (126 en total). Usa la calculadora de dos medias para ajustar esos parámetros con precisión.