Herramientas estadísticas

Calculadoras de tamaño muestral

Calcula el número mínimo de observaciones según el objetivo: estimar un parámetro con precisión o diseñar un contraste de hipótesis con potencia suficiente.

Calculadoras de tamaño muestral por objetivo

Primero elige si tu estudio necesita estimar un parámetro con un margen de error o plantear un contraste de hipótesis con una potencia determinada. Son problemas distintos y usan supuestos diferentes.

Para estimar el valor de un parámetro

Usa estas herramientas cuando el resultado principal será un intervalo de confianza para una media, una proporción o una diferencia. Debes fijar nivel de confianza, margen de error y variabilidad esperada.

Para diseñar un contraste de hipótesis

Usa estas herramientas cuando quieres detectar una diferencia, asociación o efecto mínimo relevante. Debes fijar nivel de significación, potencia y tamaño del efecto.

¿Qué es el tamaño muestral y por qué importa?

El tamaño muestral es el número de observaciones que hay que recoger para responder una pregunta de investigación con una precisión y una fiabilidad predefinidas. Calcularlo antes de iniciar el estudio es esencial: una muestra demasiado pequeña produce resultados poco fiables (no detecta efectos reales, genera intervalos de confianza amplios); una muestra excesiva malgasta recursos sin aportar ganancia apreciable.

La fórmula genérica varía según el objetivo, pero en todos los casos n crece cuando se exige más precisión o más potencia, y disminuye cuando el efecto esperado es grande o la variabilidad baja. La lógica matemática subyacente es siempre la misma: controlar los errores de estimación o de decisión a un coste aceptable.

Dos enfoques principales

Estimación (precisión)

Quieres conocer el valor de un parámetro (media, proporción) con un margen de error máximo. Se fija el nivel de confianza \(1-\alpha\) y el error admisible \(E\); la muestra mínima garantiza que el intervalo de confianza no supere ese ancho.

Calculadoras: una proporción, dos proporciones, una media, dos medias, medias apareadas, población finita.

Contraste de hipótesis (potencia)

Quieres detectar una diferencia, asociación o efecto si realmente existe. Se fijan el nivel de significación \(\alpha\), la potencia \(1-\beta\) y el tamaño del efecto mínimo relevante. La muestra asegura que, con esa probabilidad, el contraste rechazará \(H_0\) cuando sea falsa.

Calculadoras: dos proporciones, dos medias, medias/proporciones apareadas, ANOVA, correlación, no inferioridad y odds ratio.

Conceptos clave

  • Nivel de significación (\(\alpha\)): probabilidad máxima de cometer error tipo I (rechazar una hipótesis nula verdadera). El valor habitual es 0,05, que equivale a un nivel de confianza del 95 %.
  • Potencia (\(1-\beta\)): probabilidad de detectar un efecto real cuando existe. Los valores más frecuentes son 80 % y 90 %. Aumentar la potencia requiere muestras más grandes.
  • Error tipo II (\(\beta\)): probabilidad de no detectar una diferencia real (falso negativo). Es complementario a la potencia: \(\beta = 1 - (1-\beta)\).
  • Tamaño del efecto: magnitud mínima relevante que se quiere detectar (diferencia de medias, diferencia de proporciones, correlación…). Cuanto más pequeño es el efecto, más grande debe ser la muestra.
  • Margen de error (\(E\)): en estudios de estimación, es la máxima desviación tolerable entre el estimador muestral y el valor poblacional.
  • Variabilidad: dispersión esperada de la variable (desviación estándar \(\sigma\) para medias, \(p(1-p)\) para proporciones). Valores más inciertos obligan a usar supuestos conservadores.
  • Población finita: cuando la muestra representa una fracción apreciable del total (\(n/N > 5\,\%\)), se aplica un factor de corrección que reduce el tamaño muestral necesario.

¿Qué calculadora elegir?

Responde estas preguntas para ir directamente a la herramienta correcta sin mezclar objetivos de estimación y contraste.

  1. ¿Cuál es tu variable principal?
    • Porcentaje o tasa → calculadoras de proporciones.
    • Valor continuo (peso, tiempo, puntuación) → calculadoras de medias.
  2. Si vas a contrastar hipótesis, ¿cuántos grupos tienes?
  3. ¿Hay un objetivo especial de diseño?
  4. ¿La población total es conocida y relativamente pequeña?

Guía rápida para planificar una muestra

Antes de calcular \(n\), define con precisión qué quieres medir y con qué garantías. Cambiar el objetivo a mitad del estudio invalida el cálculo inicial.

  1. Define la métrica primaria antes de recoger datos. Un estudio con múltiples variables primarias requiere calcular \(n\) para cada una y tomar la muestra más grande, o ajustar el nivel de significación.
  2. Usa supuestos conservadores si no tienes datos piloto. Para proporciones sin información previa, usa \(p = 0{,}5\) (máxima variabilidad). Para medias, busca estimaciones de \(\sigma\) en literatura similar.
  3. Considera las pérdidas esperadas. Una vez obtenido \(n\), divídelo por \((1 - \text{tasa de abandono})\). Por ejemplo, si esperas un 15 % de pérdidas, recluta \(n / 0{,}85\) sujetos.
  4. Redondea siempre hacia arriba. El tamaño muestral es un número entero; nunca truncues.
  5. Documenta los supuestos. Registra el margen de error y el nivel de confianza (si estimas un parámetro), o \(\alpha\), potencia, efecto esperado y variabilidad (si diseñas un contraste), para poder justificar el diseño y recalcular si las condiciones cambian.

Ejemplos resueltos

Ejemplo 1: encuesta de satisfacción (una proporción)

Quieres estimar el porcentaje de clientes satisfechos con un margen de error máximo de ±5 % y un nivel de confianza del 95 %. Sin información previa usas \(p = 0{,}5\). La fórmula es:

\( n = \frac{z_{\alpha/2}^{2}\, p\,(1-p)}{E^{2}} = \frac{(1{,}96)^2 \cdot 0{,}5 \cdot 0{,}5}{(0{,}05)^2} \approx 385 \)

Necesitas al menos 385 respuestas válidas. Si la empresa tiene solo 1 000 clientes, aplica la corrección por población finita y la muestra se reduce a unos 278.

Ejemplo 2: ensayo clínico (dos medias independientes)

Buscas detectar una diferencia de 5 puntos en una escala de dolor entre tratamiento y control, con desviación estándar estimada de 10 puntos, potencia del 80 % y \(\alpha = 0{,}05\) bilateral. La fórmula por grupo es:

\( n = \frac{2\,\sigma^2\,(z_{\alpha/2}+z_{\beta})^2}{\delta^2} = \frac{2 \cdot 100 \cdot (1{,}96+0{,}84)^2}{25} \approx 63 \)

Necesitas 63 sujetos por grupo (126 en total). Usa la calculadora de dos medias para ajustar esos parámetros con precisión.