Tamaño muestral

Calculadora de tamaño muestral para odds ratio (caso-control)

Determina cuántos casos y controles necesitas para detectar un odds ratio significativo en un estudio epidemiológico.

Calculadora

Introduce la prevalencia de exposición en controles, el odds ratio a detectar y los parámetros de diseño.

Resultado pendiente…

Explicación

En un estudio caso-control el parámetro de interés no es la diferencia de medias sino el odds ratio (OR): el cociente entre las odds de exposición en casos y en controles. El OR es una medida de asociación fundamental en epidemiología, especialmente útil cuando la enfermedad es rara, porque estima el riesgo relativo con buena aproximación en ese escenario.

Para calcular el tamaño muestral se convierte el OR en proporciones de exposición y se aplica la fórmula de Fleiss para dos proporciones independientes. La clave es que el OR define implícitamente la proporción de expuestos en los casos (\(p_1\)) a partir de la proporción en controles (\(p_0\)) y del OR deseado. Permite además ajustar la razón de controles por caso (r), lo que resulta útil cuando los casos son escasos y los controles abundantes.

Fórmula de tamaño muestral

Sea \(p_0\) la proporción de expuestos en controles. La proporción en casos se obtiene como:

\( p_1 = \frac{\text{OR}\cdot p_0}{1 + p_0\,(\text{OR}-1)} \)

Con \(\bar{p} = (p_1 + r\,p_0)/(1+r)\) y razón de asignación \(r\) (controles por caso):

\( n_{\text{casos}} = \frac{\left(Z_{\alpha/2}\sqrt{(1+1/r)\,\bar{p}(1-\bar{p})} + Z_\beta\sqrt{p_1(1-p_1)+p_0(1-p_0)/r}\right)^2}{(p_1-p_0)^2} \)

\( n_{\text{controles}} = r\cdot n_{\text{casos}} \)

  • p₀: prevalencia de exposición en la población de controles (o en la población general si la enfermedad es rara).
  • p₁: prevalencia implícita de exposición en casos dado el OR; se calcula automáticamente.
  • r: número de controles por caso. Aumentar r incrementa la potencia cuando los casos son escasos, pero con rendimientos decrecientes: pasar de r = 1 a r = 2 gana más que de r = 3 a r = 4.
  • : proporción ponderada de exposición conjunta en la muestra.

Supuestos del modelo

  • Muestreo independiente: casos y controles se seleccionan de forma independiente, sin emparejamiento (para diseños emparejados, usar el método de McNemar).
  • Exposición binaria: el factor de riesgo se considera expuesto/no expuesto. Para exposiciones politómicas o continuas se necesitan otros enfoques.
  • p₀ estable: la prevalencia de exposición en controles debe ser representativa de la población fuente de los casos.
  • OR constante: la fórmula supone un OR homogéneo; no considera interacción ni confusión residual.
  • Enfermedad rara: la interpretación del OR como aproximación al riesgo relativo es válida cuando la incidencia es baja (< 10 %). Con enfermedades frecuentes, el OR sobreestima el RR.

Configuración rápida

  • p₀: usa datos poblacionales o registros de salud. Si es desconocido, 0,20–0,30 es frecuente en muchos factores de riesgo ambientales y de estilo de vida.
  • OR: el OR mínimo relevante que quieres detectar. OR = 2 es un efecto moderado en epidemiología; OR = 1,5 es pequeño y requiere muestras grandes.
  • r: aumentar a 2–3 controles por caso mejora la potencia cuando los casos son escasos; más de 4 controles por caso aporta poca ganancia adicional de potencia.
  • OR protector (OR < 1): introdúcelo directamente; la calculadora lo maneja correctamente (p₁ < p₀ en ese caso).

Ejemplo sencillo

Estudio sobre tabaquismo y cáncer de pulmón: exposición (fumadores) en controles p₀ = 0,30, OR = 2,0, α = 0,05 bilateral, potencia 0,80, relación 1:1. Esto implica p₁ = 0,462. Necesitas aproximadamente 141 casos y 141 controles (total ≈ 282).

Usos frecuentes

  • Estudios sobre factores de riesgo de enfermedades raras (canceres poco frecuentes, enfermedades autoinmunes).
  • Farmacoepidemiología y vigilancia de efectos adversos de medicamentos.
  • Investigación de brotes infecciosos o exposiciones ocupacionales.
  • Estudios de casos y controles anidados en cohortes.

Referencias externas

Ejemplo resuelto

Un equipo epidemiológico diseña un estudio caso-control para investigar la asociación entre el tabaquismo y el cáncer de pulmón. La proporción de fumadores entre los controles (personas sanas de características similares) se estima en \(p_2 = 0{,}30\). Se quiere detectar un odds ratio de al menos \(\text{OR} = 2{,}5\) con \(\alpha = 0{,}05\) bilateral y potencia del 80 %.

El primer paso es convertir el OR en la proporción de expuestos esperada entre los casos:

\( p_1 = \frac{\text{OR} \times p_2}{1 + p_2 \times (\text{OR} - 1)} = \frac{2{,}5 \times 0{,}30}{1 + 0{,}30 \times 1{,}5} = \frac{0{,}75}{1{,}45} \approx 0{,}517 \)

Con \(z_{\alpha/2} = 1{,}960\) y \(z_{\beta} = 0{,}842\), se aplica la fórmula de Fleiss para dos proporciones independientes:

\( n = \frac{\bigl(z_{\alpha/2}\sqrt{2\bar{p}(1-\bar{p})} + z_{\beta}\sqrt{p_1(1-p_1)+p_2(1-p_2)}\bigr)^2}{(p_1-p_2)^2} \)

Con \(\bar{p} = (0{,}517+0{,}30)/2 = 0{,}4085\): el primer término es \(1{,}960\times\sqrt{2\times0{,}4085\times0{,}5915} = 1{,}960\times0{,}6951 = 1{,}362\); el segundo, \(0{,}842\times\sqrt{0{,}517\times0{,}483+0{,}30\times0{,}70} = 0{,}842\times\sqrt{0{,}4597} = 0{,}842\times0{,}6780 = 0{,}571\). La diferencia entre proporciones es \(p_1 - p_2 = 0{,}217\).

\( n = \frac{(1{,}362 + 0{,}571)^2}{(0{,}217)^2} = \frac{(1{,}933)^2}{0{,}04709} = \frac{3{,}736}{0{,}04709} \approx 79{,}3 \rightarrow 80 \)

Redondeando al entero superior, se necesitan 80 casos y 80 controles (160 participantes en total) para alcanzar el 80 % de potencia.

Cómo interpretar el resultado

El valor \(n\) es el tamaño mínimo por grupo (casos y controles, o expuestos y no expuestos) para detectar el odds ratio especificado con la potencia y el nivel \(\alpha\) indicados. El total de participantes a reclutar es \(2n\) en un diseño balanceado. Redondea siempre hacia arriba y añade el margen por pérdidas: divide \(n\) entre \((1 - \text{tasa de pérdida})\) por grupo. Si el diseño es no balanceado (diferente número de casos y controles en ratio \(k\!:\!1\)), el grupo de casos necesita \(n\) y el de controles \(k \cdot n\); aumentar \(k\) más allá de 4:1 rara vez reduce sustancialmente el \(n\) total.

El OR es el parámetro de interés, pero la sensibilidad del \(n\) depende también de la probabilidad basal \(p_0\) (proporción de eventos en el grupo de referencia). Un OR dado requiere más sujetos cuando \(p_0\) es extrema (cercana a 0 o a 1) que cuando es cercana a 0,5. Realiza un análisis de sensibilidad variando \(p_0\) en ±0,05 y el OR en un rango razonable (\(\pm 0{,}2\) en escala natural) para evaluar la robustez del plan. Ten en cuenta que el OR es una medida de asociación relativa; para que tenga interpretación clínica, es útil traducirlo al riesgo relativo (RR) o a la diferencia de riesgos (DR) cuando la prevalencia de base es conocida.

Si el \(n\) calculado es inviable, considera si el OR mínimo detectable puede aumentarse o si la potencia puede reducirse al 80 %. En estudios de casos y controles, también puede aumentarse el ratio de controles por caso (p. ej., 2:1 o 3:1) para reducir el número de casos necesarios cuando estos son escasos. Con los datos recogidos, estima el OR y su IC con la calculadora de odds ratio; si el objetivo era estimar el OR con una precisión dada en lugar de contrastarlo, usa la calculadora de tamaño muestral para el IC del OR.

Preguntas frecuentes

  • ¿Qué es el odds ratio? La razón de odds de exposición entre casos y controles: OR = [p₁/(1−p₁)] / [p₀/(1−p₀)]. OR = 1 implica sin asociación; OR > 1, el factor es de riesgo; OR < 1, es protector.
  • ¿Por qué no usar el riesgo relativo (RR) directamente? En estudios caso-control, el investigador elige cuántos casos y controles incluir, por lo que no se puede estimar la incidencia real y, por tanto, tampoco el RR. El OR sí se puede estimar directamente y aproxima bien al RR cuando la enfermedad es rara (< 10 %).
  • ¿Cómo obtengo p₀? De estudios de prevalencia, encuestas nacionales de salud o registros de la exposición en la población de referencia. Pequeños errores en p₀ pueden afectar bastante al n calculado.
  • ¿Cuántos controles por caso? Aumentar r de 1 a 2 o 3 reduce n de casos notablemente cuando los casos son escasos; pasar de r = 3 a r = 4 aporta poco. La regla práctica es r ≤ 4.
  • ¿El tamaño muestral es exacto? No; depende de los supuestos (p₀, OR real) y se redondea al entero superior. Añade un margen del 10–20 % por pérdidas esperadas.