Calculadora
Introduce los cuatro recuentos de la tabla 2x2 para estimar la odds ratio y su intervalo de confianza.
Explicación
La odds ratio (OR) compara las odds del evento en dos grupos. La odds no es la probabilidad, sino el cociente entre casos con evento y casos sin evento dentro de un mismo grupo.
Por ejemplo, si queremos estudiar si una exposición se asocia con un evento, los datos se organizan así:
| Grupo | Con evento | Sin evento | Odds del evento |
|---|---|---|---|
| Expuestos | a = 35 | b = 65 | a/b = 35/65 |
| No expuestos | c = 20 | d = 80 | c/d = 20/80 |
La OR divide las odds de ambos grupos. En una tabla 2x2 con expuestos y no expuestos, se calcula como:
\( \widehat{OR} = \dfrac{a/b}{c/d} = \dfrac{a\cdot d}{b\cdot c} \)
En el ejemplo, \(\widehat{OR} = (35\cdot80)/(65\cdot20) \approx 2{,}154\). Esto significa que las odds observadas del evento en expuestos son aproximadamente 2,15 veces las odds observadas en no expuestos. Una OR igual a 1 indica ausencia de asociación; una OR mayor que 1 indica mayores odds del evento en el grupo expuesto; y una OR menor que 1 indica menores odds.
Método logarítmico de Woolf
Denotamos por \(C\) el nivel de confianza y por \(\alpha=1-C\) el área total fuera del intervalo. Para un 95 % de confianza, \(C=0{,}95\), \(\alpha=0{,}05\) y \(\alpha/2=0{,}025\) en cada cola.
El método de Woolf construye el intervalo en la escala logarítmica porque la distribución muestral de \(\widehat{OR}\) es asimétrica y solo toma valores positivos. Al transformar con logaritmos, \(\log(\widehat{OR})\) puede aproximarse mejor por una distribución normal cuando los recuentos son suficientemente grandes.
El primer paso es calcular la estimación puntual \(\widehat{OR} = ad/(bc)\) y su logaritmo. Después se estima el error estándar de \(\log(\widehat{OR})\) sumando la contribución de incertidumbre de las cuatro celdas:
\( SE\left[\log(\widehat{OR})\right] = \sqrt{\dfrac{1}{a}+\dfrac{1}{b}+\dfrac{1}{c}+\dfrac{1}{d}} \)
Con ese error estándar, el intervalo bilateral en escala logarítmica es:
\( \log(\widehat{OR}) \pm z_{\alpha/2}\cdot SE\left[\log(\widehat{OR})\right] \)
Por último, se aplica la exponencial a ambos límites para volver a la escala original de la odds ratio. Este paso es importante: el intervalo final no queda centrado de forma simétrica alrededor de la OR, sino que es simétrico en la escala \(\log(OR)\). Por eso los límites inferior y superior suelen estar a distancias diferentes de la estimación puntual cuando se miran en la escala original.
El método funciona mejor si las cuatro celdas tienen recuentos moderados. Si hay celdas pequeñas, el error estándar aumenta y el intervalo se ensancha; si una celda vale 0, se necesita una corrección como Haldane-Anscombe para evitar divisiones por cero.
Corrección de Haldane-Anscombe
Si alguna celda es 0, la OR o el error estándar no pueden calcularse directamente porque aparecen divisiones por cero y logaritmos indefinidos. La corrección de Haldane-Anscombe suma 0,5 a las cuatro celdas antes de calcular el intervalo.
Ejemplo resuelto
Con a = 35, b = 65, c = 20 y d = 80, la odds ratio estimada es:
\( \widehat{OR} = \dfrac{35\cdot80}{65\cdot20} \approx 2{,}154 \)
Para un 95 % de confianza, \(C=0{,}95\), \(\alpha=0{,}05\), \(\alpha/2=0{,}025\) y el valor crítico es \(z_{0{,}025} \approx 1{,}960\). El error estándar en escala logarítmica es:
\( SE = \sqrt{\dfrac{1}{35}+\dfrac{1}{65}+\dfrac{1}{20}+\dfrac{1}{80}} \approx 0{,}326 \)
Como \(\log(2{,}154) \approx 0{,}767\), el intervalo en escala logarítmica es:
\( 0{,}767 \pm 1{,}960\cdot0{,}326 \approx [0{,}128,\;1{,}407] \)
Finalmente se aplica la exponencial a ambos límites:
\( IC_{95\%}(OR) = [e^{0{,}128},\;e^{1{,}407}] \approx [1{,}136,\;4{,}083] \)
El intervalo completo queda por encima de 1, por lo que en este ejemplo las odds del evento son significativamente mayores en el grupo expuesto al 95 % de confianza.
Supuestos para el IC de odds ratio
- La tabla 2x2 debe representar recuentos independientes de exposición y evento, o casos y controles correctamente clasificados.
- Las observaciones deben ser independientes dentro de cada celda; si hay datos emparejados, se necesitan métodos específicos para pares.
- El método de Woolf usa una aproximación normal para \(\log(OR)\), por lo que funciona mejor con recuentos moderados en las cuatro celdas.
- Si alguna celda vale 0, aplica la corrección de Haldane-Anscombe y considera interpretar el resultado como aproximado.
¿En qué se diferencia del IC para ratio de proporciones?
Aunque esta calculadora y la de IC para ratio de proporciones usan una escala logarítmica y comparan el intervalo con el valor nulo 1, estiman medidas distintas.
| Medida | Qué compara | Fórmula en una tabla 2x2 | Uso típico |
|---|---|---|---|
| Odds ratio (OR) | Odds del evento: casos con evento divididos entre casos sin evento. | \( OR = \dfrac{a/b}{c/d} = \dfrac{a\cdot d}{b\cdot c} \) | Estudios caso-control, regresión logística y análisis donde se modelan odds. |
| Ratio de proporciones / riesgo relativo (RR) | Probabilidades o proporciones del evento en dos grupos. | \( RR = \dfrac{x_1/n_1}{x_2/n_2} \) | Cohortes, ensayos, experimentos A/B o estudios con denominadores reales de riesgo. |
Con los mismos datos del ejemplo (35 eventos y 65 no eventos en expuestos; 20 eventos y 80 no eventos en no expuestos), el riesgo relativo sería \(RR=(35/100)/(20/100)=1{,}75\), mientras que la odds ratio es \(OR=(35/65)/(20/80)\approx2{,}154\). La OR es mayor porque compara odds, no probabilidades.
La diferencia es pequeña cuando el evento es raro, porque entonces odds y probabilidad son parecidas. Cuando el evento es frecuente, la OR puede alejarse bastante del RR y no conviene interpretarla como si fuera un riesgo relativo.
Cómo interpretar el resultado
El intervalo \([L, U]\) es el rango plausible de la odds ratio poblacional \(OR\) dado el nivel de confianza elegido. El valor nulo para una OR es 1, que indica ausencia de asociación entre la exposición y el evento. En términos frecuentistas: si repitieras el estudio muchas veces y construyeras el IC con el mismo procedimiento, una proporción \(C\) de esos intervalos contendría la verdadera OR. El intervalo se construye y se presenta simétricamente en escala logarítmica pero, al transformar de vuelta con la exponencial, los límites no están equidistantes de la estimación puntual en la escala original: la OR siempre es positiva y su distribución muestral es asimétrica.
La lectura del resultado sigue tres casos directos. Si \(1 \in [L, U]\), los datos son compatibles con ausencia de asociación al nivel de confianza elegido; equivalentemente, el contraste bilateral \(H_0\!: OR = 1\) no se rechazaría al nivel \(\alpha = 1 - C\). Si \(L > 1\) (el intervalo completo está por encima de 1), las odds del evento son significativamente mayores en el grupo expuesto. Si \(U < 1\) (el intervalo completo está por debajo de 1), las odds son significativamente menores. En el gráfico se representa la distribución normal aproximada de \(\log(OR)\): la región verde es la zona de confianza y las colas rojas delimitan los valores críticos \(\pm z_{\alpha/2}\) en escala logarítmica.
- Magnitud del efecto: una OR = 2,15 significa que las odds observadas del evento en expuestos son 2,15 veces las odds en no expuestos. Cuanto más se aleja la OR de 1, mayor es la asociación estimada; el IC comunica la incertidumbre alrededor de esa estimación.
- No confundir OR con riesgo relativo: la OR no es un riesgo relativo. Solo cuando el evento es raro (\(p < 0{,}1\)) se aproximan. Con eventos frecuentes, la OR puede ser bastante más extrema que el RR y no debe interpretarse como si fuera un cociente de probabilidades.
- Amplitud y recuentos: celdas con recuentos pequeños producen intervalos muy anchos porque el error estándar de \(\log(OR)\) crece al sumar los recíprocos \(1/a + 1/b + 1/c + 1/d\). Si alguna celda es menor que 5, interpreta el resultado con cautela.
Preguntas frecuentes
- ¿Qué valor indica ausencia de efecto? En una odds ratio, el valor nulo es 1.
- ¿Se interpreta como riesgo relativo? No exactamente. La OR compara odds, no probabilidades; solo se aproxima al riesgo relativo cuando el evento es poco frecuente.
- ¿Qué pasa con recuentos muy pequeños? El método normal sobre \(\log(OR)\) puede ser impreciso; conviene interpretar el resultado con cautela y considerar métodos exactos.
Referencias usadas
- Woolf, B. (1955). On estimating the relation between blood group and disease, Annals of Human Genetics, 19, 251–253.
- Haldane, J. B. S. (1956). The estimation and significance of the logarithm of a ratio of frequencies, Annals of Human Genetics, 20, 309–311.
- Agresti, A. (2013). Categorical Data Analysis. Wiley.