Calculadora
Selecciona el tipo de contraste y la variable, introduce los datos y el margen δ para obtener los estadísticos z, p-valor, decisión e intervalo de confianza.
Explicación
Los contrastes de no inferioridad y equivalencia invierten la lógica habitual del contraste de hipótesis. En lugar de intentar demostrar que dos tratamientos difieren, buscan demostrar que son suficientemente similares dentro de un margen clínico o práctico predefinido \(\delta\).
No inferioridad: se quiere demostrar que el nuevo tratamiento (más barato, menos invasivo, etc.) no es inaceptablemente peor que el control. La hipótesis nula es que el tratamiento sí es inferior de forma relevante: \(H_0\colon \Delta \leq -\delta\).
Equivalencia (TOST): se quiere demostrar que el nuevo tratamiento no es ni mejor ni peor de forma relevante. Requiere dos tests unilaterales simultáneos (Two One-Sided Tests), uno de no inferioridad y uno de no superioridad. Se declara equivalencia cuando ambos se rechazan.
Hipótesis y estadísticos
Sea \(\hat{\Delta} = \hat{\theta}_1 - \hat{\theta}_2\) la diferencia estimada (de medias o proporciones) y \(\text{SE}\) su error estándar:
\( \hat{\Delta} = \bar{x}_1 - \bar{x}_2 \quad \text{o} \quad \hat{\Delta} = \hat{p}_1 - \hat{p}_2 \)
\( \text{SE} = \sqrt{\dfrac{s_1^2}{n_1} + \dfrac{s_2^2}{n_2}} \quad \text{(medias)} \)
\( \text{SE} = \sqrt{\dfrac{\hat{p}_1(1-\hat{p}_1)}{n_1} + \dfrac{\hat{p}_2(1-\hat{p}_2)}{n_2}} \quad \text{(proporciones)} \)
No inferioridad (\(H_0\colon \Delta \leq -\delta\), \(H_1\colon \Delta > -\delta\)):
\( z_{\text{NI}} = \dfrac{\hat{\Delta} + \delta}{\text{SE}}, \quad p_{\text{NI}} = 1 - \Phi(z_{\text{NI}}) \)
No superioridad (\(H_0\colon \Delta \geq +\delta\), \(H_1\colon \Delta < +\delta\)):
\( z_{\text{NS}} = \dfrac{\delta - \hat{\Delta}}{\text{SE}}, \quad p_{\text{NS}} = 1 - \Phi(z_{\text{NS}}) \)
Equivalencia TOST: \(p_{\text{TOST}} = \max(p_{\text{NI}}, p_{\text{NS}})\). Se declara equivalencia si \(p_{\text{TOST}} < \alpha\).
Guía rápida de interpretación
- No inferioridad: si \(p_{\text{NI}} < \alpha\), se rechaza \(H_0\) y se declara no inferioridad. El IC \(100(1-2\alpha)\%\) de \(\hat{\Delta}\) debe estar completamente por encima de \(-\delta\).
- TOST: si \(p_{\text{TOST}} < \alpha\), se declara equivalencia. Equivale a verificar que el IC \(100(1-2\alpha)\%\) de \(\hat{\Delta}\) está contenido en \([-\delta, +\delta\)].
- Con \(\alpha=0{,}05\), el criterio del IC para TOST usa el IC al 90% (no al 95%).
- El margen \(\delta\) debe definirse a priori con criterio clínico, no estadístico.
Ejemplo resuelto: no inferioridad de proporciones
Un nuevo tratamiento tiene una tasa de éxito \(\hat{p}_1 = 0{,}72\) en \(n_1 = 200\) pacientes. El tratamiento de referencia tiene \(\hat{p}_2 = 0{,}75\) en \(n_2 = 200\) pacientes. El margen de no inferioridad es \(\delta = 0{,}10\) con \(\alpha = 0{,}05\).
\( \hat{\Delta} = 0{,}72 - 0{,}75 = -0{,}03 \)
\( \text{SE} = \sqrt{\dfrac{0{,}72\cdot0{,}28}{200} + \dfrac{0{,}75\cdot0{,}25}{200}} = \sqrt{0{,}001008 + 0{,}0009375} = \sqrt{0{,}0019455} \approx 0{,}04411 \)
\( z_{\text{NI}} = \dfrac{-0{,}03 + 0{,}10}{0{,}04411} \approx 1{,}587, \quad p \approx 0{,}056 \)
Como \(p = 0{,}057 > \alpha = 0{,}05\), no se declara no inferioridad al nivel del 5 % (resultado limítrofe). El IC al 90 % de \(\hat{\Delta}\) no cabe completamente por encima de \(-0{,}10\).
Cómo interpretar el resultado
No inferioridad (test unilateral): rechazar \(H_0\) (p-valor < α) significa que el límite inferior del intervalo de confianza al \((1-2\alpha)\cdot100\%\) para la diferencia \(\Delta = \mu_T - \mu_C\) supera el margen de no inferioridad \(-\delta\). En términos prácticos, se concluye que el tratamiento experimental no es peor que el control en más de la cantidad clínicamente tolerable. No rechazar \(H_0\) (p-valor ≥ α) indica que los datos no excluyen que el tratamiento sea peor que el control más allá del margen definido.
Equivalencia (TOST): se declara equivalencia si ambos tests unilaterales rechazan \(H_0\) simultáneamente (p_TOST < α) y el intervalo de confianza al 90% para \(\Delta\) queda completamente dentro de \([-\delta, +\delta]\). Un resultado de equivalencia no afirma que los tratamientos sean idénticos, sino que cualquier diferencia es lo bastante pequeña para ser clínicamente aceptable. Si solo uno de los dos tests unilaterales rechaza, la conclusión es unidireccional: no inferioridad, pero no equivalencia.
La elección del margen \(\delta\) es la decisión más crítica del diseño: debe fijarse a priori con criterio clínico o regulatorio, no estadístico. En la visualización, la zona verde corresponde a la región de equivalencia o no inferioridad, la zona roja es la región de inferioridad inaceptable y la línea ámbar muestra la diferencia estimada con su intervalo de confianza. Un intervalo estrecho centrado cerca de cero es evidencia tanto de no inferioridad como de equivalencia práctica; un intervalo ancho señala incertidumbre y posiblemente insuficiencia muestral.
Preguntas frecuentes
- ¿Qué es el margen δ? La diferencia máxima tolerable a favor del control. Debe definirse a priori con criterio clínico o regulatorio.
- ¿En qué se diferencia no inferioridad de equivalencia? No inferioridad es unilateral (el tratamiento no es peor). Equivalencia (TOST) es bilateral (no es ni mejor ni peor de forma relevante).
- ¿Por qué el IC al 90% en TOST? Con α=0,05, el TOST equivale a verificar que el IC al 90% de Δ̂ está dentro de [−δ, +δ].
- ¿Cómo se elige δ? Con criterio clínico o regulatorio, no estadístico. Suele ser una fracción del efecto del comparador activo.
- ¿Puede coexistir no inferioridad con no superioridad? Sí, eso equivale a declarar equivalencia (TOST).
Referencia: Ensayo de no inferioridad — Wikipedia