¿Qué es un margen de no inferioridad δ?

Es la diferencia máxima tolerable a favor del control frente al nuevo tratamiento. Se define antes del estudio con criterio clínico o práctico. Si la diferencia observada está dentro del margen (tratamiento no es peor que δ respecto al control), se declara no inferioridad.

¿En qué se diferencia no inferioridad de equivalencia?

No inferioridad (unilateral): el nuevo tratamiento no es inaceptablemente peor que el control. Equivalencia (TOST, bilateral): el nuevo tratamiento es tan bueno como el control, ni mejor ni peor de forma relevante. TOST requiere dos tests unilaterales simultáneos.

¿Por qué se usa el IC al 90% en el TOST?

El TOST con nivel α equivale a verificar que el IC al 100(1-2α)% de Δ̂ está contenido en [-δ, +δ]. Con α=0,05 eso corresponde al IC al 90%. Si el IC al 90% cabe dentro de [-δ, +δ], se declara equivalencia.

¿Cómo se elige el margen δ?

El margen debe definirse a priori con criterio clínico o regulatorio, no estadístico. En ensayos clínicos, habitualmente representa una fracción (por ejemplo, 50%) de la diferencia mínima clínicamente importante o del efecto demostrado del comparador activo.

¿Puede rechazarse la hipótesis de superioridad y aun así declararse no inferioridad?

Sí. El contraste de no inferioridad y el de superioridad tienen distintas hipótesis nulas. Es perfectamente coherente que un ensayo no demuestre superioridad pero sí no inferioridad, si la diferencia observada es pequeña y está bien acotada.

Contraste de no inferioridad y equivalencia

Calculadora

Selecciona el tipo de contraste y la variable, introduce los datos y el margen δ para obtener los estadísticos z, p-valor, decisión e intervalo de confianza.

Tipo de contraste

Variable

Proporción tratamiento (p̂₁)

Proporción control (p̂₂)

Tamaño muestral tratamiento (n₁)

Tamaño muestral control (n₂)

Margen de equivalencia/no inferioridad (δ > 0)

Nivel de significación (α)

Dirección (no inferioridad)

Resultado pendiente…

Explicación

Los contrastes de no inferioridad y equivalencia invierten la lógica habitual del contraste de hipótesis. En lugar de intentar demostrar que dos tratamientos difieren, buscan demostrar que son suficientemente similares dentro de un margen clínico o práctico predefinido \(\delta\).

No inferioridad: se quiere demostrar que el nuevo tratamiento (más barato, menos invasivo, etc.) no es inaceptablemente peor que el control. La hipótesis nula es que el tratamiento sí es inferior de forma relevante: \(H_0\colon \Delta \leq -\delta\).

Equivalencia (TOST): se quiere demostrar que el nuevo tratamiento no es ni mejor ni peor de forma relevante. Requiere dos tests unilaterales simultáneos (Two One-Sided Tests), uno de no inferioridad y uno de no superioridad. Se declara equivalencia cuando ambos se rechazan.

Hipótesis y estadísticos

Sea \(\hat{\Delta} = \hat{\theta}_1 - \hat{\theta}_2\) la diferencia estimada (de medias o proporciones) y \(\text{SE}\) su error estándar:

\( \hat{\Delta} = \bar{x}_1 - \bar{x}_2 \quad \text{o} \quad \hat{\Delta} = \hat{p}_1 - \hat{p}_2 \)

\( \text{SE} = \sqrt{\dfrac{s_1^2}{n_1} + \dfrac{s_2^2}{n_2}} \quad \text{(medias)} \)

\( \text{SE} = \sqrt{\dfrac{\hat{p}_1(1-\hat{p}_1)}{n_1} + \dfrac{\hat{p}_2(1-\hat{p}_2)}{n_2}} \quad \text{(proporciones)} \)

No inferioridad (\(H_0\colon \Delta \leq -\delta\), \(H_1\colon \Delta > -\delta\)):

\( z_{\text{NI}} = \dfrac{\hat{\Delta} + \delta}{\text{SE}}, \quad p_{\text{NI}} = 1 - \Phi(z_{\text{NI}}) \)

No superioridad (\(H_0\colon \Delta \geq +\delta\), \(H_1\colon \Delta < +\delta\)):

\( z_{\text{NS}} = \dfrac{\delta - \hat{\Delta}}{\text{SE}}, \quad p_{\text{NS}} = 1 - \Phi(z_{\text{NS}}) \)

Equivalencia TOST: \(p_{\text{TOST}} = \max(p_{\text{NI}}, p_{\text{NS}})\). Se declara equivalencia si \(p_{\text{TOST}} < \alpha\).

Guía rápida de interpretación

No inferioridad: si \(p_{\text{NI}} < \alpha\), se rechaza \(H_0\) y se declara no inferioridad. El IC \(100(1-2\alpha)\%\) de \(\hat{\Delta}\) debe estar completamente por encima de \(-\delta\).
TOST: si \(p_{\text{TOST}} < \alpha\), se declara equivalencia. Equivale a verificar que el IC \(100(1-2\alpha)\%\) de \(\hat{\Delta}\) está contenido en \([-\delta, +\delta\)].
Con \(\alpha=0{,}05\), el criterio del IC para TOST usa el IC al 90% (no al 95%).
El margen \(\delta\) debe definirse a priori con criterio clínico, no estadístico.

Ejemplo resuelto: no inferioridad de proporciones

Un nuevo tratamiento tiene una tasa de éxito \(\hat{p}_1 = 0{,}72\) en \(n_1 = 200\) pacientes. El tratamiento de referencia tiene \(\hat{p}_2 = 0{,}75\) en \(n_2 = 200\) pacientes. El margen de no inferioridad es \(\delta = 0{,}10\) con \(\alpha = 0{,}05\).

\( \hat{\Delta} = 0{,}72 - 0{,}75 = -0{,}03 \)

\( \text{SE} = \sqrt{\dfrac{0{,}72\cdot0{,}28}{200} + \dfrac{0{,}75\cdot0{,}25}{200}} = \sqrt{0{,}001008 + 0{,}0009375} = \sqrt{0{,}0019455} \approx 0{,}04411 \)

\( z_{\text{NI}} = \dfrac{-0{,}03 + 0{,}10}{0{,}04411} \approx 1{,}587, \quad p \approx 0{,}056 \)

Como \(p = 0{,}057 > \alpha = 0{,}05\), no se declara no inferioridad al nivel del 5 % (resultado limítrofe). El IC al 90 % de \(\hat{\Delta}\) no cabe completamente por encima de \(-0{,}10\).

Cómo interpretar el resultado

No inferioridad (test unilateral): rechazar \(H_0\) (p-valor < α) significa que el límite inferior del intervalo de confianza al \((1-2\alpha)\cdot100\%\) para la diferencia \(\Delta = \mu_T - \mu_C\) supera el margen de no inferioridad \(-\delta\). En términos prácticos, se concluye que el tratamiento experimental no es peor que el control en más de la cantidad clínicamente tolerable. No rechazar \(H_0\) (p-valor ≥ α) indica que los datos no excluyen que el tratamiento sea peor que el control más allá del margen definido.

Equivalencia (TOST): se declara equivalencia si ambos tests unilaterales rechazan \(H_0\) simultáneamente (p_TOST < α) y el intervalo de confianza al 90% para \(\Delta\) queda completamente dentro de \([-\delta, +\delta]\). Un resultado de equivalencia no afirma que los tratamientos sean idénticos, sino que cualquier diferencia es lo bastante pequeña para ser clínicamente aceptable. Si solo uno de los dos tests unilaterales rechaza, la conclusión es unidireccional: no inferioridad, pero no equivalencia.

La elección del margen \(\delta\) es la decisión más crítica del diseño: debe fijarse a priori con criterio clínico o regulatorio, no estadístico. En la visualización, la zona verde corresponde a la región de equivalencia o no inferioridad, la zona roja es la región de inferioridad inaceptable y la línea ámbar muestra la diferencia estimada con su intervalo de confianza. Un intervalo estrecho centrado cerca de cero es evidencia tanto de no inferioridad como de equivalencia práctica; un intervalo ancho señala incertidumbre y posiblemente insuficiencia muestral.

Preguntas frecuentes

¿Qué es el margen δ? La diferencia máxima tolerable a favor del control. Debe definirse a priori con criterio clínico o regulatorio.
¿En qué se diferencia no inferioridad de equivalencia? No inferioridad es unilateral (el tratamiento no es peor). Equivalencia (TOST) es bilateral (no es ni mejor ni peor de forma relevante).
¿Por qué el IC al 90% en TOST? Con α=0,05, el TOST equivale a verificar que el IC al 90% de Δ̂ está dentro de [−δ, +δ].
¿Cómo se elige δ? Con criterio clínico o regulatorio, no estadístico. Suele ser una fracción del efecto del comparador activo.
¿Puede coexistir no inferioridad con no superioridad? Sí, eso equivale a declarar equivalencia (TOST).

Referencia: Ensayo de no inferioridad — Wikipedia