¿Qué significa que las medias sean apareadas?

Significa que cada observación del primer conjunto está emparejada con una observación concreta del segundo, por ejemplo antes/después en el mismo individuo.

¿Por qué se calcula el intervalo sobre las diferencias?

Porque el apareamiento convierte el problema en un intervalo t para la media de las diferencias individuales d_i.

¿Qué significa si el intervalo incluye 0?

Si el intervalo incluye 0, los datos son compatibles con ausencia de cambio medio al nivel de confianza elegido.

Intervalo de confianza para medias apareadas

Calculadora

Introduce la media y desviación típica de las diferencias individuales, junto con el número de pares.

Media de las diferencias (d̄)

Desviación típica de las diferencias (s_d)

Número de pares (n)

Nivel de confianza

Definición de la diferencia

Nivel de confianza personalizado (0–1)

Resultado pendiente…

Explicación

Las medias apareadas aparecen cuando cada dato de un grupo está relacionado con un dato concreto del otro: medición antes/después en la misma persona, dos instrumentos aplicados a la misma muestra, o gemelos/parejas emparejadas. La unidad de análisis no son dos grupos separados, sino pares de observaciones.

Se usan muestras apareadas cuando hay una correspondencia natural unidad a unidad y esa correspondencia aporta información: el mismo paciente antes y después de un tratamiento, el mismo lote medido por dos métodos, o sujetos emparejados por edad, sexo u otra característica. En cambio, el IC para diferencia de medias independientes se usa cuando los grupos son distintos y no existe emparejamiento observación a observación.

La clave es no tratar los grupos como independientes. Primero se calcula una diferencia individual para cada par, por ejemplo \(d_i = \text{después}_i - \text{antes}_i\). Después se construye un intervalo t para la media poblacional de esas diferencias, \(\mu_d\). Así se aprovecha la correlación dentro de cada par y se elimina parte de la variabilidad entre individuos.

Fórmula

Denotamos por \(C\) el nivel de confianza y por \(\alpha=1-C\) el área total fuera del intervalo. Para un 95 % de confianza, \(C=0{,}95\), \(\alpha=0{,}05\) y \(\alpha/2=0{,}025\) en cada cola.

\( \bar{d} \pm t_{\alpha/2,\, n-1}\cdot \dfrac{s_d}{\sqrt{n}} \)

\(\bar{d}\): media muestral de las diferencias individuales.
\(s_d\): desviación típica muestral de las diferencias.
\(n\): número de pares observados.
\(t_{\alpha/2,\,n-1}\): valor crítico de la t de Student con \(n-1\) grados de libertad.

El margen de error es \(E=t_{\alpha/2,\,n-1}s_d/\sqrt{n}\), y el intervalo es \([\bar{d}-E,\;\bar{d}+E]\).

Ejemplo resuelto

En 18 pacientes se mide una variable antes y después de una intervención, definiendo \(d=\text{después}-\text{antes}\). La media de las diferencias es \(\bar{d}=4{,}2\) y su desviación típica es \(s_d=6{,}1\). Es importante que \(s_d\) sea la desviación típica de las diferencias individuales, no la desviación típica de las mediciones antes ni de las mediciones después por separado.

Para un 95 % de confianza se toma \(C=0{,}95\), por tanto \(\alpha=1-C=0{,}05\) y \(\alpha/2=0{,}025\). Con \(n=18\), los grados de libertad son \(gl=n-1=17\), y el valor crítico bilateral es aproximadamente \(t_{0{,}025,17}=2{,}110\).

El error estándar de la media de las diferencias es:

\( SE=\dfrac{s_d}{\sqrt{n}}=\dfrac{6{,}1}{\sqrt{18}}\approx1{,}438 \)

El margen de error es:

\( E=t\cdot SE=2{,}110\cdot1{,}438\approx3{,}03 \)

Por tanto, el intervalo de confianza queda:

\( 4{,}2 \pm 3{,}03 \approx [1{,}17,\;7{,}23] \)

Como el intervalo no incluye 0, el cambio medio es positivo al 95 % de confianza según la definición \(d=\text{después}-\text{antes}\). Si se hubiera definido \(d=\text{antes}-\text{después}\), los mismos datos producirían el intervalo con signo contrario.

Supuestos para medias apareadas

Los pares son independientes entre sí.
La distribución de las diferencias es aproximadamente normal, especialmente importante con pocos pares.
El 0 es el valor nulo: si el IC incluye 0, los datos son compatibles con ausencia de cambio medio.
El signo depende de cómo definas la diferencia. Si cambias de \(\text{después}-\text{antes}\) a \(\text{antes}-\text{después}\), el intervalo cambia de signo.

¿En qué se diferencia del IC para diferencia de medias independientes?

En muestras independientes se comparan dos grupos distintos y la variabilidad depende de \(s_1\), \(s_2\), \(n_1\) y \(n_2\). En medias apareadas, cada par se resume en una sola diferencia \(d_i\), y la variabilidad relevante es \(s_d\).

Situación	Datos necesarios	Parámetro estimado	Cuándo usarlo
Medias apareadas	Diferencias \(d_i\), o \(\bar d\), \(s_d\) y \(n\).	Media del cambio: \(\mu_d\).	Antes/después, métodos medidos en las mismas unidades, pares emparejados.
Medias independientes	\(\bar x_1\), \(\bar x_2\), \(s_1\), \(s_2\), \(n_1\), \(n_2\).	Diferencia entre medias: \(\mu_1-\mu_2\).	Dos grupos sin correspondencia unidad a unidad.

Ignorar el apareamiento suele perder información: si las mediciones dentro de cada par están correlacionadas, analizar las diferencias puede reducir mucho el error estándar.

Cómo interpretar el resultado

El intervalo \([L, U]\) es el rango plausible para la media poblacional de las diferencias individuales \(\mu_d\) al nivel de confianza elegido. Recuerda que \(\mu_d\) no es la diferencia de dos medias independientes, sino la media del cambio dentro de cada par: el mismo parámetro que mediría, de promediarse, todos los cambios individuales posibles de la población. Si el experimento se repitiera muchas veces con \(n\) pares, una proporción \(C\) de los ICs construidos con el mismo método contendría el verdadero valor de \(\mu_d\).

El valor de referencia en este tipo de intervalo es el 0, que representa ausencia de cambio medio. Si \(0 \in [L, U]\), los datos son compatibles con que no hay cambio sistemático al nivel de confianza elegido; equivalentemente, el contraste bilateral \(H_0\!: \mu_d = 0\) no se rechazaría al nivel \(\alpha = 1 - C\). Si \(L > 0\), el cambio medio es positivo según la definición de diferencia elegida; si \(U < 0\), el cambio medio es negativo. La dirección del intervalo depende directamente de cómo se define \(d_i\): cambiar de "después − antes" a "antes − después" invierte los signos de todos los límites.

Ventaja del apareamiento: al trabajar con diferencias individuales \(d_i\), se elimina la variabilidad entre individuos que no es relevante para estimar el cambio. El error estándar \(s_d/\sqrt{n}\) suele ser más pequeño que el que se obtendría tratando los grupos como independientes, por lo que el IC apareado es típicamente más estrecho y preciso.
Amplitud e incertidumbre: la amplitud del intervalo depende de \(s_d\) (la variabilidad del cambio entre individuos), de \(n\) (el número de pares) y del nivel de confianza. Aumentar \(n\) o reducir \(s_d\) (por ejemplo, mejorando la homogeneidad del apareamiento) reduce el margen de error.
Lectura del gráfico: la región verde bajo la curva t es la zona de confianza y las colas rojas (área \(\alpha/2\) cada una) delimitan los valores críticos \(\pm t_{\alpha/2,\,n-1}\). El intervalo en la escala original \([\bar{d} - E, \bar{d} + E]\) corresponde a los valores de \(\mu_d\) cuyo estadístico t caería dentro de la región verde.

Preguntas frecuentes

¿Puedo usar las dos medias por separado? No es lo recomendable. Para datos apareados necesitas las diferencias individuales o, al menos, \(\bar d\), \(s_d\) y \(n\).
¿Qué pasa si el IC incluye 0? No hay evidencia suficiente de cambio medio con el nivel de confianza elegido.
¿Qué signo tendrá el intervalo? Depende de la definición de \(d\). La calculadora te muestra la definición seleccionada para evitar confusiones.

Referencias usadas

Student (1908). The probable error of a mean, Biometrika, 6, 1–25.
Altman, D. G. (1991). Practical Statistics for Medical Research. Chapman & Hall.
Agresti, A. y Franklin, C. (2018). Statistics: The Art and Science of Learning from Data. Pearson.