¿Por qué se usa t en lugar de z?

Porque al estimar \(\sigma\) con \(s\) se introduce incertidumbre adicional; la distribución t tiene colas más pesadas para captarla.

¿Cuándo convergen t y z?

Para n ≥ 30 la diferencia es prácticamente despreciable en la mayoría de aplicaciones.

¿Necesito que los datos sean normales?

Para n pequeño sí importa. Para n grande, el TCL garantiza que \(\bar{x}\) se distribuye aproximadamente normal.

IC para la media t de Student

Calculadora

Introduce los datos para obtener el intervalo de confianza usando la distribución t de Student.

Media muestral (x̄)

Desviación estándar muestral (s)

Tamaño muestral (n)

Nivel de confianza

Nivel de confianza personalizado (0–1)

Resultado pendiente…

Explicación

En la práctica, la desviación típica poblacional \(\sigma\) raramente se conoce con exactitud. Cuando se estima a partir de los propios datos muestrales usando \(s\), aparece una incertidumbre adicional que modela la distribución t de Student con \(n-1\) grados de libertad.

Con muestras grandes (n ≥ 30), la t de Student converge a la normal estándar y ambos intervalos dan resultados muy similares. Para muestras pequeñas, la t produce intervalos más anchos, reflejando correctamente la mayor incertidumbre.

Fórmula

Denotamos por \(C\) el nivel de confianza y por \(\alpha=1-C\) el área total fuera del intervalo. Para un 95 % de confianza, \(C=0{,}95\), \(\alpha=0{,}05\) y \(\alpha/2=0{,}025\) en cada cola.

\( \bar{x} \pm t_{\alpha/2,\, n-1} \cdot \dfrac{s}{\sqrt{n}} \)

\(\bar{x}\): media muestral observada.
\(t_{\alpha/2,\, n-1}\): valor crítico de la t de Student con \(n-1\) grados de libertad.
\(s\): desviación estándar muestral (con divisor \(n-1\)).
\(n\): tamaño de la muestra.

El margen de error es \(E = t_{\alpha/2,\, n-1} \cdot s/\sqrt{n}\) y el intervalo es \([\bar{x} - E,\; \bar{x} + E]\).

Ejemplo resuelto

Se mide el tiempo de respuesta (en ms) de un servicio web en 15 peticiones: \(\bar{x} = 245{,}3\) ms, \(s = 38{,}7\) ms. Con 95 % de confianza (\(C=0{,}95\), \(\alpha=0{,}05\)) y \(gl = 14\):

\( 245{,}3 \pm 2{,}145 \cdot \frac{38{,}7}{\sqrt{15}} \approx [223{,}9,\; 266{,}7] \text{ ms} \)

Supuestos del intervalo t

La muestra es aleatoria e independiente.
La variable se distribuye normalmente en la población (especialmente importante para muestras pequeñas). Para n grande, el teorema central del límite lo justifica aunque la distribución no sea exactamente normal.
\(\sigma\) es desconocida y se estima con \(s\).

Cómo interpretar el resultado

El intervalo \([L, U]\) es el rango de valores de la media poblacional \(\mu\) compatibles con los datos observados y el nivel de confianza elegido. El significado frecuentista es el siguiente: si repitieras el experimento muchas veces —tomando cada vez una muestra del mismo tamaño y construyendo el IC con el mismo procedimiento— aproximadamente un \(C \times 100\,\%\) de esos intervalos contendría el verdadero valor de \(\mu\). No es una afirmación probabilística sobre el parámetro concreto, sino sobre la fiabilidad del método a largo plazo.

La amplitud del intervalo comunica directamente la precisión de la estimación. Un intervalo estrecho indica mayor precisión: se obtiene con muestras más grandes, con menor variabilidad en los datos o aceptando un nivel de confianza algo menor. Un intervalo ancho no es un error en sí mismo; refleja honestamente que con esa muestra hay mucha incertidumbre sobre \(\mu\). En el gráfico, la región verde es la zona de confianza bajo la curva t y las colas rojas representan cada una \(\alpha/2\) del área total; los valores críticos \(\pm t_{\alpha/2,\,n-1}\) delimitan esas regiones.

Conexión con el contraste: si un valor de referencia \(\mu_0\) queda fuera del intervalo, los datos rechazarían \(H_0\!: \mu = \mu_0\) al nivel de significación \(\alpha = 1 - C\) en el contraste bilateral equivalente. Si \(\mu_0\) queda dentro, no hay evidencia para rechazarlo.
Efecto del tamaño muestral: duplicar \(n\) reduce el margen de error en un factor \(\sqrt{2} \approx 1{,}41\); para reducirlo a la mitad hace falta cuadruplicar \(n\).
Efecto de la confianza: aumentar la confianza del 95 % al 99 % ensancha el intervalo porque el valor crítico \(t\) crece; exigir mayor certeza tiene el coste de ser menos preciso.

Preguntas frecuentes

¿Por qué se usa t en lugar de z? Porque al estimar \(\sigma\) con \(s\) se introduce incertidumbre adicional; la distribución t tiene colas más pesadas para captarla.
¿Cuándo convergen t y z? Para n ≥ 30 la diferencia es prácticamente despreciable en la mayoría de aplicaciones.
¿Necesito que los datos sean normales? Para n pequeño sí importa. Para n grande, el TCL garantiza que \(\bar{x}\) se distribuye aproximadamente normal.

Referencia: Intervalo de confianza — Wikipedia