Calculadora
Introduce los datos para obtener el intervalo de confianza usando la distribución t de Student.
Explicación
En la práctica, la desviación típica poblacional \(\sigma\) raramente se conoce con exactitud. Cuando se estima a partir de los propios datos muestrales usando \(s\), aparece una incertidumbre adicional que modela la distribución t de Student con \(n-1\) grados de libertad.
Con muestras grandes (n ≥ 30), la t de Student converge a la normal estándar y ambos intervalos dan resultados muy similares. Para muestras pequeñas, la t produce intervalos más anchos, reflejando correctamente la mayor incertidumbre.
Fórmula
Denotamos por \(C\) el nivel de confianza y por \(\alpha=1-C\) el área total fuera del intervalo. Para un 95 % de confianza, \(C=0{,}95\), \(\alpha=0{,}05\) y \(\alpha/2=0{,}025\) en cada cola.
\( \bar{x} \pm t_{\alpha/2,\, n-1} \cdot \dfrac{s}{\sqrt{n}} \)
- \(\bar{x}\): media muestral observada.
- \(t_{\alpha/2,\, n-1}\): valor crítico de la t de Student con \(n-1\) grados de libertad.
- \(s\): desviación estándar muestral (con divisor \(n-1\)).
- \(n\): tamaño de la muestra.
El margen de error es \(E = t_{\alpha/2,\, n-1} \cdot s/\sqrt{n}\) y el intervalo es \([\bar{x} - E,\; \bar{x} + E]\).
Ejemplo resuelto
Se mide el tiempo de respuesta (en ms) de un servicio web en 15 peticiones: \(\bar{x} = 245{,}3\) ms, \(s = 38{,}7\) ms. Con 95 % de confianza (\(C=0{,}95\), \(\alpha=0{,}05\)) y \(gl = 14\):
\( 245{,}3 \pm 2{,}145 \cdot \frac{38{,}7}{\sqrt{15}} \approx [224{,}0,\; 266{,}7] \text{ ms} \)
Supuestos del intervalo t
- La muestra es aleatoria e independiente.
- La variable se distribuye normalmente en la población (especialmente importante para muestras pequeñas). Para n grande, el teorema central del límite lo justifica aunque la distribución no sea exactamente normal.
- \(\sigma\) es desconocida y se estima con \(s\).
Cómo interpretar el resultado
El intervalo \([L, U]\) es el rango de valores de la media poblacional \(\mu\) compatibles con los datos observados y el nivel de confianza elegido. El significado frecuentista es el siguiente: si repitieras el experimento muchas veces —tomando cada vez una muestra del mismo tamaño y construyendo el IC con el mismo procedimiento— aproximadamente un \(C \times 100\,\%\) de esos intervalos contendría el verdadero valor de \(\mu\). No es una afirmación probabilística sobre el parámetro concreto, sino sobre la fiabilidad del método a largo plazo.
La amplitud del intervalo comunica directamente la precisión de la estimación. Un intervalo estrecho indica mayor precisión: se obtiene con muestras más grandes, con menor variabilidad en los datos o aceptando un nivel de confianza algo menor. Un intervalo ancho no es un error en sí mismo; refleja honestamente que con esa muestra hay mucha incertidumbre sobre \(\mu\). En el gráfico, la región verde es la zona de confianza bajo la curva t y las colas rojas representan cada una \(\alpha/2\) del área total; los valores críticos \(\pm t_{\alpha/2,\,n-1}\) delimitan esas regiones.
- Conexión con el contraste: si un valor de referencia \(\mu_0\) queda fuera del intervalo, los datos rechazarían \(H_0\!: \mu = \mu_0\) al nivel de significación \(\alpha = 1 - C\) en el contraste bilateral equivalente. Si \(\mu_0\) queda dentro, no hay evidencia para rechazarlo.
- Efecto del tamaño muestral: duplicar \(n\) reduce el margen de error en un factor \(\sqrt{2} \approx 1{,}41\); para reducirlo a la mitad hace falta cuadruplicar \(n\).
- Efecto de la confianza: aumentar la confianza del 95 % al 99 % ensancha el intervalo porque el valor crítico \(t\) crece; exigir mayor certeza tiene el coste de ser menos preciso.
Preguntas frecuentes
- ¿Por qué se usa t en lugar de z? Porque al estimar \(\sigma\) con \(s\) se introduce incertidumbre adicional; la distribución t tiene colas más pesadas para captarla.
- ¿Cuándo convergen t y z? Para n ≥ 30 la diferencia es prácticamente despreciable en la mayoría de aplicaciones.
- ¿Necesito que los datos sean normales? Para n pequeño sí importa. Para n grande, el TCL garantiza que \(\bar{x}\) se distribuye aproximadamente normal.
Referencia: Intervalo de confianza — Wikipedia