Intervalos de confianza

Intervalo de confianza para una media (σ desconocida)

Estima la media poblacional cuando la desviación típica es desconocida usando la distribución t de Student.

Calculadora

Introduce los datos para obtener el intervalo de confianza usando la distribución t de Student.

Resultado pendiente…

Explicación

En la práctica, la desviación típica poblacional \(\sigma\) raramente se conoce con exactitud. Cuando se estima a partir de los propios datos muestrales usando \(s\), aparece una incertidumbre adicional que modela la distribución t de Student con \(n-1\) grados de libertad.

Con muestras grandes (n ≥ 30), la t de Student converge a la normal estándar y ambos intervalos dan resultados muy similares. Para muestras pequeñas, la t produce intervalos más anchos, reflejando correctamente la mayor incertidumbre.

Fórmula

Denotamos por \(C\) el nivel de confianza y por \(\alpha=1-C\) el área total fuera del intervalo. Para un 95 % de confianza, \(C=0{,}95\), \(\alpha=0{,}05\) y \(\alpha/2=0{,}025\) en cada cola.

\( \bar{x} \pm t_{\alpha/2,\, n-1} \cdot \dfrac{s}{\sqrt{n}} \)

  • \(\bar{x}\): media muestral observada.
  • \(t_{\alpha/2,\, n-1}\): valor crítico de la t de Student con \(n-1\) grados de libertad.
  • \(s\): desviación estándar muestral (con divisor \(n-1\)).
  • \(n\): tamaño de la muestra.

El margen de error es \(E = t_{\alpha/2,\, n-1} \cdot s/\sqrt{n}\) y el intervalo es \([\bar{x} - E,\; \bar{x} + E]\).

Ejemplo resuelto

Se mide el tiempo de respuesta (en ms) de un servicio web en 15 peticiones: \(\bar{x} = 245{,}3\) ms, \(s = 38{,}7\) ms. Con 95 % de confianza (\(C=0{,}95\), \(\alpha=0{,}05\)) y \(gl = 14\):

\( 245{,}3 \pm 2{,}145 \cdot \frac{38{,}7}{\sqrt{15}} \approx [224{,}0,\; 266{,}7] \text{ ms} \)

Supuestos del intervalo t

  • La muestra es aleatoria e independiente.
  • La variable se distribuye normalmente en la población (especialmente importante para muestras pequeñas). Para n grande, el teorema central del límite lo justifica aunque la distribución no sea exactamente normal.
  • \(\sigma\) es desconocida y se estima con \(s\).

Cómo interpretar el resultado

El intervalo \([L, U]\) es el rango de valores de la media poblacional \(\mu\) compatibles con los datos observados y el nivel de confianza elegido. El significado frecuentista es el siguiente: si repitieras el experimento muchas veces —tomando cada vez una muestra del mismo tamaño y construyendo el IC con el mismo procedimiento— aproximadamente un \(C \times 100\,\%\) de esos intervalos contendría el verdadero valor de \(\mu\). No es una afirmación probabilística sobre el parámetro concreto, sino sobre la fiabilidad del método a largo plazo.

La amplitud del intervalo comunica directamente la precisión de la estimación. Un intervalo estrecho indica mayor precisión: se obtiene con muestras más grandes, con menor variabilidad en los datos o aceptando un nivel de confianza algo menor. Un intervalo ancho no es un error en sí mismo; refleja honestamente que con esa muestra hay mucha incertidumbre sobre \(\mu\). En el gráfico, la región verde es la zona de confianza bajo la curva t y las colas rojas representan cada una \(\alpha/2\) del área total; los valores críticos \(\pm t_{\alpha/2,\,n-1}\) delimitan esas regiones.

  • Conexión con el contraste: si un valor de referencia \(\mu_0\) queda fuera del intervalo, los datos rechazarían \(H_0\!: \mu = \mu_0\) al nivel de significación \(\alpha = 1 - C\) en el contraste bilateral equivalente. Si \(\mu_0\) queda dentro, no hay evidencia para rechazarlo.
  • Efecto del tamaño muestral: duplicar \(n\) reduce el margen de error en un factor \(\sqrt{2} \approx 1{,}41\); para reducirlo a la mitad hace falta cuadruplicar \(n\).
  • Efecto de la confianza: aumentar la confianza del 95 % al 99 % ensancha el intervalo porque el valor crítico \(t\) crece; exigir mayor certeza tiene el coste de ser menos preciso.

Preguntas frecuentes

  • ¿Por qué se usa t en lugar de z? Porque al estimar \(\sigma\) con \(s\) se introduce incertidumbre adicional; la distribución t tiene colas más pesadas para captarla.
  • ¿Cuándo convergen t y z? Para n ≥ 30 la diferencia es prácticamente despreciable en la mayoría de aplicaciones.
  • ¿Necesito que los datos sean normales? Para n pequeño sí importa. Para n grande, el TCL garantiza que \(\bar{x}\) se distribuye aproximadamente normal.

Referencia: Intervalo de confianza — Wikipedia