Calculadora
Introduce los datos muestrales y simula la distribución nula de \(W\) por Monte Carlo para obtener un p-valor empírico.
Cómo leer el gráfico (paso a paso): 1) La simulación Monte Carlo genera muchas muestras normales bajo \(H_0\) del mismo tamaño que tu muestra y calcula un \(W\) en cada una. 2) Las barras azules cuentan cuántas simulaciones cayeron en cada rango de \(W\): por eso su eje Y es frecuencia y su eje X es valor de \(W\). 3) El marcador rojo señala tu \(W\) observado y el verde el \(W\) crítico para \(\alpha\). Solo importa su posición horizontal (X); su altura vertical se fija artificialmente para que se vean sobre las barras.
Explicación
El test de Shapiro–Wilk es una prueba estadística diseñada para evaluar si una muestra de datos puede considerarse proveniente de una distribución normal. Es uno de los tests de normalidad más potentes y recomendados para tamaños muestrales pequeños y moderados.
El test compara:
- Los datos ordenados de tu muestra
- l os valores esperados de una muestra normal ordenada
La hipótesis nula plantea que los datos siguen una normal; la alternativa plantea que no siguen una normal. El estadístico del test se denota por \(W\), y toma valores entre 0 y 1: cuanto más cerca de 1, mayor compatibilidad con normalidad.
El estadístico de Shapiro–Wilk se construye combinando los datos ordenados \(x_{(i)}\) con coeficientes \(a_i\) que dependen de \(n\):
\(W = \dfrac{\left(\sum_{i=1}^{m} a_i(x_{(n+1-i)}-x_{(i)})\right)^2}{\sum_{i=1}^{n}(x_i-\bar{x})^2}\) donde:
- \(x_{(i)}\) son los datos ordenados,
- \(a_i\) son coeficientes calculados a partir de los cuantiles normales teóricos,
- el denominador es la variabilidad total de la muestra.
Dado que el estadístico \(W\) no posee una distribución de probabilidad cerrada bajo la hipótesis de normalidad, su distribución se aproxima mediante simulación de Monte Carlo. Para ello se generan muchas muestras normales \(N(0,1)\), ya que el valor de \(W\) es invariante a cambios de escala y traslación: solo importa el orden de los datos, la forma de la distribución y la relación lineal entre los cuantiles normales teóricos y los datos observados. En cada muestra simulada de tamaño \(n\) se calcula el estadístico \(W\), y con todos esos valores se construye una distribución empírica. El valor observado \(W_{\text{obs}}\) se compara con esta distribución simulada para obtener el p‑valor del test.
La decisión formal se realiza con el p-valor: si es menor que el nivel de significación \(\alpha\), se rechaza la normalidad.
Hipótesis y estadístico
\(H_0\): la muestra procede de una distribución normal
\(H_1\): la muestra no procede de una distribución normal
\(W = \dfrac{\left(\sum_{i=1}^{m} a_i(x_{(n+1-i)}-x_{(i)})\right)^2}{\sum_{i=1}^{n}(x_i-\bar{x})^2}\)
Contraste rápido
En Shapiro–Wilk, el p-valor es la base de la decisión estadística. El estadístico \(W\) resume cuánto se desvían los datos ordenados respecto al patrón esperado bajo normalidad.
\(\text{Si } p < \alpha\Rightarrow\) rechazar \(H_0\)
\(\text{Si } p \ge \alpha\Rightarrow\) no rechazar \(H_0\)
Un resultado no significativo no demuestra normalidad perfecta: indica que, con la evidencia disponible en esa muestra, no se detectan desviaciones claras. Conviene complementar con gráfico Q–Q e histograma.
Ejemplo resuelto
En un proceso de control de calidad se miden las dimensiones (en mm) de 10 piezas fabricadas: 23,1; 24,5; 22,8; 25,2; 24,1; 23,7; 24,9; 23,5; 25,0; 24,3. Se desea verificar, con \(\alpha = 0{,}05\), si estos datos son compatibles con una distribución normal.
Se ordenan los datos de menor a mayor: 22,8; 23,1; 23,5; 23,7; 24,1; 24,3; 24,5; 24,9; 25,0; 25,2. La media muestral es \(\bar{x} = 24{,}11\) mm y la suma de cuadrados de desviaciones respecto a la media es \(\sum(x_i - \bar{x})^2 = 6{,}069\).
El estadístico de Shapiro–Wilk combina los datos ordenados con los coeficientes tabulados \(a_i\) para \(n = 10\). Aplicando esos coeficientes a los pares simétricos de la muestra ordenada se obtiene la suma \(b = \sum a_i x_{(n+1-i)}\). El estadístico es:
\( W = \frac{b^2}{\sum_{i=1}^{n}(x_i - \bar{x})^2} \approx \frac{5{,}808}{6{,}069} \approx 0{,}957 \)
Para \(n = 10\) y \(W = 0{,}957\), el p-valor aproximado obtenido por interpolación en las tablas de Shapiro–Wilk es \(p \approx 0{,}80\).
Dado que \(p = 0{,}94 \gg 0{,}05 = \alpha\), no se rechaza \(H_0\). Un valor de \(W\) cercano a 1 indica que los datos se ajustan bien a una distribución normal; valores próximos a 0 indicarían fuertes desviaciones.
Conclusión: con un nivel de significación del 5 %, no hay evidencia estadística de que las dimensiones de las piezas no sigan una distribución normal. Este resultado permite aplicar con confianza herramientas paramétricas como gráficos de control \(\bar{x}\)-R o cartas de control basadas en la distribución normal en etapas posteriores del análisis de calidad.
Cómo interpretar el resultado
Rechazar \(H_0\) (p-valor < \(\alpha\)) indica que hay evidencia estadística de que los datos no provienen de una distribución normal. Sin embargo, la causa puede ser diversa: colas más pesadas de lo normal (leptocurtosis), asimetría, o simplemente la presencia de valores atípicos. Para identificar el tipo de desviación, complementa con el gráfico Q-Q (cuantil-cuantil): si los puntos se curvan hacia arriba en la cola derecha hay asimetría positiva; si las colas se separan de la línea de referencia, hay exceso de curtosis.
No rechazar \(H_0\) (p-valor ≥ \(\alpha\)) no demuestra normalidad; solo indica que los datos son compatibles con una distribución normal al nivel elegido. Con muestras pequeñas (\(n < 20\)), el test tiene muy poca potencia y casi nunca rechazará \(H_0\), incluso cuando los datos se alejan claramente de la normal. Con muestras grandes (\(n > 200\)), en cambio, desviaciones triviales pueden resultar altamente significativas sin impactar en la validez de los métodos paramétricos que asumen normalidad. En la práctica, lo relevante es si la desviación es suficientemente grave para invalidar el test que se pretende aplicar.
El estadístico W de Shapiro-Wilk varía entre 0 y 1: valores próximos a 1 indican que la muestra es consistente con la normalidad; valores cercanos a 0 señalan una desviación severa. A diferencia de los tests basados en chi-cuadrado o KS, Shapiro-Wilk tiene mayor potencia para detectar desviaciones en muestras pequeñas y es el test de normalidad recomendado para \(n \leq 50\). La herramienta muestra el valor W, el p-valor y, en la visualización, el Q-Q plot con la banda de confianza; si los puntos quedan dentro de la banda, la desviación respecto a la normalidad es compatible con el azar al nivel elegido.
Preguntas frecuentes
- ¿Qué tamaños muestrales son habituales para Shapiro–Wilk? Se usa mucho en muestras pequeñas y medianas, aunque también puede aplicarse en tamaños mayores según software.
- ¿Un p-valor alto demuestra normalidad? No. Solo indica que no hay evidencia suficiente para rechazar normalidad con esa muestra y ese nivel de significación.
- ¿Debo usar solo el test? No. La práctica recomendada es combinar test formal con gráfico Q–Q e histograma.
Referencia: scipy.stats.shapiro — SciPy Documentation