Simulaciones estadísticas interactivas

Experimenta con distribuciones, teoremas y procesos estocásticos en tiempo real. Ajusta los parámetros y observa cómo cambia la estadística.

Simulaciones disponibles

¿Qué es una simulación estadística?

Una simulación estadística es un experimento computacional que genera datos aleatorios siguiendo un modelo probabilístico específico, con el objetivo de estudiar el comportamiento de estadísticos, estimar probabilidades o comprender propiedades teóricas que de otro modo serían difíciles de visualizar.

A diferencia de los cálculos analíticos exactos, las simulaciones permiten observar directamente cómo se comporta la aleatoriedad en la práctica: qué aspecto tiene una muestra de tamaño 10 frente a una de tamaño 1000, cómo convergen las distribuciones muestrales o qué fracción de los intervalos de confianza cubren realmente el parámetro verdadero.

El método de Monte Carlo —el enfoque de simulación más utilizado en estadística— lleva el nombre del famoso casino mónegasco por su relación con el azar. Consiste en repetir un experimento aleatorio miles de veces para aproximar probabilidades y distribuciones mediante frecuencias relativas. Es una herramienta fundamental en finanzas cuantitativas, física de partículas, bioinformática y muchos otros campos.

Por qué aprender estadística con simulaciones

Muchos conceptos estadísticos son contraintuitivos cuando se presentan solo a través de fórmulas. La simulación permite construir intuición de forma experimental:

  • El teorema central del límite afirma que la media de muchas observaciones independientes sigue una distribución normal, independientemente de la distribución original. Esto es sorprendente: ¿cómo puede una distribución asimétrica o discreta producir medias perfectamente normales? La simulación lo hace visible.
  • Los intervalos de confianza al 95 % no significa que haya un 95 % de probabilidad de que el parámetro esté en ese intervalo concreto. Significa que el procedimiento de construcción produce intervalos que capturan el verdadero parámetro el 95 % de las veces. La diferencia es sutil pero fundamental, y se aprecia fácilmente simulando cientos de intervalos.
  • Las cadenas de Markov modelan sistemas que evolucionan en el tiempo de forma aleatoria pero con "memoria corta": el estado siguiente solo depende del estado actual, no de la historia completa. Su convergencia a una distribución estacionaria es un resultado teórico que se puede observar directamente ejecutando la cadena durante suficientes pasos.
  • El proceso de Poisson es el modelo canónico para eventos raros que ocurren a tasa constante: llamadas telefónicas, llegadas de clientes, desintegraciones radiactivas. Simularlo permite entender por qué los tiempos entre eventos siguen una distribución exponencial y cómo se acumulan los eventos en el tiempo.

Simulador del teorema central del límite

El teorema central del límite (TCL) es uno de los resultados más importantes de la probabilidad y la estadística. Establece que, bajo condiciones muy generales, la suma (o media) de un número suficientemente grande de variables aleatorias independientes e idénticamente distribuidas se aproxima a una distribución normal, independientemente de la distribución original de cada variable.

En la práctica, esto justifica el uso de tests paramétricos (t, z, ANOVA…) incluso cuando los datos individuales no son normales, siempre que la muestra sea lo suficientemente grande. Para la mayoría de distribuciones, n ≥ 30 suele ser suficiente; para distribuciones muy asimétricas o de cola pesada, puede ser necesario un n mayor.

El simulador permite elegir entre seis distribuciones (Normal, Uniforme, Exponencial, Bernoulli, Poisson y Chi-cuadrado) y observar cómo la distribución de la media muestral converge a una normal a medida que aumenta el tamaño de la muestra n.

Abrir simulador del TCL →

Simulador de intervalos de confianza

Un intervalo de confianza al 95 % es un rango de valores calculado a partir de los datos muestrales de tal forma que, si repitiéramos el estudio muchas veces y construyéramos el intervalo en cada repetición, el 95 % de esos intervalos contendría el verdadero valor del parámetro.

Esta definición es muy diferente de decir "hay un 95 % de probabilidad de que el parámetro esté en este intervalo". Una vez calculado el intervalo concreto, el parámetro o está dentro o no lo está: no hay probabilidad. La probabilidad del 95 % se refiere al procedimiento de construcción, no al intervalo individual.

El simulador genera repetidamente muestras aleatorias, calcula el intervalo de confianza para cada una y visualiza en qué fracción de los casos el intervalo cubre el verdadero parámetro. La cobertura empírica converge al nivel nominal (95 %, 90 % o 99 %) conforme aumenta el número de simulaciones.

Abrir simulador de intervalos de confianza →

Simulador de cadenas de Markov

Una cadena de Markov es un proceso estocástico que evoluciona en pasos discretos a través de un conjunto finito de estados, con la propiedad de que la probabilidad de pasar al estado siguiente depende únicamente del estado actual, no de cómo se llegó a él. Esta propiedad se denomina propiedad de Markov o "falta de memoria".

Las cadenas de Markov tienen aplicaciones muy amplias: modelos del tiempo meteorológico, comportamiento de clientes (activo, inactivo, churned), navegación web (PageRank de Google), genética de poblaciones, cadenas de Markov Monte Carlo (MCMC) en estadística bayesiana, y muchos más.

Bajo condiciones de ergodicidad (irreducibilidad y aperiodicidad), una cadena de Markov converge a una distribución estacionaria única, independientemente del estado inicial. Esta distribución es la solución al sistema πP = π, donde P es la matriz de transición.

El simulador permite definir la matriz de transición (con presets para escenarios reales), ejecutar la cadena durante varios pasos y observar la evolución de la distribución de estados hacia el equilibrio.

Abrir simulador de cadenas de Markov →

Simulador de proceso de Poisson

Un proceso de Poisson es un modelo para eventos que ocurren de forma aleatoria en el tiempo a una tasa media constante λ (lambda). Tres propiedades lo caracterizan: los eventos son independientes entre sí, la probabilidad de que ocurra un evento en un intervalo muy pequeño es proporcional al tamaño del intervalo, y no pueden ocurrir dos eventos exactamente al mismo tiempo.

El número de eventos que ocurren en un intervalo de tiempo t sigue una distribución de Poisson con media λt. Los tiempos entre eventos consecutivos siguen una distribución exponencial con media 1/λ. Esta conexión entre el proceso de Poisson y la distribución exponencial es una de las relaciones más elegantes de la teoría de probabilidad.

Ejemplos de procesos que se modelan frecuentemente con un proceso de Poisson: llegadas a una cola de servicio (clientes a una ventanilla, paquetes de red), incidentes de seguridad en un sistema informático, mutaciones genéticas, colisiones de partículas en física nuclear.

El simulador permite visualizar trayectorias individuales como función escalonada, estudiar la distribución del número de eventos en distintos horizontes temporales y comparar los tiempos entre eventos con la distribución exponencial teórica.

Abrir simulador de proceso de Poisson →

Simulador de paseo aleatorio 1D y 2D

Un paseo aleatorio es una sucesión de pasos en los que la dirección de cada movimiento se elige al azar. En 1D, una partícula avanza +1 o retrocede −1 en cada instante. En 2D, se mueve en cualquiera de las cuatro direcciones cardinales con igual probabilidad.

La propiedad más característica es que la dispersión crece como √n y no como n: después de n pasos, las posiciones se distribuyen como N(μ, σ²n) con σ proporcional a √n. Las bandas teóricas ±2σ del simulador muestran este ensanchamiento en abanico.

La simulación incluye derive (p ≠ 0,5), recurrencia 2D (la trayectoria regresa al origen infinitas veces) y la conexión con el movimiento browniano, la ruina del jugador y la ley de difusión.

Abrir simulador de paseo aleatorio →

Simulador de errores tipo I y tipo II

En un contraste de hipótesis se cometen dos tipos de errores: el error tipo I (rechazar H₀ siendo cierta, controlado por α) y el error tipo II (no rechazar H₀ cuando H₁ es verdadera, igual a β). La potencia estadística es 1 − β: la probabilidad de detectar un efecto real.

El simulador muestra visualmente las dos distribuciones del estadístico Z (bajo H₀ y bajo H₁) solapadas en un mismo gráfico. Al mover los controles en tiempo real se aprecia cómo reducir α aumenta β, cómo aumentar el tamaño del efecto o el tamaño muestral separa las distribuciones y aumenta la potencia, y por qué α y β no pueden minimizarse simultáneamente.

Abrir simulador de errores tipo I y tipo II →

Simulador bootstrap

El bootstrap (Efron, 1979) es una técnica de remuestreo que estima la distribución muestral de cualquier estadístico —media, mediana, desviación típica, correlación…— sin necesidad de asumir una distribución paramétrica. La idea central es tratar la muestra observada como si fuera la población y generar B muestras «bootstrap» extrayendo con reemplazamiento de la muestra original.

El simulador permite elegir distribución poblacional, estadístico de interés, tamaño muestral y número de réplicas. Dos botones independientes permiten generar una nueva muestra o regenerar las réplicas bootstrap sobre la misma muestra, facilitando la comprensión de la variabilidad del propio bootstrap. El intervalo de confianza por el método del percentil se visualiza sombreado en verde sobre la distribución bootstrap.

Abrir simulador bootstrap →

Herramientas relacionadas