Home → Técnicas y Consejos → @RISK: Preguntas Generales → Latin Hypercube Versus Muestreo Monte Carlo
Also available in English: Latin Hypercube Versus Monte Carlo Sampling
Los manuales de @RISK y RISKOptimizer afirman: "Recomendamos usar Latin Hypercube, la configuración de tipo de muestreo predeterminada, a menos que su situación de modelado requiera específicamente el muestreo de Monte Carlo". Pero, ¿cuál es la diferencia real?
El muestreo de Monte Carlo se refiere a la técnica tradicional para usar números aleatorios o pseudoaleatorios para muestrear una distribución de probabilidad. Las técnicas de muestreo de Monte Carlo son, en principio, completamente aleatorias, es decir, cualquier valor de muestra dado puede caer en cualquier lugar dentro del rango de la distribución de entrada. Con suficientes iteraciones, el muestreo Monte Carlo recrea las distribuciones de entrada a través del muestreo. Sin embargo, surge un problema de agrupación cuando se realiza un pequeño número de iteraciones.
Cada simulación en @RISK o RISKOptimizer representa una muestra aleatoria de cada distribución de entrada. Surge naturalmente la pregunta, ¿cuánta separación esperamos entre la media de la muestra y la media de la distribución? O, para verlo de otra manera, ¿cuál es la probabilidad de que obtengamos una media de muestra que esté a una distancia determinada de la media de distribución?
El Teorema del Límite Central de la estadística (CLT) responde a esta pregunta con el concepto del error estándar de la media (SEM). Un SEM es la desviación estándar de la distribución de entrada, dividida por la raíz cuadrada del número de iteraciones por simulación. Por ejemplo, con RiskNormal(655,20) la desviación estándar es 20. Si tiene 100 iteraciones, el error estándar es 20/√100 = 2. El CLT nos dice que aproximadamente el 68 % de las medias de la muestra deben ocurrir dentro de un error estándar por encima o por debajo de la media de distribución, y el 95% debe ocurrir dentro de dos errores estándar por encima o por debajo. En la práctica, el muestreo con el método de muestreo de Monte Carlo sigue bastante de cerca este patrón.
Por el contrario, el muestreo Latin Hypercube estratifica las distribuciones de probabilidad de entrada. Con este tipo de muestreo, @RISK o RISKOptimizer divide la curva acumulativa en intervalos iguales en la escala de probabilidad acumulativa y luego toma un valor aleatorio de cada intervalo de la distribución de entrada. (El número de intervalos es igual al número de iteraciones). Ya no tenemos muestras aleatorias puras y ya no se aplica el CLT. En cambio, tenemos muestras aleatorias estratificadas.
El efecto es que cada muestra (los datos de cada simulación) está restringida para coincidir muy de cerca con la distribución de entrada. Esto es cierto para todas las iteraciones de una simulación, tomadas como grupo; por lo general, no es cierto para ninguna subsecuencia particular de iteraciones.
Por lo tanto, incluso para un número modesto de iteraciones, el método del hipercubo latino hace que todas o casi todas las medias de las muestras caigan dentro de una pequeña fracción del error estándar. Esto suele ser deseable, particularmente en @RISK cuando se realiza una sola simulación. Y cuando esté realizando múltiples simulaciones, sus medios estarán mucho más cerca con Latin Hypercube que con Monte Carlo; así es como el método Latin Hypercube hace que las simulaciones converjan más rápido que Monte Carlo.
Las distribuciones más fáciles para ver la diferencia son aquellas donde todas las posibilidades son igualmente probables. Elegimos cinco distribuciones enteras, cada una con 72 posibilidades, y una distribución continua Uniforme (0:72) con 72 contenedores. Los dos cuadernos adjuntos muestran el resultado de simular con 720 iteraciones (72×10), tanto el método de muestreo Monte Carlo como el método Latin Hypercube. Para mayor comodidad, los libros de trabajo ya contienen gráficos, pero también puede ejecutar simulaciones usted mismo.
Por supuesto, esos son casos artificiales. Los otros libros de trabajo adjuntos le permiten explorar cómo la distribución de las medias simuladas es diferente entre los métodos de muestreo Monte Carlo y Latin Hypercube. (Seleccione el archivo StandardErrorLHandMC que coincida con su versión de @RISK.) Seleccione el tamaño de su muestra y el número de simulaciones y haga clic en "Ejecutar comparación". Si lo desea, puede cambiar la media y la desviación estándar de la distribución de entrada, o incluso seleccionar una distribución completamente diferente para explorar. Bajo cada combinación que hemos probado, las medias de la muestra están mucho, mucho más juntas con el método de muestreo Latin Hypercube que con el método de Monte Carlo.
Si desea obtener más información sobre la teoría de los métodos de muestreo Monte Carlo y Latin Hypercube, consulte los apéndices técnicos del manual de @RISK.
Última actualización: 2023-02-10