Nuestros especialistas testean cada día diferentes posibilidades del Machine Learning. La previsión de la demanda es una de las muchas formas de transformar los datos en información estratégica de valor. ¿Quieres saber cómo? Conoce más a fondo qué es la previsión de la demanda y por qué deberías empezar a trabajar con ella ahora mismo.

Cada vez hay más sectores que se están volviendo más eficientes y competitivos. Cada vez más actividades económicas tienen lugar online por lo que se generan enormes cantidades de datos. En este contexto, los modelos de aprendizaje automático tienen un valor incalculable para obtener una ventaja competitiva.

El objetivo de la previsión de la demanda es conocer la demanda futura de un determinado producto o servicio. Esto se hace casi siempre utilizando datos históricos de ventas en forma de series temporales. Una serie temporal es un indicador que muestra una determinada cantidad en relación con un intervalo de tiempo dado. En el ámbito empresarial, suele utilizarse para representar la demanda de un producto o servicio durante un periodo de tiempo determinado. Tomemos como ejemplo la cantidad de botes de champú vendidos por L'Oréal entre 1960 y 1999.

Voorbeeld van een time series grafiek - Machine Learning

Este tipo de gráficos pueden ser muy útiles para que los responsables de estrategia de negocio reconozcan patrones y ajusten los procesos en función de los datos obtenidos. Lo que puede ser aún más útil es que un modelo matemático pueda predecir con relativa exactitud la demanda futura de un producto o servicio. Así se crea una previsión de demanda e ingresos a partir de la cual una organización puede ajustar sus operaciones.

Afortunadamente, existen varias técnicas avanzadas diseñadas exactamente para este fin. La idea que subyace en estos modelos matemáticos de previsión es dividir los datos relativos a las series temporales entre varias señales independientes que se calculan por aproximación matemática. A continuación, se combinan en una predicción. Muchos de estos modelos matemáticos suelen denominarse modelos autorregresivos y presuponen que una serie temporal está conformada por tres elementos que intentan imitar.

1. Media móvil

En primer lugar, existe una media móvil que predice la dirección en la que se mueve la serie temporal en términos generales, independientemente de las oscilaciones individuales.

2. Autorregresión

En segundo lugar, está la parte autorregresiva, la cual predice las fluctuaciones en torno a la media móvil. Este tipo de fluctuaciones, según el modelo, están fuertemente influenciadas por patrones detectados en el pasado (que pueden tener un factor estacional). Esta parte del modelo matemático es eficaz para predecir fluctuaciones de aspecto aleatorio que siguen teniendo cierta coherencia en el histórico de la serie temporal.

3. Ruido

En tercer lugar está el ruido. Esta parte incorpora un cierto margen de aleatoriedad en el modelo y asume que el proceso real (mundo real) en el que se generan los datos también contiene un cierto grado de aleatoriedad. Para ello, se cuantifican las fluctuaciones no previstas en el pasado en una función de probabilidad, que se incorpora al modelo matemático para tener en cuenta un margen de incertidumbre.

Voorbeeld van resultaat van een wiskundig demand forecasting model

Uno de estos modelos se denomina ARIMA (AutoRegressive Integrated Moving Average).
Se trata de un modelo con un alto grado de adaptabilidad y consta de los tres elementos explicados anteriormente. El núcleo matemático del modelo queda fuera del alcance de este artículo, pero en cualquier caso el modelo calcula el valor del siguiente punto de datos desconocido, teniendo en cuenta toda la serie temporal.

Un buen ejemplo de la aplicación de ARIMA es un caso de uso del suministro eléctrico en China. Para un país en rápido desarrollo como China, donde un crecimiento anual del consumo eléctrico del 34% no es nada extraño, es de gran importancia conocer el uso energético previsto. Utilizando datos de consumo de 2006 a 2010 y una variante del modelo ARIMA, se generó una previsión con un MAPE inferior al 3%.

MAPE significa Mean Average Percentage Error (Error Porcentual Absoluto Medio), que es la diferencia absoluta entre la predicción y la realidad expresada como porcentaje respecto a la predicción. Así pues, utilizando un modelo ARIMA, China ha podido predecir con gran exactitud la demanda de electricidad de su población.

Un ejemplo a mayor escala es la predicción de las precipitaciones en Kanchipuram. Utilizando 1.200 datasets de precipitaciones de esa zona entre 1901 y 2002, los científicos han creado una estimación ARIMA a cuatro años con un MAPE del 6,5%. Los procesos naturales también pueden ser calculados con un modelo autorregresivo como ARIMA.

Las técnicas de previsión de series temporales como ARIMA son muy buenas para predecir fechas a largo plazo con carácter periódico, sin embargo, los factores externos más extremos siguen siendo impredecibles, pensemos en catástrofes naturales o crisis económicas. Incluso una empresa con las mejores técnicas de previsión se verá sorprendida por este tipo de circunstancias externas repentinas. Además, no todos los procesos son compatibles con este tipo de modelización estadística. Si el curso de una serie temporal parece extremadamente volátil y aleatorio, podría ser más apropiado aplicar otro enfoque. En este caso, una red neuronal podría ser una solución adecuada.

Con todo, una red neuronal actúa como una caja negra y ofrece poca información sobre cómo ha llegado el modelo a la predicción realizada. Esto hace que los hallazgos de una red neuronal sean mucho menos valiosos que los de un modelo matemático de naturaleza determinista.

En el caso de las series temporales, es muy importante disponer de datos coherentes y precisos. También es importante que los datos sean fiables. Supongamos que en varias ocasiones hay un 10% de ventas mensuales que no se han incluido en el dataset, esto puede significar la diferencia entre un pronóstico correcto o incorrecto. La elección final de un modelo autorregresivo matemático o de un modelo más complejo dependerá de la cantidad y la precisión de los datos de las series temporales, así como de los requisitos de la empresa que desee implantar una técnica de previsión.

Aspectos clave de los datos:

  1. Los datos son completos. No faltan valores ni son imprecisos.

  2. Los datos están disponibles durante un periodo de tiempo relativamente largo sin muchas interrupciones.

Conocer la demanda futura de un determinado producto o servicio resulta de gran valor para las empresas. ¿Te preguntas por dónde empezar? ¿O ya dispones de muchos datos pero no sabes cómo dar el siguiente paso? Te ayudamos a separar el grano de la paja y a generar información valiosa para tu negocio.

¿A qué estás esperando?