Nuevos métodos de predicción económica con datos masivos

Nuevos métodos de predicción económica con datos masivos

Fecha: febrero 2021
Daniel Peña, Pilar Poncela y Esther Ruiz (editores)

Sumario

Presentación

En este siglo la revolución en la velocidad de almacenamiento y computación, de trans­misión de la información y la disponibilidad de grandes bases de datos masivos, el conocido en el argot como big data, han abierto en la última década nuevas posibilidades en la predicción de fenómenos complejos en economía y finanzas. Desde el campo de aprendizaje automático (Machine Learning, ML por sus siglas en inglés) e inteligencia artificial, se han desarrollado nuevos métodos de predicción que, prescindiendo de hipótesis sobre el modelo generador de los datos, tratan de explotar las relaciones (posiblemente no lineales) existentes entre muchas variables en grandes bancos de datos generados automáticamente. Estos nuevos datos han impulsado avances en Estadística y Econometría en el análisis conjunto de grandes sistemas de series temporales interdependientes, con el objetivo de mejorar las predicciones. En particular, la combinación de varios métodos y modelos está proporcionando buenos resultados en gestión de carteras, análisis de coyuntura, modelos de riesgo y otras muchas áreas. Este libro tiene por objeto presentar y evaluar algunas aplicaciones en economía y empresa de los nuevos enfoques de predicción basados en datos masivos.

En sus ocho capítulos, reconocidos expertos en este campo analizarán cómo pueden mejorarse las predicciones incorporando a los enfoques tradicionales los resultados de los modelos factoriales dinámicos, árboles de decisión, bosques aleatorios (Random Forest) y redes neuronales, entre otros procedimientos desarrollados en los últimos años. También, se analizará como el análisis de sentimientos y de textos, así como otras nuevas herramientas no convencionales que se basan en la abundancia de datos no estructurados pero con potencial valor predictivo, pueden aportar mejoras a los métodos de predicción habitualmente utilizados. El conjunto de los capítulos publicados en este libro representa una visión amplia de aplicaciones de procedimientos de predicción ML en el contexto de variables económicas y financieras.

En el primer capítulo, Ángela Caro y Daniel Peña describen la evolución histórica de la predicción basada en series temporales y revisan algunas de las herramientas actuales más utilizadas para la predicción de datos masivos. Utilizando redes neuronales profundas (Deep learning) para la predicción de varias magnitudes macroeconómicas en 35 países de la OCDE. Estas predicciones se comparan con las obtenidas mediante modelos univariantes y modelos factoriales dinámicos con el objetivo de ilustrar las dificultades con las que se encuentra el analista en la construcción de las reglas de predicción.  

En el segundo capítulo, Christian Brownless, Jordi Llorens y Nuria Senar justifican la necesidad de regularización, o imponer restricciones sobre los parámetros en la estimación, para calcular matrices de varianzas y covarianzas dinámicas en el contexto de carteras de activos financieros de alta dimensión. Se demuestra e ilustra cómo la regularización aumenta la precisión en la estimación de dichas matrices.

En el tercer capítulo, Máximo Camacho, Salvador Ramallo y Manuel Ruiz Marín realizan una descripción de los árboles de decisión en el contexto de datos independientes observados en un momento del tiempo determinado. La metodología es implementada para predecir el precio de la vivienda en Madrid. Dado el fuerte componente no lineal de la relación entre el precio y sus determinantes, la utilización de árboles de decisión es ventajosa frente a metodologías más tradicionales que pueden tener dificultades representando dichas no linealidades.

El cuarto capítulo, escrito por Montserrat Guillén, María Láinez, Ana M. Pérez- Marín y Eduardo Sánchez, analiza cómo los datos masivos están afectando a la medición del riesgo y la fijación de primas en seguros de automóviles. El trabajo presenta un interesante análisis sobre cómo es posible utilizar la información de los sensores en los vehículos para monitorizar la conducción y detectar los factores que afectan al riesgo en el contexto de los seguros de automóviles.

El capítulo quinto presenta la contribución de Desamparados Blázquez, Josep Doménech y Ana Debón. Estos autores utilizan un repositorio público y de libre acceso que contiene capturas de más de 400 billones de sitios web y analizan cómo la información sobre cambios en las páginas web de una empresa puede aportar información sobre la supervivencia empresarial.

El capítulo seis, debido a Argimiro Arratia, utiliza la información escrita en medios digitales que contiene información no estructurada puede combinarse con información cuantitativa tradicional para mejorar las predicciones. Se describe cómo construir un modelo de predicción con indicadores de sentimiento derivados de datos textuales para series temporales financieras que incluyen indicadores extraídos de noticias sobre mercados financieros.

En el capítulo siete Corinna Guirelli, Samuel Hurtado, Javier J. Pérez y Alberto Urtasun analizan los desafíos a los que los bancos centrales se enfrentan a la hora de utilizar datos granulares y obtenidos con mayor frecuencia de las previamente habituales, para llevar a cabo sus funciones. Los autores señalan que, en 2019, más del 60% de los bancos centrales utilizaron este tipo de datos en sus operaciones y dos tercios de ellos, los usaron como instrumento en el diseño de sus políticas. Entre los casos de éxito descritos aparecen la medición de la incertidumbre económica basada en artículos de prensa, el uso de informes regulares de los bancos centrales como herramienta de comunicación sobre el estado de la economía y la predicción macroeconómica.

Finalmente, Lorenzo Pascual y Esther Ruiz realizan una descripción de la literatura sobre aplicaciones empíricas en las que los procedimientos ML se han utilizado con éxito en la predicción económica. En comparación con procedimientos tradicionales, ML tiene mejor comportamiento predictivo en situaciones en las que las no-linealidades son importantes (como en épocas de crisis) y cuando el horizonte de predicción se incrementa.

Estos trabajos fueron presentados en una Jornada celebrada en Funcas el 8 de octubre de este año y el lector interesado puede encontrar en la web las grabaciones de las presentaciones que allí se hicieron. Los editores queremos agradecer a Funcas su apoyo en la realización de este libro que esperamos contribuya a difundir nuevas oportunidades para mejorar la predicción incorporando datos masivos.
Descargar documento

Capítulo I. Predicción de series temporales económicas con datos masivos: perspectiva, avances y comparaciones


Este trabajo analiza cómo la predicción económica ha ido evolucionando en función de los datos disponibles y cómo la reciente disponibilidad de datos masivos está transformando los métodos utilizados para el pronóstico. Se revisan brevemente tres períodos en la evolución de los procedimientos de predicción económica y empresarial y se presentan las características de una cuarta etapa, que se ha iniciado en este siglo con la revolución del Big data. Se analizan los cambios metodológicos para construir predicciones basadas en modelos econométricos, estadísticos y de aprendizaje de máquina (machine learning) y se describen algunos de los más utilizados para la predicción con series temporales. Como ilustración, se comparan las predicciones de un conjunto de variables que describen el ciclo económico en los países de la OCDE obtenidas con un modelo factorial dinámico y una red neuronal recurrente.
Leer más

Capítulo II. Modelos de selección de carteras con muchos activos


Este capítulo trata el problema de selección de carteras de inversión con un gran número de activos financieros. En particular, se repasa la literatura en modelización de correlaciones condicionales dinámicas de elevadas dimensiones (DCC, por sus siglas en inglés). Consideramos diferentes tipos de especificaciones, en particular, la versión estándar del modelo DCC, el DCC con estructura de factores, y el DCC con regularización. Introducimos métodos de estimación específicamente diseñados para modelos de elevada dimensionalidad. Evaluamos su capacidad de predicción a través de una aplicación en selección de carteras de inversión con los constituyentes del índice S&P 500.
Leer más

Capítulo III. Árboles de decisión en economía: una aplicación a la determinación del precio de la vivienda

En este trabajo describimos los árboles de decisión y repasamos su utilización en el análisis de datos económicos en el contexto de big data. De manera simplificada, realizamos un análisis comparativo de los algoritmos más utilizados en la construcción de árboles de decisión: CART, bagging, random forests y boosting. A modo de ilustración de estos procedimientos, examinamos cuáles son los determinantes del precio de la vivienda en Madrid en una muestra de 20.386 viviendas del portal Idealista en 2018. El fuerte componente no lineal de la relación del precio con sus determinantes es clave para destacar las ventajas de los árboles de decisión frente a propuestas más convencionales.
Leer más

Capítulo IV. Modelos predictivos del riesgo y aplicaciones a los seguros

El análisis del riesgo estudia los sucesos extraordinarios, qué los causa y cómo mitigar su probabilidad de ocurrencia. En seguros, básicamente importa la frecuencia y la severidad de los siniestros. Usando medidas como los cuantiles alejados de la mediana, la modelización predictiva permite detectar factores que afectan al riesgo. Tras la presentación de la regresión cuantílica como modelo básico y sus generalizaciones, se realiza una recopilación de casos de estudio en el ámbito asegurador, en situaciones de datos masivos y en particular en el análisis de datos telemáticos en seguros del automóvil.
Leer más

Capítulo V. La web corporativa y la supervivencia empresarial

En la era digital, los sitios web corporativos son un potente canal de comunicación para cualquier empresa. Mantener un sitio web en línea implica una serie de costes, de forma que las empresas solamente invertirán recursos a este fin si son activas y financieramente saludables. Si una empresa atraviesa dificultades financieras, es probable que esto se manifieste en su web como una falta de actualizaciones o dejando de funcionar. Este artículo analiza en qué medida los cambios en los sitios web corporativos reflejan la supervivencia empresarial. Hemos monitorizado los cambios en los sitios web de un panel de empresas entre los años 2008 y 2014. Los resultados muestran que los cambios en los sitios web corporativos reflejan fielmente el estado de las empresas. Así, hemos aportado una nueva fuente de información sobre la demografía empresarial.
Leer más

Capítulo VI. Predicciones financieras basadas en análisis de sentimiento de textos y minería de opiniones


En este capítulo se describe la mecánica básica para construir un modelo de predicción que utiliza indicadores de sentimiento derivados de datos textuales. Enfocamos nuestro objetivo de predicciones en series de tiempo financieras y presentamos un conjunto de hechos empíricos que describen las propiedades estadísticas de los indicadores de sentimiento, con particular atención en aquellos indicadores extraídos de noticias sobre mercados financieros y cuya categorización de sentimientos se basa en diccionarios. El objetivo general es proporcionar pautas para los profesionales en el mundo de las finanzas para la adecuada construcción e interpretación de su propia información numérica dependiente del tiempo y que representa la percepción del público hacia las empresas, los precios de las acciones y los mercados financieros en general.
Leer más

Capítulo VII. Desarrollos con big data para el análisis coyuntural en los bancos centrales


Los bancos centrales utilizan intensivamente datos estructurados (micro y macro) para el desarrollo de sus funciones, entre las que destaca el seguimiento en tiempo real de la actividad económica. El desarrollo tecnológico está permitiendo integrar nuevas fuentes de datos masivos, más granulares y disponibles con mayor frecuencia, en muchos casos no estructuradas. Esto supone un desafío importante desde el punto de vista de la gestión, el almacenamiento, la seguridad y la confidencialidad. Este capítulo analiza las ventajas y los retos de estas nuevas fuentes, y describe algunos casos de éxito de su incorporación en el ámbito del análisis económico y la previsión.
Leer más

Capítulo VIII. Predicción de series temporales basada en Machine Learning: aplicaciones económicas y financieras

En este capítulo se realiza una breve revisión de aplicaciones empíricas de procedimientos de predicción basados en Machine Learning (ML) en el contexto de series temporales económicas y financieras. Dada la naturaleza reciente y cambiante de dichos procedimientos, esta revisión es limitada e incompleta. Nuestra contribución es la descripción de los ámbitos de aplicación donde ML ha sido utilizado con éxito.
Leer más

Funcas

Think tank dedicado a la investigación económica y social

Contacto
C/ Caballero de Gracia, 28 | 28013 Madrid, España
+34 91 596 57 18 | funcas@funcas.es
Síguenos
Send this to a friend