OBI: Lo Que Aprendimos Intentando Predecir el Precio del Aceite

Empezamos con 200 variables.

Teníamos precios históricos, datos meteorológicos, índices de consumo, exportaciones de países productores, tipos de interés, confianza del consumidor, spreads entre calidades, producción por campaña, costes energéticos. Metimos todo en el modelo. El modelo nos devolvió resultados que parecían perfectos en los datos del pasado.

Cuando intentamos predecir el futuro, fallaba sistemáticamente.

Llevamos más de un año construyendo OBI — el sistema de estimación y predicción de precios de Olearia Intelligence. Este artículo cuenta lo que aprendimos: qué funcionó, qué no, y el descubrimiento que más cambió nuestra forma de ver el mercado.

El problema con 200 variables

El sobreajuste es el error clásico en machine learning. El modelo aprende tan bien los patrones históricos que deja de generalizar. Ve coincidencias en lugar de causas. Memoriza en lugar de entender.

Con 200 variables y datos históricos suficientes, cualquier modelo puede parecer brillante mirando hacia atrás. La prueba real es la predicción fuera de muestra: darle al modelo datos que nunca ha visto y ver si acierta.

No acertaba.

La causa era evidente en retrospectiva: muchas de esas 200 variables estaban correlacionadas con el precio del aceite de oliva sin tener ninguna relación causal. La confianza del consumidor, por ejemplo, correlaciona con casi todo durante períodos de expansión económica. Eso no significa que la gente compre más aceite cuando está optimista — el aceite de oliva tiene una demanda muy inelástica, la gente lo compra porque lo necesita. Pero la correlación histórica estaba ahí, y el modelo la usaba.

Empezamos a eliminar variables. Aplicamos un criterio estricto: no basta con que esté correlacionada con el precio, tiene que haber una relación de causa y efecto demostrable. El nivel de existencias en los almacenes tiene esa relación — si hay poco stock, los precios suben, y eso no cambia con el tiempo. Los datos diarios de precios en España tienen esa relación — el mercado español es el mayor productor y sus movimientos diarios son señal adelantada de lo que publicará la Comisión Europea los jueves.

Al final nos quedamos con 12 variables. Sí, 12 de las 200 originales.

El modelo empeoró en los datos históricos. Mejoró sustancialmente en los datos fuera de muestra. Eso es exactamente lo que debería pasar.

Diez mil semanas de backtesting

Para validar OBI correctamente utilizamos backtesting walk-forward: en lugar de entrenar con todos los datos y luego evaluar con los mismos, el sistema evalúa semana por semana usando únicamente los datos que habrían estado disponibles en ese momento. Es la forma más honesta de medir si un modelo funciona de verdad o si simplemente ha memorizado el pasado.

El proceso para España AOVE: 47 ventanas de evaluación, 1.222 semanas testadas en total desde 2002. Para Italia: 42 ventanas, 1.092 semanas. Para Grecia: 45 ventanas, 1.170 semanas. Para Portugal: 23 ventanas, 598 semanas — el histórico de datos fiables es más corto.

En total, más de 10.582 semanas evaluadas entre todos los países y tipos de aceite.

Los resultados son modestos pero estadísticamente significativos. El modelo Ridge para España mejora entre un 6% y un 9% sobre un modelo simple de momentum, dependiendo del tipo de aceite. En AOVE: +6,1% de mejora con p=0,022. En Virgen: +9,3% con p=0,0003. En Lampante: +9,5% con p=0,0013.

No son números espectaculares. No pretendemos serlo. Predecir el precio del aceite de oliva es difícil estructuralmente: depende de factores climáticos que nadie controla, de negociaciones entre un número relativamente pequeño de actores grandes, y de decisiones políticas que pueden cambiar los flujos de mercado de un día para otro. Cualquiera que prometa certezas está mintiendo.

Lo que sí son es números reales, con significancia estadística, validados fuera de muestra. Y eso tiene valor cuando el mercado te está diciendo que el precio va en una dirección y quieres saber si tienes razón o estás viendo lo que quieres ver.

El descubrimiento que contradecía nuestra hipótesis

Nuestra hipótesis de partida era razonable: los mercados mediterráneos del aceite están fuertemente correlacionados. España, el mayor productor, arrastra a Italia, Grecia y Portugal. Cuando España sube, los demás suben con un pequeño retardo.

El backtesting nos dijo que estábamos equivocados.

La primera versión del modelo usaba un factor de influencia de España sobre los otros mercados de 0,50 — es decir, asumíamos que la mitad del movimiento de precio de Italia, Grecia y Portugal en cada semana podía explicarse por lo que había hecho España. Cuando validamos ese factor con diez mil semanas de datos, el número óptimo resultó ser sistemáticamente mucho más bajo.

Para Italia AOVE, el factor óptimo fue 0,10 — no 0,50. Para Grecia, 0,20. Para Portugal, 0,10. Los mercados se mueven mucho más por sus propias dinámicas locales de lo que asumíamos: sus propios compradores, sus propios vendedores, sus propias noticias de producción regional, sus propias relaciones comerciales con terceros países.

Reducir esos factores mejoró las predicciones para Italia en un 4,3% con un 88% de tasa de acierto frente al modelo anterior. Para Grecia, un 3,5% con 73% de tasa de acierto. Para Portugal, un 4,1% con un 87% de tasa de acierto.

Lo más importante no son los porcentajes. Es la lección: no puedes construir un sistema de predicción de mercados asumiendo cómo debería funcionar el mundo. Tienes que dejar que los datos te digan cómo funciona realmente.

Portugal, el mercado que se comporta al revés

Portugal nos tuvo bloqueados semanas.

Las señales técnicas salían sistemáticamente invertidas. El modelo compraba cuando debía vender y vendía cuando debía comprar. Revisamos los datos, revisamos el código, revisamos las fuentes. No había errores. Portugal simplemente se comportaba de una forma que no cuadraba con ninguna de nuestras asunciones.

La explicación, cuando la encontramos, era elegante a su manera: Portugal funciona como un mercado seguidor con una dinámica de reversión a la media muy marcada. Cuando el precio en Portugal sube respecto al promedio histórico, tiende a bajar — y al revés. El componente de momentum aplicado de la forma estándar, que funciona bien para España e Italia, empeoraba las predicciones para Portugal porque añadía presión en la dirección equivocada.

En los índices de estacionalidad validados con veinticinco años de datos, Portugal tiene un perfil completamente diferente a los demás. Los precios tienden a subir en noviembre (índice 1,21) y enero (1,15), y a bajar en octubre (0,87) y septiembre (0,93). Es casi exactamente el patrón opuesto al de España, donde octubre y septiembre son los meses fuertes.

Hay razones agronómicas para esto — la cosecha portuguesa tiene tiempos y dinámicas propias, y el mercado local responde a ellas de forma diferente. Pero llegar a esa conclusión requirió primero ver que los números no cuadraban, luego buscar por qué, y finalmente cambiar el modelo para adaptarse a lo que los datos mostraban.

Es el tipo de hallazgo que no aparece en ningún paper académico sobre predicción de commodities. Aparece cuando llevas suficiente tiempo mirando datos reales de un mercado real.

El modelo Ridge y los datos diarios de España

Para España desarrollamos algo diferente al resto de mercados: un modelo Ridge que usa datos diarios como señal adelantada.

El mercado de aceite en origen en España publica precios todos los días. La Comisión Europea publica sus precios oficiales los jueves — o los viernes, o la semana siguiente, según el ritmo de sus sistemas. Hay días de diferencia entre lo que está pasando en el mercado español cada mañana y lo que reflejan los datos oficiales europeos.

Esa brecha temporal es información. Los precios diarios de España tienden a anticipar hacia dónde irán los precios semanales oficiales. No siempre, y no por un margen enorme, pero la señal es estadísticamente significativa.

El modelo Ridge para España usa doce features: precios con retardo de una, dos y cuatro semanas; retornos a una y cuatro semanas; medias móviles de cuatro y ocho semanas; momentum semanal; la posición del precio actual dentro del rango de las últimas 26 semanas; el momentum de los datos diarios y su retorno a cinco días; y — para Virgen y Lampante — el retorno del AOVE en la misma semana, porque las tres calidades se mueven en paralelo aunque no de forma idéntica.

El modelo se entrena con todos los datos históricos disponibles y se refresca automáticamente cuando llegan nuevos datos, tanto diarios como semanales. No necesita intervención manual.

Para producción en vivo el modelo Ridge es el primero en intentarse. Si por alguna razón no está disponible — falta de datos, error en el entrenamiento — el sistema cae automáticamente a un modelo de momentum más simple. El usuario nunca ve un error: siempre recibe una estimación, con su intervalo de confianza, y con el indicador de qué modelo la ha generado.

Lo que OBI no puede hacer

Predecir el precio del aceite de oliva con certeza es imposible. Hay factores que ningún modelo estadístico puede anticipar.

Una helada tardía en Andalucía en marzo puede cambiar las perspectivas de producción de todo el año en días. Una decisión de aranceles en Washington puede alterar los flujos comerciales de exportaciones que superan los mil millones de euros anuales. Una sequía como la de 2023 — que redujo la producción española casi a la mitad en dos campañas consecutivas y llevó el AOVE de 3,5 a más de 8 euros en dieciocho meses — no aparece en ningún histórico previo con esa intensidad.

OBI funciona bien para estimar qué precio debería haber cuando los datos oficiales tienen retraso — algo que pasa con frecuencia, porque la Comisión Europea publica sus datos con hasta una semana de demora. Funciona bien para detectar la dirección probable del mercado en condiciones normales. Funciona razonablemente bien para cuantificar incertidumbre: los intervalos de confianza están calibrados sobre los percentiles reales del backtesting, de forma que el intervalo al 80% realmente contiene el precio real el 80% de las veces.

Lo que no hace es eliminar la incertidumbre. La señaliza, la cuantifica, la pone sobre la mesa para que quien toma una decisión sepa exactamente con qué nivel de certeza lo hace.

Esa decisión de presentar rangos en lugar de puntos, de mostrar el nivel de confianza, de decir explícitamente cuando el modelo no tiene suficiente confianza para decir algo útil — nos costó algunos usuarios que querían respuestas rotundas.

Creemos que nos ganó algo más difícil de conseguir: que los que se quedaron se fíen de lo que ven.

OBI es parte de Olearia Intelligence, la plataforma de inteligencia de mercado para el sector oleícola. Si quieres ver cómo funciona en contexto — junto con análisis técnico, datos satelitales, gestión de riesgo y mucho más — puedes solicitar acceso a la beta privada o escribirnos directamente.

OBI: Lo Que Aprendimos Intentando Predecir el Precio del Aceite

El problema con 200 variables

Diez mil semanas de backtesting

El descubrimiento que contradecía nuestra hipótesis

Portugal, el mercado que se comporta al revés

El modelo Ridge y los datos diarios de España

Lo que OBI no puede hacer

Artículos Relacionados

Por Qué el Aceite de Oliva Necesita Métricas de Banco de Inversión

Medio Millón de Kilómetros Cuadrados Monitorizados Desde el Espacio

RAG vs Fine-Tuning: Lo que Hemos Aprendido Eligiendo Entre Ambos

¿Te ha gustado este artículo?