Cómo crear un modelo propio de predicción de fútbol
La idea de construir tu propio modelo de predicción suena intimidante. Evoca imágenes de pantallas llenas de código, servidores procesando datos y doctorados en estadística. La realidad es bastante menos cinematográfica: con una hoja de cálculo, datos públicos y una comprensión básica de la distribución de Poisson, puedes construir un modelo que genere probabilidades razonables para los resultados de un partido de fútbol. No será perfecto — ningún modelo lo es — pero será tuyo, y eso te dará algo que ningún tipster ni ninguna corazonada puede darte: un marco cuantitativo para evaluar si una cuota tiene valor o no.
Este artículo te guía por el proceso de construcción de un modelo básico pero funcional. No necesitas saber programar, aunque si sabes, mejor. Lo que necesitas es paciencia, rigor y la honestidad de aceptar que tu modelo se equivocará a menudo. La pregunta no es si acertará siempre, sino si acierta con la frecuencia suficiente como para generar valor frente a las cuotas del mercado.
Qué necesitas antes de empezar
Antes de tocar un solo número, hay tres elementos que debes tener claros: los datos, la herramienta y las expectativas.
Los datos son el combustible de cualquier modelo. Para un modelo básico de fútbol necesitas, como mínimo, los resultados de todos los partidos de una liga durante al menos dos temporadas completas. Esto incluye los goles marcados y recibidos por cada equipo, diferenciando entre partidos como local y como visitante. Plataformas como Football-Data.co.uk ofrecen archivos CSV descargables con estos datos para decenas de ligas y temporadas. Understat proporciona datos de xG que pueden enriquecer tu modelo si quieres ir más allá de los goles reales.
La herramienta puede ser tan simple como Microsoft Excel o Google Sheets. Si manejas Python o R, tendrás más flexibilidad para automatizar cálculos y realizar simulaciones, pero no es imprescindible. Un modelo de Poisson básico se implementa perfectamente en una hoja de cálculo con fórmulas estándar. Lo importante es que la herramienta no sea una barrera de entrada.
Las expectativas son quizá el elemento más importante. Un modelo básico no te va a convertir en millonario. Su función es proporcionarte una estimación cuantitativa de las probabilidades de cada resultado, que luego puedes comparar con las cuotas del mercado para identificar posibles apuestas de valor. Si tu modelo dice que la probabilidad de victoria local es del 55% y la cuota implica un 48%, tienes un candidato a value bet. Si ambos números están alineados, la cuota no tiene valor y pasas al siguiente partido. El modelo es un filtro, no una bola de cristal.
La distribución de Poisson aplicada al fútbol
La distribución de Poisson es un modelo estadístico que describe la probabilidad de que ocurra un número determinado de eventos independientes en un intervalo fijo, cuando la tasa media de ocurrencia es conocida. Los goles en un partido de fútbol encajan razonablemente bien en este marco: son eventos relativamente raros e independientes (con matices), y cada equipo tiene una tasa media de goles esperada.
El proceso para construir un modelo de Poisson para fútbol se desarrolla en varios pasos. El primero es calcular las fuerzas de ataque y defensa de cada equipo. Para ello, necesitas la media de goles por partido de la liga, y luego calculas la fuerza de ataque de un equipo dividiendo sus goles marcados por partido entre la media de la liga, y la fuerza defensiva dividiendo los goles recibidos por partido entre esa misma media.
Supongamos que la media de la liga es de 1.35 goles por partido para los locales y 1.10 para los visitantes. Si el Equipo A marca 1.80 goles por partido en casa, su fuerza de ataque local es 1.80 / 1.35 = 1.33. Si el Equipo B recibe 1.40 goles por partido fuera, su fuerza defensiva visitante es 1.40 / 1.10 = 1.27.
El segundo paso es calcular los goles esperados para cada equipo en el partido concreto. Los goles esperados del Equipo A como local se calculan multiplicando la media de goles locales de la liga por la fuerza de ataque del local y la fuerza defensiva del visitante: 1.35 × 1.33 × 1.27 = 2.28 goles esperados. Para el Equipo B visitante, el cálculo sería análogo usando sus propias fuerzas y las del rival.
El tercer paso es usar la fórmula de Poisson para calcular la probabilidad de cada marcador exacto. La fórmula P(x) = (λ^x × e^−λ) / x! te da la probabilidad de que un equipo marque exactamente x goles, donde λ es su media de goles esperados. En Excel, la función POISSON.DIST hace este cálculo directamente.
Con las probabilidades de goles de cada equipo, construyes una matriz de resultados donde cada celda representa la probabilidad de un marcador específico. La probabilidad de un 2-1, por ejemplo, es la probabilidad de que el local marque 2 multiplicada por la probabilidad de que el visitante marque 1. Sumando las celdas donde el local gana, obtienes la probabilidad de victoria local; sumando las de empate, la probabilidad de empate; y lo mismo para la victoria visitante.
De los números a las cuotas: cómo usar tu modelo en la práctica
Una vez que tienes la matriz de resultados con las probabilidades de cada marcador, el siguiente paso es convertir esas probabilidades en cuotas y compararlas con el mercado.
La conversión es directa: la cuota justa de un resultado es simplemente 1 dividido entre su probabilidad. Si tu modelo estima que la victoria local tiene una probabilidad del 52%, la cuota justa es 1/0.52 = 1.92. Si la casa de apuestas ofrece una cuota de 2.10 para ese mismo resultado, hay una diferencia positiva del 9.4%, lo que sugiere que la apuesta tiene valor. Si la cuota de la casa es 1.75, el valor esperado es negativo y no deberías apostar.
El concepto clave aquí es el umbral de valor. No toda diferencia entre tu cuota estimada y la del mercado justifica una apuesta. Las imprecisiones de tu modelo, especialmente si es básico, hacen que necesites un margen de seguridad. Un criterio razonable para empezar es exigir al menos un 5-8% de diferencia entre la probabilidad de tu modelo y la probabilidad implícita en la cuota antes de considerar la apuesta. Esto te protege parcialmente de los errores de estimación y te obliga a apostar solo cuando la ventaja teórica es significativa.
Otro aspecto práctico es la frecuencia de oportunidades. Un modelo básico de Poisson, aplicado a una sola liga, te dará quizá entre dos y cinco apuestas de valor por jornada, dependiendo de lo estricto que seas con tu umbral. Esto es suficiente para mantener una actividad regular sin necesidad de forzar apuestas. Si tu modelo no encuentra valor en una jornada, no apuestes. La disciplina de pasar cuando no hay oportunidad es tan importante como la capacidad de detectar el valor cuando existe.
Un error común entre los apostadores que construyen su primer modelo es tratar sus probabilidades como verdades absolutas. Tu modelo es una aproximación basada en supuestos simplificadores. La distribución de Poisson asume que los goles son eventos independientes, lo que no es completamente cierto: un gol temprano cambia la dinámica del partido. Asume también que las fuerzas de ataque y defensa son estables, cuando en realidad varían con las alineaciones, la forma física y el contexto. Ser consciente de estas limitaciones es fundamental para no sobreconfiar en tus estimaciones.
Iterar y mejorar: el modelo como proceso vivo
Un modelo de predicción no es un producto terminado que construyes una vez y usas para siempre. Es un proceso iterativo que mejora con el tiempo a medida que incorporas más datos, identificas sus debilidades y añades complejidad donde los resultados lo justifican.
La primera mejora que puedes implementar es ponderar los datos más recientes. Un modelo básico usa la media de toda la temporada, tratando el primer partido igual que el último. Pero el rendimiento de un equipo cambia a lo largo de la temporada: fichajes de invierno, lesiones acumuladas, cambios de entrenador, momentos de forma. Aplicar un factor de decaimiento que dé más peso a los últimos partidos mejora la capacidad predictiva del modelo sin añadir complejidad excesiva.
La segunda mejora es sustituir los goles reales por xG (goles esperados). Los goles reales tienen un componente de aleatoriedad importante: un equipo puede marcar tres goles de tres remates una jornada y fallar quince ocasiones claras la siguiente. Los xG filtran esa varianza y ofrecen una imagen más estable del rendimiento ofensivo y defensivo real. Si tienes acceso a datos de xG a través de plataformas como Understat, incorporarlos a tu modelo es probablemente la mejora con mayor impacto en la precisión.
La tercera mejora es incorporar variables contextuales como factores de ajuste. El factor campo, por ejemplo, puede modelarse como un multiplicador que aplicas a los goles esperados del equipo local. La ausencia de un jugador clave puede traducirse en un ajuste porcentual sobre la fuerza de ataque o defensa. Estos ajustes son inevitablemente subjetivos, pero si los aplicas de forma consistente y los calibras con datos históricos, pueden mejorar significativamente las predicciones en partidos donde el modelo básico se queda corto.
Hay un cuarto paso que separa los modelos amateur de los semi-profesionales: la validación. Lleva un registro de todas las predicciones de tu modelo y compáralas con los resultados reales durante al menos 200-300 partidos antes de sacar conclusiones. Calcula métricas como el Brier score o el log-loss para evaluar la calibración de tus probabilidades. Si tu modelo dice que un evento tiene un 60% de probabilidad, debería ocurrir aproximadamente el 60% de las veces en una muestra suficiente. Si hay desviaciones sistemáticas, sabrás dónde ajustar.
Tu primer modelo es un borrador, no una obra maestra
Hay algo liberador en aceptar que tu primer modelo será mediocre. No pasa nada. El valor de construir un modelo propio no está en la precisión del primer intento, sino en el proceso de pensamiento que te obliga a recorrer.
Cuando construyes un modelo, te enfrentas a preguntas que el apostador intuitivo nunca se plantea. ¿Cuánto pesa el factor campo en esta liga concreta? ¿Los goles de las últimas cinco jornadas son representativos o son una anomalía? ¿La fuerza defensiva de este equipo es real o es producto de haber jugado contra rivales débiles? Estas preguntas, y el esfuerzo de responderlas con datos, cambian fundamentalmente tu forma de evaluar un partido.
El modelo no necesita ser mejor que los de las casas de apuestas en todos los partidos. Solo necesita ser mejor en algunos, los suficientes como para generar un flujo regular de apuestas de valor. Y la forma de llegar ahí no es comprando un software mágico ni copiando la hoja de cálculo de otro. Es construyendo tu propio modelo, equivocándote, ajustando, y repitiendo el ciclo hasta que los números empiecen a tener sentido. Ese proceso es tu verdadera ventaja competitiva, porque es el único que nadie puede copiarte.