En el Mundial de Fútbol de 2010 en el que resultó campeón la selección española, una de las figuras más prominentes y que causó sensación en todo el mundo fue el pulpo Paul. El cefalópodo del acuario Sea Life Center, en Alemania, predijo
correctamente y mejor que cualquier apostador, los resultados de varios partidos y eligió acertadamente a España como el ganador de la copa.
Ahora, una vez que ya ha iniciado el Mundial de Fútbol en Qatar 2022, equipos de científicos expertos en Big Data, armados con poderosas supercomputadoras, esperan emular los éxitos y seguir el legado del pulpo y han llevado a cabo análisis predictivos para pronosticar al equipo que saldrá campeón de la justa mundialista del deporte más popular del mundo.
Una de estas predicciones, elaborada por expertos en el análisis, modelación e interpretación de datos del Instituto Alan Turing de Londres, en el Reino Unido, encabezados por Nick Barlow, utilizaron un algoritmo matemático que ya usaban para la liga de fútbol inglesa.
Te podría interesar
A este modelo le hicieron modificaciones para evitar sesgos, por ejemplo, agregaron todos los resultados de partidos internacionales desde 1872 hasta 2022 incluyendo los juegos entre equipos de diferentes regiones de la FIFA, ya que por ejemplo, Brasil no ha jugado contra ningún equipo europeo desde 2019.
Para abordar esto, señalan los investigadores, introdujeron parámetros para medir las fortalezas relativas de las diferentes federaciones continentales. “También modificamos nuestro modelo para tener en cuenta el hecho de que la ventaja de jugar como local no se aplica en los torneos internacionales, a menos que la nación anfitriona esté jugando”, señalan en un comunicado del Instituto. En los datos analizados dieron mayor importancia a los partidos de las copas mundiales y su peso fue disminuyendo según se tratara de torneos continentales, eliminatorias y partidos amistosos. Asimismo, incorporan las clasificaciones oficiales de la FIFA para proporcionar una estimación actualizada del rendimiento de cada equipo.
Te podría interesar
También lo ajustaron para dar más peso a los resultados de ciertos partidos, como semifinales y finales, y juegos más recientes, además de ejecutar el modelo en torneos anteriores para ver qué tan bien coincidían sus predicciones con los resultados del mundo real, y lo ajustaron en función de su rendimiento.
Uno de los factores que no consideró el modelo es el rendimiento de algún jugador en particular, lo cual limita su análisis debido a que en muchas copas del mundo jugadores se han consagrado con grandes actuaciones como fue el caso de Pelé en 1970, Beckenbahuer en 1974, Maradona en 1986, Zidane en 1998 y Ronaldo en 2002.
“El torneo de este año seguramente será encendido por una superestrella del fútbol”, dicen los científicos. “Sin embargo, no estamos viendo nada de eso. Predecir las alineaciones de los equipos nacionales, que juegan juntos algunas veces al año, es mucho más desafiante que hacerlo para los equipos de la Premier League que juegan semana tras semana”.
Aún así, el conjunto de datos incluyó 44 mil 150 resultados de partidos de fútbol internacionales desde el primer partido oficial en 1872 hasta la semana pasada de 2022. Brasil y modelos matemáticos Barlow y su equipo de colaboradores ejecutaron el algoritmo de su modelo para analizar los probables resultados de la Copa del Mundo de Qatar unas 100 mil veces y los datos arrojaron que Brasil ganó en el 25% de las veces, seguido por Bélgica con el 19% y Argentina con el 13%.
Esto quiere decir que, de acuerdo con el modelo del Instituto Alan Turing, Brasil será el campeón con una probabilidad de 1 a 4, con lo que podría conseguir su sexta copa del mundo en Qatar.
Este modelo es de código abierto y puede ser ejecutado por cualquier persona con conocimientos básicos, en sus computadoras en la siguiente dirección. Cada análisis con 1000 repeticiones de torneos toma 15 minutos en una computadora portátil. “Para la mayoría de las cosas que hacemos, es muy importante que las hagamos de código abierto”, dice Barlow. “Alentamos a las personas a involucrarse, a usar nuestro código y a contribuir”.
Si bien en la actualidad estos modelos se usan en muchos sectores, uno de los primeros aplicados al fútbol data de 1996, desarrollado por Mark Dixon y Stuart Coles, de la Universidad de Lancaster, Reino Unido, que establece elementos llamados “círculos de predicción del fútbol” que contempla factores como la fuerza del ataque, la fuerza de defensa y la ventaja de local de un equipo, y utiliza estadísticas bayesianas para calcular el marcador más probable para un partido.
Publicado en la revista Estadísticas Aplicadas de la Royal Statistical Society, este modelo fue desarrollado para predecir los resultados de los juegos, y algunas variantes de este modelo todavía se utilizan por las casas de apuestas que se centran en los goles marcados y recibidos y se distribuyen en torno a un valor medio. En la actualidad las casas de apuestas tienen equipos de científicos de datos que trabajan a tiempo completo en modelos que tienen su base el desarrollado por Dixon y Coles, pero son más sofisticados ya que toman en cuenta mucho más factores.
En otro cálculo matemático desarrollado por científicos de la Universidad de Oxford, que contempla un millón de datos con un algoritmo que se repite 100 mil veces, también resulta como ganador la selección de Brasil, que de igual manera vence en la final a la selección de Bélgica. De acuerdo con este modelo desarrollado por el Instituto de Matemáticas de la universidad británica, Brasil disputa una de las semifinales con Argentina y en la otra semifinal Bélgica vence a Francia. Este cálculo también analiza cada partido internacional desde 2018 y de acuerdo a los resultados, México llegaría a octavos de final donde sería vencido por Francia.
Otro estudio que no coincide con la predicción del campeonato para Brasil es el de la compañía de seguros Lloyd's que usó el valor asegurable colectivo de los jugadores de un equipo, para predecir que Inglaterra ganará la final al vencer a Brasil. Este mismo modelo predijo correctamente que Alemania ganaría la Copa del Mundo en 2014 y que Francia ganaría en 2018.
En comparación con otros deportes, el fútbol es un juego de alta variación y mayor complejidad, por lo que los equipos a menudo pierden cuando no deberían perder y ganan cuando no deberían ganar. Esto se debe a varias razones, por ejemplo, hay factores que impactan el juego que son mucho menos controlables en comparación con otros deportes por el tamaño de la cancha al aire libre, juego dinámico, etc., pero también interviene el factor humano de 22 jugadores en cada partido.
El fútbol ha tardado mucho en comenzar a recopilar sistemáticamente grandes conjuntos de datos con fines de análisis científico con el objetivo de mejorar el juego de los equipos, por ello, es probable que los investigadores aún no alcencen todavía los logros del pulpo Paul, para predecir con éxito los resultado de la Copa Mundial de Fútbol de Qatar.
Comentarios y sugerencias: @abanav, abanav@gmail.com y sapiensideas.com