sábado, 10 de diciembre de 2022

Datos en el fútbol: entre el desprecio y el dogma

El libro de Kiko Llaneras “Piensa Claro” debería ser de lectura obligatoria para, entre otros públicos, quienes estén preocupados por la relación entre ciencia y periodismo, como mi amigo el Dr. Miquel Porta (que probablemente ya lo haya leído, y que a su vez aborda este tema, junto con otros, en su libro “Epidemiología cercana”).

Esta relación es especialmente problemática en el caso del periodismo (o el comentariado) deportivo, en particular en lo que se refiere al fútbol, donde la presión populista es máxima y la lucha porque la racionalidad se abra paso tiene las de perder. Reconozco que algunas personas han conseguido que se avance en este sentido, pero queda mucho por hacer. El mensaje de la película y el libro “Moneyball” (que el uso profesional de datos puede mejorar el análisis del deporte), que ha sido totalmente procesado por el béisbol y otros deportes de secuencias más cerradas que el fútbol, se ha abierto camino con mucha más dificultad en el más fluido deporte rey. Sin embargo, los avances tecnológicos y científicos asociados entre otras materias a la inteligencia artificial, sugieren que este camino terminará por abrirse.

El recelo por la introducción de datos en el fútbol está muy extendido, y alcanza a comentaristas cultos y habitualmente ponderados como Jorge Valdano o Santiago Segurola, que quizás (como sugiere Llaneras en su libro) sienten subliminalmente su posición amenazada en su profesión de analistas. Segurola, en un reciente artículo, contrastaba el uso de datos en el fútbol con el humanismo en el deporte, como si ambos no fuesen compatibles, como si la humanidad no hubiese avanzado gracias a la ciencia en general.

Con la irrupción acelerada de datos, sin embargo, las estadísticas permean cada vez más el mundo del fútbol de un modo desordenado, en las pantallas durante y después de los partidos. El riesgo ahora es que se haga un mal uso de los datos, para lo cual sería deseable que las empresas mediáticas buscaran un mayor apoyo profesional. El riesgo es que pasemos del desprecio al dogma o el mito.

Por ejemplo, que pasemos a dar por ciertos y contrastados lugares comunes muy difundidos como que “el equipo que lanza primero en una tanda de penaltis tiene estadísticamente una ventaja sobre el que lanza segundo”.

Este lugar común se ha extendido como una plaga entre los comentaristas de partidos de fútbol, parece que por todo el mundo. Ayer los comentaristas del Canal “Gol Mundial”, José Sanchís (JS) y Axel Torres (AT), que son de lo mejor de la profesión, tuvieron esta conversación tras el sorteo para decidir quién tiraba el primer penalti en la tanda del partido Croacia-Brasil:

-AT: “chuta primero Croacia”

-JS: “Esto es lo más importante, ¡eh! (…) Existe un elevadísimo porcentaje de tandas de penaltis que se lleva quien marque primero… siempre y cuando anote el primer lanzamiento”.

-AT: “sí, sí, está ahí la estadística”.

-JS: “sí, sí, ahí la dejamos”.

Hubiera estado bien saber por qué JS dijo que eso era “lo más importante”, o que diera algún breve detalle cuantitativo y de fuente de información sobre qué entiende por “un elevadísimo porcentaje”. Lo que fue nuevo fue que introdujera el matiz de “si se anota el primer lanzamiento”, que a veces se omite, aunque tampoco dejó claro cuantitativamente a qué equivalía el matiz, ni añadió que, igualmente, si el que tira segundo anota su primer lanzamiento, también aumenta mucho su probabilidad de ganar la tanda. Y que AT hubiese explicado a cuál exactamente se refiere cuando dice que “ahí está la estadística”. Quizás tienen algo concreto en mente, que sería interesante compartir.

Croacia tiró primero y ganó esa tanda de penaltis. Sin embargo, había ganado las tres anteriores tandas de penaltis en un mundial (unos días antes contra Japón y hace cuatro años contra Rusia y Dinamarca) tirando segundo. En el pasado Mundial hubo 4 tandas de penaltis, todas ganadas por el equipo que tiró segundo. En este Mundial, a falta de 4 partidos, ha habido cuatro tandas de penalti, ganadas al 50% entre quienes han tirado primero y segundo. Pero esto es evidencia anecdótica, son pocas observaciones; hay que ver qué dicen los estudios científicos de verdad, los que usan bases de datos suficientemente amplias y han pasado un proceso de evaluación riguroso (así es como avanza la ciencia).

No voy a expresar ninguna opinión tajante; ya cometí ese error en mi libro “Pan y Fútbol”, presentado justo antes del Mundial de Rusia en 2018. En el libro me hago eco de lo que yo creía entonces que era un hecho bien establecido (que tirar primero daba la victoria el 60% de las veces). Pero en la presentación del libro en Madrid, el economista Toni Ítal·lo de Moragas me llamó la atención sobre un artículo científico que desmentía lo que yo daba por cierto. Leí el artículo sugerido y no conozco ningún artículo mejor que desmienta a éste, pero quizás es ignorancia mía. En los estudios empíricos, nunca hay resultados definitivos, como aprendimos en la pandemia.

Llaneras dijo en 2021 en Twitter que “Aunque un estudio de 2010 muy citado dice que el equipo que empieza gana el 60% de las veces” (se refiere al trabajo de los economistas Apesteguia y Palacios-Huerta en el que yo me había quedado estancado), “otros posteriores —con más datos—reducen la ventaja al 53%” (se refiere al estudio de Kocher, Lenz y Sutter de 2012 sobre el que me llamó la atención de Moragas). La ventaja parece que existe, pero es pequeña.” No solo eso, esta diferencia no es estadísticamente significativa, es decir, no puede distinguirse de algo producido meramente por azar. 

La explicación de Apesteguia y Palacios-Huerta fue que existe una presión psicológica por tirar segundo, ante el hecho de que la mayoría de penaltis se marcan, y por tanto quien tira segundo irá en general por detrás en el marcador. Pero cuánta más presión añade eso sobre la presión de tirar cualquier penal en una tanda de un torneo importante es algo que ignoramos.

Tras la tanda entre Japón y Croacia, el periodista Simon Kuper (columnista del Financial Times y autor de algunos de los mejores libros sobre fútbol) sugirió en Twitter una posible explicación al posible declive de la ventaja de tirar primero: ahora los porteros estudian mejor a los lanzadores, y el que lanza primero tiene una mayor probabilidad de fallar. Sin embargo, los datos del estudio de 2012 son anteriores a 2008, e incluyen los del estudio de 2010 que desmienten, teniendo muchas más observaciones; por lo tanto, no se basan en evidencia reciente. Y el portero croata del Croacia-Brasil declaró que no se había basado en información sobre cómo se lanzan los penaltis, sino en su intuición. Bien hecho, porque una conclusión que sí ha resistido mejor la replicación científica es que los tiradores y arqueros usan estrategias mixtas, es decir, van cambiando la forma de lanzar el penalti, para hacerse imprevisibles (como se pudo ver en la imagen con los últimos penaltis tirados por Messi, que habían ido por todas partes).

En la última edición de su famoso libro “Soccernomics” Kuper y el economista Szymanski argumentan que el uso de datos en el fútbol está en una fase alquimista, es decir, en una fase muy primitiva, y que vamos a ver grandes avances en los próximos años.

Mientras tanto, necesitamos a personas como Kiko Llaneras en las tertulias deportivas, o por lo menos personas que sean lo que Llaneras llama "bilingües" en el último capítulo de su libro, reproducido recientemente en El País, es decir, personas que tengan a la vez un conocimiento humanístico y que no menosprecien sino que entiendan (y que también entiendan sus limitaciones) las estadísticas y los trabajos científicos que las utilizan.

Sería un servicio público que alguien pudiera contestar esta pregunta: ¿existe algun estudio más reciente y mejor que desmienta la conclusión del trabajo de 2012 que decía que la ventaja del equipo que tira primero no es estadísticamente significativa? Quizás JS y AT conocen la respuesta a esta pregunta, y de momento no nos la cuentan. 


1 comentario:

  1. Llego a este blog desde el twitter del 14/01/2023 sobre el artículo de Valdano. Estoy totalmente de acuerdo con el señor Kuper de que el uso de datos está en una fase alquimista, sobre todo porque frente a otros deportes como el baloncesto o el beisbol, el uso de estadísticas es demasiado reciente y es un deporte más complejo que los dos citados.
    Nadie diría sobre un equipo de baloncesto que anota el 60% de sus puntos desde la derecha del ataque (se podría decir, pero sonaría extraño) sino que se hace sobre zonas más amplias del campo; dentro de la zona, fuera, tiros de 3 puntos. Sin embargo, en fútbol sí que se habla de la zona del campo por la que se marcan los goles pero hay una situación anterior sobre la que poca gente habla; ¿Cómo llega el balón a, siguiendo con nuestro ejemplo, la zona derecha del ataque? ¿Los integrantes de la banda derecha del ataque son unos fieras que regatean a su sombra, tienen un guante en el pié para centrar y convierten el balón en un misil del que solo vemos que sale de su pié para limpiar las telarañas de la portería rival? ¿Llega a esa zona después de una ruptura de la línea de medios y cambian el juego con un pase preciso tipo Pirlo o Xavi cogiendo a la defensa contraria totalmente descolocada?
    El futuro de las estadísticas de fútbol debería ser más complejas (¿uso del random forest o técnicas similares?) que las que nos dan en beisbol o baloncesto; decir que un equipo de baloncesto tiene un porcentaje de triples del 56% me puede indicar muchas cosas, decir que uno de fútbol marca el 56% de sus goles desde fuera del área me indica muchas menos.

    ResponderEliminar