BIHUB PATH

8 noviembre, 2019

¿QUÉ SE NECESITA APRENDER PARA TRABAJAR EN FOOTBALL ANALYTICS?

Análisis y Tecnología Deportiva
Análisis y Tecnología Deportiva
Rendimiento Deportivo
Rendimiento Deportivo
160K

La pregunta que me hacen con mayor frecuencia tiene que ver con las habilidades necesarias para convertirse en un científico de datos en un club de fútbol. Para muchos, analizar el fútbol es un trabajo soñado. Si disfrutas tanto el partido como las estadísticas, nada podría ser mejor que combinar los dos en una carrera. La pregunta es, entonces, ¿qué habilidades se necesita desarrollar para encontrar un puesto de trabajo de este tipo en un club?

 

Para responder a esa pregunta, lo mejor es comenzar analizando los datos disponibles.

 

Hace diez años, los datos utilizados por los clubes se limitaban a estadísticas sobre goles, disparos, cantidad de saques de esquina, posesión, etc. Estos datos tienen un valor limitado para el cuerpo técnico. Si bien puede ser preocupante que tu equipo conceda demasiados disparos a puerta o no logra obtener la posesión del balón, conocer este hecho no proporciona información que sirva para el entrenamiento. Las estadísticas típicas que vemos en la televisión no ayudan en sí a los equipos a ganar partidos.

 

La segunda ola de datos de fútbol llegó en forma de event data (dato del evento) con la pelota. El mayor proveedor de estos datos, Opta, proporciona coordenadas (x, y) de cada pase de la pelota, cada acción defensiva y cada disparo. Opta ahora es uno de varios proveedores de datos, incluidos Statsbomb, Wyscout y varias compañías de apuestas, que recopilan esta forma de datos.

 

El event data ha resultado ser útil para muchos clubes, particularmente en la búsqueda de jugadores. La estadística más conocida en este contexto son los goles esperados, que miden la calidad de las oportunidades que crean los jugadores. Otras métricas más avanzadas incluyen las asistencias esperadas, los modelos de pase que asignan un valor a cada pase en función de cuánto avanza la pelota, y las cadenas de posesión que miden la participación en secuencias de ataque. Estas estadísticas, junto con medidas más tradicionales, como el conteo de duelos de cabezazos, intercepciones y finalización de pases, a menudo se presentan en forma de un radar de jugadores. El radar muestra cómo cada jugador se compara con otros que juegan en la misma liga.

 

Sé por experiencia de primera mano que a muchos cazatalentos de clubes les encantan estos diagramas. Para bien o para mal, les proporciona una forma de confirmar sus creencias acerca de un jugador o de encontrar nuevos talentos y analizarlos con más detalle.

 

Para poder tratar y analizar datos de eventos, deben tener experiencia en programación, preferiblemente en Python o R, y también deben aprender sobre el modelado estadístico básico. Los goles esperados son un modelo de regresión logística. Los modelos de pase usan la regresión logística o las redes neuronales básicas. Estos son temas que surgen en todas las buenas licenciaturas en Estadística y másters en Data Science, y se cubren también en cursos en línea.

 

Si bien es importante saber acerca de los datos ‘con la pelota’, el futuro de la analítica del fútbol puede ir por otro camino. Me encontré con Raúl Peláez Blanco, responsable de tecnología deportiva, innovación y análisis del FC Barcelona y le pregunté sobre los datos que el equipo usa actualmente.

 

Fue directo al grano: “No confiamos en los datos de eventos en la evaluación del jugador. Creemos que necesitamos entender cómo actúan los jugadores en diferentes contextos. Por ejemplo, si estamos analizando a un extremo que regatea muy bien en los contraataques, nos preguntamos cómo regatea cuando la defensa de la oposición está organizada. Los datos de eventos, no nos da esta información”.

 

“Antes de fichar a un jugador, debemos examinar cómo resuelve los problemas en los contextos que se enfrentará en el Barcelona”, me dijo Raúl. “Se ha popularizado clasificar a los jugadores usando datos sin tomar en consideración estos contextos, pero esto distorsiona las realidades”.

 

Sin embargo, sería un error llegar a la conclusión de que Raúl se opone al uso de datos. Todo lo contrario. Para él, la pregunta tiene que ver con el uso correcto de los datos.

 

“El problema con los datos de eventos es que están descontextualizados, por ejemplo, no sabemos cómo está posicionado el resto de los jugadores cuando se hace un pase”, me comentó. “En lugar de ello, usamos datos de posición de los 22 jugadores y el balón. Esto nos ayuda a encontrar información táctica para el entrenador”.

 

 

La tercera ola de datos en el fútbol, datos de los 22 jugadores, dan mucha más información que los datos de eventos. Como su nombre indica, contiene las coordenadas en el campo de todos los jugadores, así como la posición del balón. Esto es esencial para comprender el contexto. Durante un partido típico, Luis Suárez tiene la pelota menos de 90 segundos de los más de 90 minutos de tiempo del partido. Lo que Suárez, o cualquier otro jugador, aporta al partido —presionar, correr para abrir espacio y posicionarse de manera táctica— no se puede medir simplemente en las estadísticas de disparos.

 

Para Raúl y su equipo, el primer paso para usar estos datos ha sido automatizar el trabajo de los analistas de vídeos. “Hace unos años, los analistas de vídeos pasaban la mayor parte de su tiempo grabando entrenamientos y partidos, y etiquetándolos”, me contó. “Ahora los ordenadores pueden realizar el etiquetado y los analistas de vídeos pueden concentrarse encontrar insights gracias a esta información”.

 

Realizar estas tareas requiere habilidades en Machine Learning y Computer Vision. Se necesitan algoritmos para identificar correctamente las posiciones y las orientaciones corporales de los jugadores en tiempo real, para decidir si una situación es un contraataque o una posesión establecida. Este problema aún no se ha resuelto completamente y los algoritmos cometen errores. Incluso en las principales ligas, en las que se utilizan varias cámaras para filmar partidos desde múltiples ángulos, los datos de seguimiento tampoco son 100 % fiables. ¿Un trabajo para un informático joven y ambicioso?

 

A pesar de las limitaciones, los datos de seguimiento de los 22 jugadores ya son lo suficientemente fiables como para comenzar a generar información. Por ejemplo, el físico William Spearman, que ahora trabaja en el Liverpool FC, ha desarrollado un modelo de pase que muestra qué pases son posibles y cuáles serán bloqueados. El año pasado, uno de mis estudiantes del máster en Ciencias de la Computación, Fran Peralta Alguacil, implementó un modelo similar al de Spearman para observar la toma de decisiones de los jugadores (ver la Figura 1). Pudo mostrar cómo las ‘carreras disruptivas’ de los jugadores del Barcelona abrían espacio para sus compañeros de equipo. El proyecto implicó un uso intensivo de sus habilidades en física para simular tanto el movimiento de los jugadores como la dinámica del balón. Sin una formación científica adecuada, Fran no habría podido simular el movimiento de la pelota.

Figura 1: (a) Situación de partido. El extremo izquierdo (Alcacer) corre para abrir espacio para el lateral izquierdo (Alba). (b) Datos de seguimiento y resultado del modelo de pase. Los puntos muestran las posiciones y, las líneas, las direcciones de los jugadores. La línea azul indica un pase realizado. Las áreas verdes son zonas para un posible pase, mientras que las áreas rojas son las zonas en las que los pases están bloqueados por la oposición.

Otra habilidad es implementar código en ordenadores paralelos, de manera que los resultados se puedan presentar de inmediato. “El staff de los equipos profesionales buscará utilizar datos para tomar decisiones en tiempo real. Los ordenadores ofrecerán segundas opiniones a los entrenadores para que puedan hacer cambios durante los partidos”, me dijo Raúl.

 

El mensaje que me llevo después de hablar con Raúl es que cualquiera que quiera adentrarse en la analítica del fútbol debe pensar ampliamente. La ciencia de los datos y la estadística son importantes, pero también hay oportunidades para aquellos con una buena comprensión de la física, la visión por ordenador o la computación paralela. Los entrenadores y los científicos deportivos también tendrán que desarrollar sus habilidades para aprovechar al máximo este nuevo enfoque analítico. Tendrán que adaptarse para comprender lo que los modelos matemáticos les están diciendo, y para saber en qué resultados confiar y cuándo confiar en su propia intuición.

 

Una última cosa: es importante ser un jugador de equipo. Raúl se refirió de nuevo a Javier Fernández, cuyo trabajo analizamos en el artículo anterior.

 

“Javier es una persona generosa que comparte todo lo que aprende”, me dijo Raúl. “Esa es también la filosofía del Barça. Esto no minimiza el valor competitivo porque el verdadero valor es el aprendizaje. Las fórmulas finales son solo la culminación del trabajo; la parte más hermosa es el camino que nos lleva hasta allí”.

 

Por lo tanto, sea cual sea el camino que tomes en la analítica de datos, asegúrate de estar abierto. Habla con otros, aprende y comparte tus inquietudes y conocimientos. Esto creará la analítica del fútbol del futuro.

 

Apúntate al Certificado en Analista Táctico de Fútbol

 

David Sumpter

NOTAS RELACIONADAS

CÓMO LAS EXIGENCIAS FÍSICAS DE LOS FUTBOLISTAS VARÍAN SEGÚN SU POSICIÓN

Aunque existen varios estudios al respecto, muchos de ellos han analizado estas demandas abarcando solo unas pocas variables o empleando ventanas de tiempo muy amplias. Un nuevo estudio realizado por preparadores físicos del F.C. Barcelona ha analizado con mayor precisión varios de estos detalles.

UN GRAN DESCONOCIDO EN LAS LESIONES MUSCULARES: EL TEJIDO CONECTIVO DE LA MATRIZ EXTRACELULAR

Un editorial publicado en la revista The Orthopaedic Journal of Sports Medicine —en el que han participado miembros de los servicios médicos del club— propone considerar la arquitectura íntima de la zona afectada, valorar a la matriz extracelular como un actor fundamental en el pronóstico de la lesión.

¿DE QUÉ SE TRATA REALMENTE LA GESTIÓN DE LA CARGA?

En este artículo, Tim Gabbet y su equipo proporcionan una guía fácil de usar para los profesionales cuando describen a los entrenadores la finalidad general de la gestión de la carga.

DOS SEMANAS BASTAN PARA AUMENTAR EL VOLUMEN Y LA FUERZA MUSCULAR

Por primera vez se demuestra que no hacen falta meses de entrenamiento, sino que dos semanas de un ejercicio apropiado bastan para mejorar significativamente tanto el volumen como la fuerza muscular.

¿Grados de libertad o grados de esclavitud?

La comprensión de las variables modificadoras del juego basada en los grados de libertad.

LA IMPORTANCIA DE LA BIOESTADÍSTICA EN LAS CIENCIAS DEL DEPORTE Y LA MEDICINA DEPORTIVA

El área de analítica del deporte ha crecido exponencialmente gracias a las ciencias de la informática y engloba disciplinas como las ciencias del deporte, ciencias del comportamiento, la medicina y la visualización de datos, entre otras, además de la estadística con un enfoque más táctico y de rendimiento del deporte.

EJERCICIOS EXCÉNTRICOS: ESTUDIANDO “VACUNAS” PARA LOS MÚSCULOS

El entrenamiento mediante ejercicios excéntricos es importante para prevenir lesiones. Sin embargo, un entrenamiento intensivo puede ocasionar también un cierto daño muscular, que es preciso vigilar para reducir al máximo el riesgo de lesión.

EL NIVEL DE RESISTENCIA COMO MODERADOR DE LA CARGA DE ENTRENAMIENTO

La resistencia cardiovascular de los deportistas se ha manifestado como un moderador del resultado de la carga a la que son expuestos.

¿Están los jugadores bien perfilados con relación al balón?

A través de la visión por computador podemos identificar algunos déficits en cuanto a la orientación corporal de los jugadores en diferentes situaciones del juego.

¿Quieres saber más?

  • Suscríbete
  • Contáctanos
  • Únete al HUB

Mantente al día con nuestras novedades

¿Tienes preguntas sobre Barça Universitas?

  • Startup
  • Centro de Investigación
  • Corporativo

Por favor, completa los campos:

Por favor, completa los campos:

Por favor, completa los campos:

El Formulario ha sido enviado exitosamente.

Por favor, completa los campos:

Por favor, completa los campos:

Por favor, completa los campos:

El Formulario ha sido enviado exitosamente.

Por favor, completa los campos:

Por favor, completa los campos:

Por favor, completa los campos:

El Formulario ha sido enviado exitosamente.