BIHUB PATH

8 novembre, 2019

QUÈ ES NECESSITA APRENDRE PER A TREBALLAR EN FOOTBALL ANALYTICS?

Anàlisi i Tecnologia Esportiva
Anàlisi i Tecnologia Esportiva
Rendiment Esportiu
Rendiment Esportiu
160K

La pregunta que em fan més sovint és sobre les habilitats necessàries per convertir-se en un científic de dades en un club de futbol. Per a molts, analitzar el futbol és una feina de somni. Si gaudiu tant del futbol com de l’estadística, no hi ha res millor per combinar totes dues aficions en una professió. La qüestió és doncs, quines són les habilitats per a trobar un lloc de treball d’aquest tipus en un club?

 

 

Per respondre aquesta pregunta el millor és començar observant les dades disponibles.

 

Fa deu anys, les dades que utilitzaven els clubs es limitaven a les estadístiques dels gols, els xuts, el nombre de córners, la possessió, etcètera. Aquestes dades tenien un valor limitat per al personal tècnic. Tot i que preocupava que l’equip concedís massa xuts al contrari, o no aconseguís mantenir la possessió, conèixer aquest fet no proporcionava informació tècnica. Les típiques estadístiques que veiem per TV, en si mateixes, no ajuden els equips a guanyar partits.

 

La segona onada de dades del futbol  es va basar en les dades del partit (event data) relacionades amb la pilota. El principal proveïdor d’aquestes dades, Opta, proporcionava coordenades (x,y) de cada passada de la pilota, de cada acció defensiva i de cada xut. Opta és ara un dels nombrosos proveïdors de dades, entre els quals hi ha Statsbomb, Wyscout i diverses empreses d’apostes, que recullen aquests tipus de dades.

 

Les dades dels partits han demostrat ser útils a molts clubs, especialment per a cerca promeses. Les estadístiques que es coneixen millor en aquest context són els gols esperats, que mesuren la qualitat de les possibilitats creades pels jugadors. Altres mètriques més avançades inclouen les assistències esperades, models de passada que assignen un valor a cada una de les passades en funció de la progressió de la pilota, i els encadenaments de possessió que mesuren la intervenció en les seqüències d’atac. Aquestes estadístiques, juntament amb les mesures més tradicionals, com ara els registres de les lluites al davant, intercepcions i la finalització de la passada, sovint es presenten en forma de radar en el jugador. El radar mostra la comparació de cada jugador amb d’altres que juguen en la mateixa lliga.

 

Sé per experiència i de primera mà que a molts caça-talents dels clubs els encanten aquests diagrames. Per a ells és, més bé o més malament, una manera de confirmar el que pensen sobre un jugador o a l’hora de trobar un nou talent, per tenir-ne una anàlisi més detallada.

 

Per poder tractar i analitzar les dades dels partits han de saber programar, preferiblement en Python o R, a més de conèixer també el model estadístic bàsic. Els gols esperats són un model de regressió logística. Els models de passades utilitzen tant la regressió logística com la xarxa neuronal bàsica. Aquests són temes que apareixen en tots les bones llicenciatures d’estadística, màsters en ciències de dades, que es poden cursar en línia.

 

Tot i que és important conèixer dades sobre la pilota, el futur de l’analítica del futbol bé pot anar cap per altres camins. Em vaig trobar amb en Raúl Peláez Blanco, responsable d’Anàlisi, Innovació i Tecnologia de l’Esport del FC Barcelona i li vaig preguntar sobre les dades que utilitza actualment l’equip.

 

Va ser molt clar: “Per avaluar els jugadors, no ens basem en les dades dels partits. Pensem que hem d’entendre com actuen els jugadors en diferents contextos. Per exemple, si estem analitzant un extrem que regateja molt bé en els contraatacs, també ens preguntem com regateja quan s’organitza la defensa del contrari. Les dades del partit no ens diuen això”.

 

“Abans de signar amb un jugador, hem d’analitzar com resol els problemes en els contextos als quals s’enfrontarà al Barça”, em va dir en Raúl. “S’ha popularitzat el fet de classificar els jugadors utilitzant les dades, sense tenir en compte aquests contextos, i això distorsiona la realitat”.

 

No obstant això, seria erroni concloure que en Raúl s’oposa a l’ús de les dades. Al contrari. Per a ell, la qüestió és utilitzar les dades correctes.

 

“El problema amb les dades del partit és que estan descontextualitzades, no sabem quina és la posició de la resta de jugadors en el moment de la passada, per exemple.”, em va dir. “En canvi, fem servir dades de la posició dels 22 jugadors i de la pilota. Això ens ajuda a trobar noves idees tàctiques per a l’entrenador”.

 

Les dades dels 22 jugadors, la tercera onada de dades en el futbol, són millors que les dades del partit. Com el nom indica, conté les coordenades de tots els jugadors sobre el terreny de joc, així com la posició de la pilota. Això és essencial per entendre el context. Durant un partit típic, Luís Suárez té la pilota menys de 90 segons dels més de 90 minuts de temps del partit. El que Suárez, o qualsevol altre jugador, contribueix en la jugada, com ara el fet de pressionar, córrer per obrir espais i la posició tàctica, no es pot mesurar simplement amb les estadístiques dels xuts.

 

Per a en Raúl i el seu equip, el primer pas per utilitzar aquestes dades ha estat automatitzar la feina dels analistes de vídeo. “Fa uns anys, els analistes de vídeo passaven la major part del temps enregistrant i etiquetant partits i entrenaments”, em va dir. “Ara els ordinadors poden fer l’etiquetatge i els analistes de vídeo es poden concentrar a generar més insights gràcies a la informació”.

 

Per dur a terme aquestes tasques cal tenir habilitats en Machine Learning i en Computer Vision. Els algoritmes són necessaris per identificar correctament les posicions i les orientacions corporals dels jugadors en temps real, així com per decidir si una situació és un contraatac o una posició establerta. Aquest problema encara no està completament resolt i els algoritmes cometen errors. Fins i tot a les principals lligues on s’utilitzen diverses càmeres per filmar partits des de diferents angles, les dades de seguiment encara no són 100% fiables. Una tasca per a un informàtic jove i ambiciós?

 

Malgrat les limitacions, les dades de seguiment dels 22 jugadors ja són prou fiables per començar a generar coneixement. Per exemple, el físic William Spearman, que ara treballa al Liverpool FC, ha desenvolupat un model de passada que mostra quines passades són possibles i quines es bloquejaran. L’any passat, un dels meus estudiants del Màster en Ciències de la Computació, Fran Peralta Alguacil, va implementar un model similar al de Spearman per analitzar la presa de decisions dels jugadors (vegeu la figura 1). Va poder demostrar com les “curses disruptives” dels jugadors del Barça obrien espais als seus companys. El projecte va suposar una utilització important de les seves habilitats en física per simular tant el moviment del jugador com la dinàmica de la pilota. Sense una formació científica adequada, en Fran no hauria pogut simular el moviment de la pilota.

Figura 1: (a) Situació de partit. L’extrem esquerre (Alcácer) corre per obrir espai per la part esquerra (Alba). (b) Seguiment de les dades i resultat del model de passada. Els punts mostren les posicions i les direccions de les línies dels jugadors. La línia blava indica les passades realitzades. Les àrees verdes representen una possible passada, mentre que les àrees vermelles indiquen el blocatge de la passada per part del contrari.

Una altra opció és implementar uns codis en ordinadors paral·lels, de manera que es puguin presentar els resultats de manera immediata. “El personal dels equips professionals miraran d’utilitzar les dades per prendre decisions en temps real. Els ordinadors oferiran una segona opinió als entrenadors perquè puguin fer canvis durant els partits”, em va dir en Raúl.

 

A mi, després de parlar amb en Raúl m’ha quedat clar que qualsevol persona que vulgui dedicar-se a l’analítica del futbol, hauria de pensar-ho amb la ment oberta. La ciència de dades i l’estadística són importants, però també hi ha oportunitats per a aquells amb formació en física, visió per ordinador o computació paral·lela. Els entrenadors i científics de l’esport també hauran de desenvolupar els seus coneixements per aprofitar al màxim aquest nou enfocament analític. Hauran d’adaptar-se per entendre el que expliquen els models matemàtics, saber en quins resultats confiar, i quan hauran de confiar en la seva pròpia intuïció.

 

Una última cosa. És important saber treballar en equip. En Raúl es va referir a Javier Fernández, el treball del qual vam analitzar en l’anterior article.

 

“En Javier és una persona generosa que comparteix tot el que aprèn”, em va dir en Raúl. “Aquesta també és la filosofia del Barça. Això no treu el valor competitiu, perquè el valor real és aprendre. Les fórmules finals només són la culminació del treball; la part més bonica és el camí que es recorre”.

 

Així doncs, sigui quin sigui el camí que prengueu en l’analítica de dades, assegureu-vos d’enfocar-ho obertament. Parlar amb els altres, aprendre i compartir els vostres coneixements. Això és el que crearà l’analítica del futbol del futur.

 

Apunta’t al Certificat en Analista Tàctic de Futbol

 

David Sumpter

NOTES RELACIONADES

COM LES EXIGÈNCIES FÍSIQUES DELS FUTBOLISTES VARIEN SEGONS LA SEVA POSICIÓ

Tot i que hi ha diversos estudis sobre aquest tema, l’anàlisi que molts d’ells han fet d’aquestes demandes engloba només poques variables o utilitza finestres de temps molt àmplies. Un nou estudi elaborat per preparadors físics del FC Barcelona ha analitzat diversos d’aquests detalls amb més precisió.

EL GRAN DESCONEGUT EN LES LESIONS MUSCULARS: EL TEIXIT CONNECTIU DE LA MATRIU EXTRACEL·LULAR

Un editorial publicat a la revista The Orthopaedic Journal of Sports Medicine —en el qual han participat membres dels serveis mèdics del club— proposa considerar l’arquitectura íntima de la zona afectada, valorar la matriu extracel·lular com un element fonamental en el pronòstic de la lesió.

DE QUÈ TRACTA REALMENT LA GESTIÓ DE LA CÀRREGA?

En aquest article, Tim Gabbett i el seu equip proporciona una guia fàcil d’usar per als professionals quan descriuen als entrenadors la finalitat general de la gestió de la càrrega.

N’HI HA PROU AMB DUES SETMANES PER AUGMENTAR EL VOLUM I LA FORÇA MUSCULAR

Per primer cop s’ha demostrat que no calen mesos d’entrenament, sinó que dues setmanes d’un exercici adequat són suficients per millorar significativament tant el volum com la força muscular.

Graus de llibertat o graus d’esclavitud?

Comprensió de les variables modificadores del joc, en funció dels graus de llibertat.

LA IMPORTÀNCIA DE LA BIOESTADÍSTICA EN LES CIÈNCIES DE L’ESPORT I MEDICINA ESPORTIVA

L’àrea d’anàlisi de l’esport ha crescut exponencialment gràcies a les ciències de la computació i engloba també altres subàrees (ex: ciències de l’esport, ciències del comportament, medicina o visualització de dades) a part de l’estadística amb un enfocament més tàctic i de rendiment de l’esport.

EXERCICIS EXCÈNTRICS: ESTUDIANT “VACUNES” PER ALS MÚSCULS

És important entrenar amb exercicis de tipus excèntric per prevenir possibles danys. Tot i això, un entrenament intensiu pot ocasionar també un cert dany muscular, que cal vigilar per reduir al màxim el risc de lesió.

ESTABILITAT O INESTABILITAT, ÉS AQUESTA LA QÜESTIÓ?

La importància de construir un model de joc en el futbol.

EL NIVELL DE RESISTÈNCIA COM A MODERADOR DE LA CÀRREGA D’ENTRENAMENT

La resistència cardiovascular dels esportistes s’ha manifestat com un moderador del resultat de la càrrega a la qual està exposat l’esportista.

Els jugadors estan ben perfilats en relació amb la pilota?

A través de la visió per ordinador podem identificar alguns dèficits relatius a l’orientació corporal dels jugadors en diverses situacions del joc.

¿VOLS SABER MÉS?

  • SUBSCRIU-TE
  • CONTACTE
  • APLICAR

ESTIGUES AL DÍA AMB LES NOSTRES NOVETATS

Tens preguntes sobre Barça Universitas?

  • Startup
  • Investigador
  • Corporatiu

Si us plau, completa els camps:

Si us plau, completa els camps:

Si us plau, completa els camps:

El Formulari ha estat enviat amb èxit.

Si us plau, completa els camps:

Si us plau, completa els camps:

Si us plau, completa els camps:

El Formulari ha estat enviat amb èxit.

Si us plau, completa els camps:

Si us plau, completa els camps:

Si us plau, completa els camps:

El Formulari ha estat enviat amb èxit.