Calcio
Chi vince gli Europei? Data mining e polpo Paul
Scritto con Alice Giorgio (Fondazione Eni Enrico Mattei, FEEM)
Twitter: @giorgio_alice
Orfani del polpo Paul, non ci siamo persi d’animo e abbiamo deciso comunque di interrogare i dati in vista degli Europei di Francia. Anche perchè, come diceva uno che la sapeva lunga, se li torturi prima o poi loro ti dicono quello che vuoi.
Lo diciamo subito: quello che state per leggere è un esercizio di stile, a metà strada tra Queneau e la deviazione standard. E’ un gioco che ci serve prima di tutto a dimostrare che il calcio è bello perché imprevedibile.
Eppure i numeri qualche cosa la dicono. Per esempio che per l’Italia è durissima (non ci voleva un genio, direte voi…).
Per non farci mancare niente, e darvi il beneficio del dubbio, abbiamo deciso anche di costruirne due, di modelli: uno più classico e uno più alla moda, nel senso che tiene conto di alcune tecniche di analisi di big data per trovare in un pozzo di informazioni qualche regolarità.
Ma bando alle ciance: cosa dicono le stime?
Il primo modello aggrega semplicemente, attraverso un’analisi fattoriale (una tecnica di statistica che semplifica un dataset multidimensionale trovando ciò che accomuna più variabili), alcuni indicatori standard per le 24 squadre di Euro 2016, raccolti nel corso delle partite di qualificazione (per la Francia abbiamo necessariamente preso in considerazione le amichevoli, visto che i Galletti ospitano il torneo e vi erano ammessi di diritto).
Tra le statistiche considerate: differenza reti, cartellini gialli e rossi, quotazioni dei bookies, tiri fatti su tiri subiti, stato di forma dei giocatori, per non citarne che alcune.
Costruendo un punteggio per ciascuna squadra, abbiamo simulato il tabellone, arrivano ai risultati che vedete qui sotto:
Una finale da guerra dei Cent’Anni: riusciranno i francesi a vendicare la morte di Giovanna d’Arco?
Certo che sì perché, arrivando alla stessa conclusione di parecchi altri commentatori, il nostro vincitore finale è proprio la Francia.
Non mancano, secondo il primo modello, le sorprese, a partire proprio dalla nazionale di Albione. Ne esce bene, però, anzi benissimo, pure la Polonia di Lewandovski.
Ma gli azzurri?
Si qualificano come secondi alle spalle del Belgio, incontrano l’Austria agli ottavi e, clamorosamente, perdono.
Non contenti di questo primo approccio, facendo un bel po’ di scraping sul blindatissimo sito della UEFA, abbiamo costruito una seconda predizione.
E come?
Innanzitutto raccogliendo alcuni nuovi dati, per tutti i 550 calciatori convocati, molto interessanti.
Ci sono infatti due ranking disponibili: uno assegnato ai giocatori, divisi per ruolo, ed uno che individua i primi 100 giocatori per stato di forma. La classifica viene aggiornata costantemente e raccoglie le principali statistiche di performance individuale, dando maggior peso alle partite più recenti rispetto a quelle passate e tenendo conto anche degli infortuni dal 1 gennaio 2016 a oggi. Viene inoltre assegnato un badge ad alcuni giocatori che stanno scalando la classifica molto velocemente (i cosiddetti fast raiser).
Oltre a questi dati, abbiamo di nuovo analizzato le partite di qualificazione agli europei con un algoritmo di data mining, per portare alla luce dei patterns che incidono sulle possibilità di vittoria di una squadra, isolando le variabili più determinanti.
Eccole qui elencate:
- percentuale di precisione dei passaggi
- media corners a favore
- media corners contro
- falli commessi
- differenza tra tiri in porta fatti e subiti
E poi, forti di una ricerca di alcuni studiosi italiani, il mitico Pezzali Index.
Come si costruisce?
Si definisce come il rapporto tra tiri in porta e gol fatti, moltiplicato per il rapporto tra i gol subiti e i tiri in porta fatti dall’avversario.
Aggiungendo le quotazioni dei bookies e, appunto, il ranking UEFA, abbiamo costruito uno score con l’analisi fattoriale, squadra per squadra, che denominiamo AGGHIACCIANDE INDEX.
Valori più alti si associano tipicamente a una squadra più forte.
Bene, grazie, ma il tabellone?
Eccolo qua.
Clamoroso al Cibali!
Previsioni radicalmente diverse, con Spagna e Germania a contendersi il trofeo.
E i primi che escono vittoriosi dallo scontro finale.
Da sottolineare, qui, l’incredibile performance della Svizzera, che arriva in semifinale, mentre gli azzurri, di nuovo impegnati con l’Austria agli ottavi, passano il turno per perdere con l’Inghilterra ai quarti.
Siccome non siamo avvezzi al Ponziopilates e ci assumiamo la responsabilità delle nostre stime, noi propendiamo decisamente per il secondo modello e, dunque, per l’ennesima vittoria delle Furie Rosse.
Una volta di più, però, è da tenere presente quello che i dati non dicono: il fattore campo, il ruolo dell’allenatore, un nubifragio che scompiglia il riporto di Antonio Conte…
Insomma, divertiamoci e lasciamoci divertire: Francia o Spagna, purché si magna.
Devi fare login per commentare
Accedi