Uno dei motivi che più ha stimolato lo sviluppo di nuovi modelli di previsione per le partite è stato sicuramente il mercato delle scommesse.
Ciò ha condotto gli studiosi Mark J. Dixon e Stuart G. Coles ad implementare un modello più
completo rispetto alla semplice Double Poisson diMaher.
La Bivariate Poisson
Sebbene Maher avesse capito che assumere totale indipendenza tra le due distribuzioni
non fosse del tutto esatto, il suo modello non prevede una correlazione tra le due Poisson.
Questo è uno dei primi punti sviluppati da Dixon e Coles.
Infatti essi propongono un allontanamento dall’assunzione di indipendenza per i risultati con pochi gol (0-0, 1-0, 0-1, 1-1) analizzando le partite della Premier League e delle coppe nazionali inglesi dal 1992 al 1995.
Suggeriscono quindi un modello differente dalla Double Poisson, aggiungendo alla funzione di densità la funzione τ e il parametro di correlazione ρ.
Questo modello viene chiamato Bivariate Poisson e la sua funzione di densità è così definita:
dove γ rappresenta l’home effect, ovvero il vantaggio che possiede la squadra che gioca in casa giustificato da molteplici fattori come la presenza di più tifosi, l’adattamento al campo di gioco e la mancanza di stanchezza dovuta ad una possibile trasferta lontana.
Si può notare che γ non è indicizzato, questo perchè viene considerato costante sia per semplicità sia perchè provando a non assumerlo costante le previsioni non migliorano.
A conferma di ciò, la Figura 2 mostra come il parametro non cambi significativamente nel tempo.
Figura 2: serie storica del parametro γ che rappresenta l’home effect delle squadre della Premier
League dal 1992 al 1995
La funzione τ invece, con
rappresenta il parametro di dipendenza tra le due distribuzioni di Poisson.
In termini calcistici si può pensare come al fatto che quando una squadra (qualsiasi siano le
sue capacità) sta perdendo con un gol di scarto, sarà più propensa ad attaccare rispetto a quanto attaccava sullo 0-0.
Si noti che, se ρ = 0, allora la funzione di densità della Bivariate Poisson torna ad essere la funzione di densità della Double Poisson sviluppata da Maher.
L’ultimo aggiustamento introdotto in questo modello riguarda il fatto che le performance recenti dovrebbero avere un peso maggiore rispetto alle partite degli anni precedenti.
Infatti, si può facilmente pensare che una squadra che proviene da una serie di cinque partite consecutive in calo di forma (ad esempio Vittoria-Vittoria-Sconfitta-Sconfitta-Sconfitta) sarà più indicata a perdere contro una squadra in uno stato di forma ascendente (ad esempio Sconfitta-
Sconfitta-Sconfitta-Vittoria-Vittoria) sebbene il numero di vittorie e sconfitte siano le stesse.
Questo tipo di fenomeno è ancora più rilevante ad inizio ed a metà campionato, quando le finestre di calciomercato permettono alle varie squadre di acquistare o cedere giocatori consentendo così rispettivamente di potenziarsi o indebolirsi.
Per questo i due studiosi decidono di aggiungere un’altra funzione φ(t ) che permette loro di far variare la funzione di verosimiglianza nel tempo.
Quest’ultima così definita:
abilita quindi di pesare le capacità delle squadre al variare del tempo determinato dal parametro ξ.
Quest’ultimo può essere visto come un indice di variabilità delle prestazioni delle squadre e del campionato: un valore prossimo a zero indica che i dati provenienti dalle stagioni passate sono molto affidabili, mentre un valore più alto (ad esempio ξ = 0.0015 relativo ai dati della Premier League dal 2012 al 2016) indica che esiste un’alta variabilità delle prestazioni, confermata
anche dalle classifiche finali che mostrano un diverso piazzamento ogni anno.
In sintesi, il modello Dixon-Coles apporta le seguenti modifiche rispetto al modello di base:
• aggiunta del parametro γ che rappresenta il vantaggio del giocare in casa,
• aggiunta della funzione τ che identifica una dipendenza in caso di risultati
bassi (0-0, 1-0, 0-1, 1-1),
• le capacità offensive e difensive (αk e βk con k = i , j ) non sono un dato
costante preso ad inizio anno come prevedeva il modello di Maher, bensì
una valutazione delle performance recenti.
Comments