I FINISHER ESISTONO DAVVERO? L'xG, LA VARIANCE E LA SCIENZA DEL GOL

19 ore fa
Tempo di lettura: 4 min

C'è una domanda che torna ciclicamente in ogni discussione di football analytics: certi giocatori sanno davvero fare gol meglio degli altri, oppure l'overperformance sull'xG è solo un'illusione statistica destinata a correggersi?

È una domanda che sembra semplice.

La risposta, invece, è sorprendentemente complessa.

E la ricerca accademica degli ultimi due anni ha messo in discussione alcune certezze che il mondo dell'analisi dava per acquisite.

Il problema del GAX: Goals Above Expected

La metrica standard per valutare un "finisher" è il GAX, ovvero la differenza tra i gol realmente segnati e l'xG accumulato.

Un GAX positivo e costante nel tempo dovrebbe indicare una skill superiore nel finalizzare. Sembra logico, no?

Il problema è che questa logica regge molto meno di quanto si pensi. Uno studio del 2024 pubblicato su arXiv da Jesse Davis e Pieter Robberechts — intitolato Biases in Expected Goals Models Confound Finishing Ability — ha dimostrato attraverso simulazioni su larga scala che un giocatore difficilmente riesce a sovraperformare il proprio xG cumulativo a meno che non riesca ad abbinare un'abilità eccezionale di finalizzazione a volumi elevati di tiro, a causa delle dimensioni limitate dei campioni e dell'alta varianza degli esiti dei tiri.

Tradotto: anche un attaccante tecnicamente superiore alla media, se tira poco, produrrà un GAX positivo solo raramente e in modo non sistematico.

Il segnale esiste, ma si perde nel rumore. Servono decine e decine di tiri — distribuiti su più stagioni — perché la skill emerga in modo statisticamente affidabile.

Per la maggior parte dei giocatori, il campione non è mai abbastanza grande.

Non tutti i tiri sono uguali (e il modello non lo sa)

Il secondo problema riguarda la costruzione stessa dell'xG. I modelli standard trattano ogni tiro come equivalente agli altri sul piano del tiratore: la bravura tecnica non entra nell'equazione. L'xG di un colpo di testa di un difensore su corner vale quanto quello di un tiro ravvicinato di Lewandowski, se la posizione e il contesto sono identici.

Davis e Robberechts sottolineano anche che includere tutti i tiri nel calcolo cumulativo dell'xG non è appropriato: la skill di finalizzazione ha molteplici sfaccettature che andrebbero analizzate separatamente — ad esempio i colpi di testa rispetto ai tiri da lontano — e alcuni tiri non riflettono affatto la qualità del tiratore, come i tiri deviati.

Un tiro deviato che finisce in porta è un gol, ma il portiere non ha potuto farci nulla. Includerlo nell'analisi del finalizzatore distorce il quadro.

Questo sembra ovvio, eppure la stragrande maggioranza dei modelli pubblici continua a non fare questa distinzione.

L'approccio bayesiano: finalmente una risposta più onesta

La ricerca più sofisticata ha risposto a questa sfida con i modelli bayesiani gerarchici. Lo studio Bayes-xG di Scholtes e Karakuş, pubblicato su Frontiers in Sports and Active Living nel giugno 2024, ha analizzato circa 10.000 tiri dalla Premier League applicando regressioni logistiche bayesiane per verificare se esistano effetti legati alla posizione e al singolo giocatore.

I risultati rivelano effetti posizionali in un modello base che include solo distanza dalla porta e angolo del tiro: attaccanti e trequartisti mostrano una probabilità più alta di segnare.

Tuttavia, questi effetti si attenuano significativamente quando vengono introdotti predittori più informativi.

In pratica: sì, la posizione conta.

Un attaccante puro tende a produrre gol con maggiore efficienza di un centrocampista a parità di posizione in campo. Ma questo effetto in gran parte scompare quando il modello ha già a disposizione variabili di contesto ricche — pressione difensiva, posizione del portiere, tipo di azione. Il "talento grezzo del finalizzatore" che resta è reale, ma piccolo.

Un'analisi descrittiva sui dati conferma schemi intuitivi: gli attaccanti mostrano la più alta efficienza, segnando un gol ogni 6,77 tiri e sovraperformando sistematicamente il proprio xG. I centrocampisti, al contrario, sottorendono su tutti i modelli.

Il caso Messi è il più documentato. In uno studio parallelo, Hewitt e Karakuş hanno costruito un modello xG specifico per giocatore usando i tiri di Messi come dataset di training separato: il risultato è che il Pulga sovraperforma l'xG del 21,34%. Un dato eccezionale.

Ma anche qui, si tratta di un campionario costruito su centinaia di tiri nell'arco di più stagioni — un volume che pochissimi attaccanti accumulano nella propria carriera.

Cosa cambia nella pratica: scouting e sport trading

Queste ricerche hanno implicazioni dirette sia per il scouting che per chi opera nel betting e nello sport trading.

Sul fronte dello scouting, il rischio è quello di scartare attaccanti che hanno sovraperformato l'xG per una stagione — liquidando il risultato come "fortuna" — o al contrario di pagare una cifra di mercato premium per un giocatore su un ciclo di overperformance destinato a regredire. Il punto chiave non è il segno del GAX, ma la sua stabilità su campioni sufficientemente ampi.

Un attaccante che sovraperforma l'xG per tre stagioni consecutive, su 80-100 tiri l'anno, sta probabilmente esprimendo una skill reale.

Uno che lo fa in mezza stagione su 20 tiri è semplicemente stato fortunato.

Sul fronte trading, l'implicazione è analoga ma ancora più urgente: le quote di mercato sui marcatori spesso riflettono l'xG grezzo senza tenere conto né del volume di tiro né dell'aggiustamento posizionale.

Un attaccante che ha sovraperformato l'xG nelle ultime sei partite potrebbe essere quotato come se quell'efficienza fosse stabile. La regressione alla media — quando arriva — offre un'opportunità analitica.

Il punto

I finisher esistono.

Ma sono rari, e il mercato e i modelli tendono a vederli sia troppo spesso che troppo tardi. L'xG grezzo non è sufficiente per identificarli: serve volume di tiro, disaggregazione per tipologia di tiro, e idealmente un modello che incorpori l'incertezza bayesiana invece di restituire un numero secco.

La vera domanda non è "questo giocatore ha sovraperformato l'xG?" ma "quanta parte di quella overperformance possiamo attribuire a una skill stabile, e quanta è semplicemente varianza?"

Rispondere correttamente a questa domanda vale molto di più di qualsiasi xG cumulativo di fine stagione.