top of page

ARGOMENTI

IL LONG-SHOT PROBLEM: IL BIAS NASCOSTO CHE DISTORCE I TUOI MODELLI xG

  • 4 giorni fa
  • Tempo di lettura: 4 min

C'è una domanda che chi lavora con i dati dovrebbe porsi ogni volta che apre un foglio xG: il modello che sta usando tratta allo stesso modo un tiro da centro area e una conclusione speculativa da trenta metri?


Se la risposta è sì — e nella maggior parte dei casi lo è — c'è un problema strutturale da affrontare. Si chiama Long-Shot Problem, ed è uno dei bias più documentati e meno discussi dell'analisi xG moderna.


Come funziona il bias

Il modello xG standard viene addestrato su dati storici: migliaia di tiri classificati in base a posizione, angolo, tipo di azione, pressione difensiva e altre variabili.

Il modello impara dalla distribuzione reale degli esiti. Il problema è che i tiri da fuori area sono strutturalmente rari nella conversione ma abbondanti nel volume — e questo squilibrio contamina il modello in modo sistematico.

I dati parlano chiaro.

Secondo l'analisi Opta sulla Premier League 2024/25, il 14,7% dei tiri effettuati dall'interno dell'area ha trovato la rete, contro appena il 4,2% di quelli da fuori area. Siamo davanti a un rapporto di circa 3,5 a 1.

Ma il dato più interessante è un altro: la stagione 2024/25 ha registrato il minor numero di tiri da fuori area dall'area nella Premier League dal 2003/04.

Il mercato tattico si sta adeguando ai modelli — e questo adeguamento racconta quanto il Long-Shot Problem sia ormai percepito anche dagli allenatori, non solo dagli analisti.

Storicamente, le proporzioni erano ancora più impietose.

Dati StatsBomb su cinque stagioni di Premier League mostravano che i tiri da fuori area, esclusi i calci di punizione diretti, venivano convertiti in media una volta ogni 37 tentativi — contro una ogni 7-8 dall'interno dell'area. Non un'inefficienza marginale: un abisso.


Il bias che nessuno vuole ammettere

Perché i modelli xG mainstream tendono a sopravvalutare i tiri da lunga distanza? La risposta è nella struttura del training set.

Un modello addestrato su una distribuzione squilibrata di tiri — molti da fuori, pochissimi che entrano — impara che la probabilità di gol per quei tiri è, diciamo, 3-5%. Ma questo 3-5% è una media costruita su un'enorme varianza. Include la magia di Eriksen, la botta di Neves, il destro calibrato di Salah al limite.

E include anche i tremila tentativi spediti in curva senza alcuna intenzione reale di segnare.

Un'analisi comparativa tra modelli Opta e Understat condotta su dati delle prime cinque leghe europee dal 2017 al 2024 ha evidenziato bias sistematici: entrambi i modelli tendono a sovrastimare l'xG per le squadre di bassa classifica e a sottostimarlo per quelle di alta classifica. Questo pattern è in parte spiegato proprio dai long shots: le squadre meno competitive tendono a tentare più conclusioni speculative da fuori area — tiri con xG basso, ma non abbastanza basso rispetto alla loro conversione reale effettiva.

Anche il lavoro di Davis e Robberechts (2024) sottolinea che certi tiri speculativi, come quelli da lunga distanza, che risultano in gol non rappresentano la vera capacità di finalizzazione del giocatore che li ha calciati. Il gol di Rashford da trenta metri contro il City con xG 0,03 è un esempio perfetto: non è un segnale di skill misurabile, è varianza.

Eppure entra nel computo cumulativo e distorce ogni valutazione costruita su di esso.


Il problema dei tiri fuori specchio

Il Long-Shot Problem ha però una dimensione ancora più radicale, che la ricerca ha iniziato ad affrontare solo di recente. I modelli xG tradizionali ignorano completamente i tiri che non finiscono in porta.

Tutte le metriche sviluppate finora assegnano valore zero ai tiri fuori dallo specchio, che rappresentano quasi due terzi di tutti i tiri effettuati, poiché questi tentativi non hanno alcuna probabilità di trasformarsi in gol.

Questo è un limite enorme.

Uno studio pubblicato sul Journal of Quantitative Analysis in Sports nel 2024 da Baron, Sandholtz, Pleuler e Chan — intitolato "Miss it Like Messi: Extracting Value from Off-Target Shots in Soccer" — dimostra che le traiettorie dei tiri fuori porta contengono un segnale non trascurabile di skill del tiratore.

Un giocatore che calcia sistematicamente di poco a lato dell'incrocio dei pali dimostra qualcosa di molto diverso rispetto a chi spedisce il pallone in tribuna dalla stessa posizione. Il modello standard non distingue: entrambi valgono zero.

Gli autori propongono due nuove metriche che incorporano il segnale contenuto nelle traiettorie dei tiri fuori specchio, costruendo un modello generativo specifico per giocatore.

Il risultato è una lettura più granulare dell'abilità di tiro, che cattura informazioni che l'xG classico — sia pre-shot che post-shot — non riesce a vedere.


Dove cambia la pratica

Le implicazioni operative di questo bias sono dirette e concrete.

Sul fronte scouting, un attaccante di una squadra medio-bassa con molti tiri da fuori area tenderà ad avere un xG cumulativo gonfiato rispetto alla sua reale produzione attesa.

Valutarlo sulla base del GAX rischia di penalizzarlo ingiustamente.

Specularmente, una mezzala o un trequartista che tira poco ma da posizioni ottime può risultare invisibile nei ranking standard.

Sul fronte sport trading, il Long-Shot Problem genera opportunità specifiche.

Le squadre che sparano molto da fuori — soprattutto in fase di rimonta o sotto pressione — tendono ad accumulare xG che il mercato delle quote legge come pericolosità reale.

Non lo è necessariamente.

Un modello che corregge questo bias identifica situazioni in cui la quotazione del gol successivo è distorta dall'accumulo di tentativi speculativi.

Sul fronte analisi tactica, il problema inverte anche la valutazione del pressing: squadre che concedono molti tiri da fuori ma pochi da dentro possono sembrare difensivamente fragili su certi report xG, quando in realtà stanno operando in modo efficiente.


Il punto

I modelli xG hanno trasformato il modo in cui leggiamo il calcio.

Ma non sono neutri.

Contengono bias strutturali che derivano dalla distribuzione dei dati di training — e il Long-Shot Problem è forse il più pervasivo.

Non è una critica al concetto di xG: è una chiamata a usarlo con più precisione.

Sapere dove il modello mente è esattamente quello che separa un'analisi superficiale da una che mostra reale valore.


POST RECENTI

Clienti

Partners

  • Instagram
  • Facebook
  • cinguettio
  • LinkedIn

©2024 by Star Consulting S.r.l. unipersonale - Via Torgianese, 19, 06084 Bettona PG -

P.IVA 03853590549 - info@star-consulting.it

DISCLAIMER IMPORTANTE: Star Consulting srl non è una società di consulenza finanziaria. I servizi proposti da Star Consulting srl  riguardano esclusivamente la FORMAZIONE su come funzionano gli strumenti finanziari. Pertanto, non saranno forniti consigli di investimento o suggerimenti di investimento personalizzati e non saranno fatte proposte di investimento di alcun tipo.

Star Consulting srl non offre servizi di consulenza riservati a soggetti abilitati a svolgere la professione di consulente finanziario.

Star Consulting srl declina ogni responsabilità e ricorda che i contenuti del sito non hanno mai lo scopo di incoraggiare gli investimenti  di alcun genere nè il gioco d'azzardo.

bottom of page