MATTHEW BENHAM E L’ARCHITETTURA QUANTITATIVA DEL TRADING SPORTIVO
- Star Consulting
- 7 giu
- Tempo di lettura: 8 min

Matthew Benham, fisico di Oxford ed ex-trader di derivati nella City, ha mostrato che un campionato calcistico può essere trattato come un portafoglio di asset numerici.
Nel 2004 fonda Smartodds, boutique di ricerca che fornisce modelli di pricing a operatori di gaming sportivo e a player professionali; il capitale generato con queste tecniche gli permetterà di finanziare Brentford FC, Midtjylland e – dal 2025 – il nuovo progetto AD Mérida.
Pipeline dati proprietaria
Smartodds impiega un network di watcher che, in streaming, etichetta micro-eventi come pressioni, line-break, expected assist, zone di recupero palla.
I pacchetti evento confluiscono in un datalake gestito con pipeline ETL interne; la standardizzazione consente query sub-secondo sull’intero storico.
Ciò garantisce un vantaggio informativo su provider pubblici, i cui “event feeds” spesso soffrono di latenze e campi mancanti.
Probabilità condizionata e modelli Bayesiani
Il cuore metodologico del modello Benham è l’utilizzo esteso della probabilità condizionata e dell’inferenza Bayesiana per aggiornare continuamente le previsioni man mano che nuove informazioni diventano disponibili.
In ottica di trading sportivo, non basta calcolare una probabilità iniziale pre-match: la chiave è saperla aggiustare dinamicamente al variare delle condizioni, un principio mutuato dalla finanza (dove i modelli di pricing si ricalibrano con l’arrivo di nuovi dati di mercato).
Benham applica questo principio sia a livello di stagione che in-play durante i singoli eventi.
Possiamo fare l'esempio dei modelli Smartodds.
Questi utilizzano approcci Bayesiani gerarchici per aggiornare la valutazione della forza di una squadra man mano che si accumulano partite: ogni match fornisce dati evidenti che aggiornano la distribuzione a posteriori delle abilità offensive e difensive di ciascuna squadra, partendo da una distribuzione a priori basata su dati storici.
Analogamente, in tempo reale durante una partita, l’algoritmo può ri-tarare le probabilità di vittoria, pareggio o sconfitta in base a eventi come goal segnati, espulsioni o anche segnali più sottili (ad esempio un numero anomalo di conclusioni per una delle squadre), integrando l’informazione nuova nel calcolo probabilistico condizionato.
Un modello Bayesiano dinamico di questo tipo è descritto in maniera chiara: calibra continuamente la strength delle squadre in-match usando Bayes, così da incorporare la performance corrente nel pronostico aggiornato.
In termini pratici, ciò significa che i player sportivi che seguono questo approccio non rimangono ancorati alle previsioni iniziali, ma “aggiornano le proprie posizioni” mano a mano che raccolgono nuovi insight, perseguendo l’obiettivo non di “aver ragione” in senso assoluto ma di essere col tempo meno in errore rispetto al mercato.
Questo mindset, tipico dei trader quantitativi, rappresenta l’adozione pura del teorema di Bayes nel processo decisionale: ogni probabilità è provvisoria e soggetta a revisione continua con l’arrivo di nuovi dati rilevanti.
In Smartodds l’integrazione di modelli Bayesiani si manifesta anche nella fusione tra input statistici ed elementi esperti.
Un esempio emblematico è il calcolo degli Expected Goals (xG), una metrica predittiva della probabilità di segnare basata sulla qualità delle occasioni da gol.
Mentre molti modelli xG sono costruiti con approccio frequentista puro (analizzando migliaia di tiri storici per stimare la probabilità di rete da una certa posizione), Smartodds ha sperimentato una variante in cui la probabilità di segnare viene stimata per ogni attacco e non solo per ogni tiro, incorporando valutazioni soggettive degli analisti sulle situazioni di gioco.
In pratica, il modello considera l’intera manovra offensiva (ad es. un contropiede pericoloso anche se non culminato in tiro) e assegna una probabilità di gol in base all’esperienza e ai dati raccolti dai watcher.
Questa metodologia è conciliabile con un quadro Bayesiano: si può interpretare la “opinione soggettiva” informata come una sorta di prior che viene poi aggiornato dall’esito (gol o non gol) e calibrato con i dati nel lungo periodo.
Il risultato è un modello predittivo ancora più fine-grained, che riflette meglio la probabilità condizionata di andare a segno date le circostanze specifiche dell’azione, invece di limitarsi a medie storiche grezze.
Per un pubblico di analisti quantitativi, questo rappresenta l’elevazione del modello sportivo a un livello in cui si combinano Bayesian networks e giudizio esperto, massimizzando l’informazione estratta da ogni frammento di partita.
Analisi dei microdati di match e performance nascoste
Uno dei pilastri del modello di Benham è l’analisi dei microdati delle partite per svelare la performance reale sottostante ai risultati.
Tradizionalmente, i giudizi su squadre e giocatori si basavano su metriche aggregate (punti in classifica, gol fatti/subiti, etc.), ma questi indicatori spesso mascherano la vera forza in campo a causa dell’elevata varianza nei risultati del calcio.
Benham, influenzato dalla “rivoluzione Moneyball”, ha puntato invece su statistiche avanzate che misurano la qualità e quantità delle giocate durante il match.
Abbiamo già citato gli Expected Goals come esempio principe: questa metrica traduce ogni tiro in un valore atteso di gol, tenendo conto di fattori come distanza, angolo, parte del corpo utilizzata, situazione di gioco, etc. – fornendo così una stima oggettiva di quanto una squadra avrebbe dovuto segnare in base alle chance create.
Ciò permette di valutare la performance al netto della fortuna: ad esempio, se una squadra vince 1-0 con un xG di 0.5 (un solo tiro pericoloso), mentre l’avversaria perde avendo xG 2.0 (molte occasioni mancate), il modello di Benham coglie che la squadra sconfitta ha in realtà espresso un gioco migliore nonostante il risultato.
Microstatistiche come tiri in area, expected assists, metri guadagnati palla al piede, duelli vinti, pressioni efficaci, diventano tutte variabili alimentanti il modello, opportunamente pesate secondo la loro correlazione storica con le vittorie.
Smartodds, grazie ai watcher, possiede dataset dettagliatissimi su questi aspetti: James Tippett, ex-watcher divenuto autore, ha mostrato come i dati raccolti internamente alimentino algoritmi proprietari utilizzati sia per il trading sui mercati sportivi sia per le decisioni calcistiche nei club di Benham.
Attraverso un’analisi multivariata dei microdati, il modello costruisce indici di prestazione più stabili e rappresentativi.
Un concetto introdotto dallo staff di Benham è la creazione di una sorta di “classifica alternativa” basata sulle prestazioni attese anziché sui punti reali.
In questo ranking ponderato, le squadre vengono ordinate secondo metriche come gli Expected Goals fatti e concessi, aggiustate magari per la difficoltà del calendario e altri fattori.
Questa classifica predittiva tende a essere un miglior predictor dei risultati futuri rispetto alla classifica ufficiale: se ad esempio una squadra occupa una posizione insolitamente alta in classifica pur avendo indicatori statistici mediocri (segnale che ha forse beneficiato di episodi fortunati), il modello la “smonta” indicando un probabile regresso verso la media nel lungo termine.
Viceversa una squadra in bassa classifica ma con ottime metriche di performance viene evidenziata come candidata a risultati positivi futuri.
Per i bookmaker e i trader sportivi questo significa individuare in anticipo squadre sottovalutate o sopravvalutate dal mercato tradizionale, creando opportunità di investimento di valore.
Ad esempio, Brentford nel suo percorso di scalata dalla Championship alla Premier League ha spesso ottenuto meno punti di quanti ne meritasse secondo gli indicatori di performance; il team di Benham, forte delle analisi Smartodds, ha continuato a credere in quei numeri andando a ad operare (quindi posizionandosi sul mercato) a favore dei Bees quando le quote offerte dai bookmaker li davano sfavoriti nonostante il loro edge statistico reale.
In parallelo, la stessa logica applicata al player di trading sportivo (il mercato trasferimenti) ha consentito di identificare talenti sottostimati dai parametri convenzionali: giocatori il cui impatto sul gioco, catturato dai dati avanzati, era superiore a quanto indicato da gol o fama, sono stati acquistati a basso prezzo e rivenduti dopo aver reso molto più delle attese del mercato.
Questo approccio data-driven ha dunque duplice valenza: genera valore nei mercati delle quote sportive e crea vantaggi competitivi nella gestione sportiva reale, sempre sfruttando l’analisi dei microdati per scoprire la verità statistica dietro i punteggi.
Varianza reale vs risultati osservati: stimare l’incertezza
Come afferma Rasmus Ankersen (braccio destro di Benham), “il calcio è uno degli sport più ingiusti al mondo”: essendo a basso punteggio, l’esito di un singolo match spesso mente rispetto a ciò che si è visto in campo.
Un rimbalzo fortunato, un palo, una decisione arbitrale possono ribaltare il risultato in modo sproporzionato rispetto alle performance espresse.
Per un trader quantitativo sportivo, ignorare questa varianza significa sovrastimare le informazioni contenute nel singolo risultato: è necessario invece stimare la varianza reale e filtrare il rumore statistico per valutare correttamente la forza di una squadra o l’efficacia di una strategia.
Il modello di Benham incorpora questo concetto in vari modi.
Anzitutto, richiede campioni sufficientemente ampi per trarre conclusioni affidabili: le analisi interne suggeriscono, ad esempio, che servono decine di partite (dell’ordine di un campionato intero) per stimare con buona approssimazione il reale valore di un team o di un giocatore, a causa della variabilità elevata insita in poche gare.
Questo approccio prudente – supportato da evidenze empiriche – impedisce di reagire in modo eccessivo a brevi strisce di risultati positivi o negativi, laddove il modello diagnostica che possono essere frutto del caso.
Dal punto di vista quantitativo, Smartodds affronta la questione modellizzando i gol e altri eventi con distribuzioni che tengono conto dell’over-dispersion rispetto al Poisson semplice.
Per i gol si possono utilizzare modelli di Poisson calibrati con un fattore di dispersione (o modelli come il Negative Binomial) per riflettere che alcune partite hanno più volatilità di quanta la media suggerirebbe.
Inoltre, i confidence interval delle previsioni vengono sempre considerati: il modello non fornisce un numero singolo per la probabilità di vittoria di una squadra, ma una distribuzione, dalla quale si possono derivare intervalli di confidenza sul vero differenziale di forza. Il risultato finale è che le decisioni di trading sportivo (o di gestione sportiva) basate sul modello di Benham sono robuste, perché tengono conto non solo del valore atteso ma anche della varianza: una squadra valutata forte dal modello avrà probabilità distribuite su un range più stretto di risultati futuri, mentre una squadra “lucky” verrà riconosciuta come tale dal largo intervallo di confidenza attorno alle sue metriche.
Benham rifiuta la lettura basata sui soli gol; KPI primario è Expected Goal Build-Up (xGB), metrica che assegna valore anche alle azioni interrotte prima del tiro.
Nei test interni xGB spiega il 78 % della varianza dei punti futuri (vs 62 % del classico xG).
Da qui nasce la classifica alternativa: ordinare le squadre sul delta fra punti reali e punti attesi rivela chi è sovra- o sotto-valutato dal mercato tradizionale, generando edge sistematici soprattutto nei campionati minori dove il rumore è maggiore.
Gestione dell’edge percentuale
L’operato di Benham mette in luce, in termini quantitativi, come sia possibile battere il concetto di quota efficiente sfruttando un edge informativo-statistico.
La teoria classica dei mercati efficienti applicata allo sports trading suggerisce che le quote incorporate dai bookmaker (specie in mercati molto liquidi) riflettono già al meglio tutte le informazioni disponibili: di conseguenza, nessun attore potrebbe ottenere un rendimento extra senza accesso a informazioni riservate.
Tuttavia, la pratica ha dimostrato che i mercati sportivi – pur tendendo verso l’efficienza col tempo – lasciano sacche di inefficienza sfruttabili da chi dispone di modelli superiori.
Benham ha costruito il proprio edge sulla capacità di elaborare più informazioni e più rapidamente rispetto al mercato: il modello Smartodds integra dataset enormi e algoritmi sofisticati per valutare le probabilità, riducendo l’errore e l’incertezza meglio degli altri attori.
Quando queste valutazioni divergono da quelle implicite nelle quote di mercato, si genera un edge percentuale a favore del trader.
Anche pochi punti percentuali di differenza, se ripetuti su volumi elevati e con gestione oculata del capitale (ad es. criterio di Kelly per dimensionare le posizioni), producono un vantaggio cumulativo enorme nel lungo periodo.
Benham notoriamente ha trasformato un prestito da 700 mila dollari in centinaia di milioni in vincite attraverso anni di operatività basata su edge matematici sottili ma costanti.
Questo contrasta il concetto di quota efficiente in modo pragmatico: dimostra che le quote non sono sempre “giuste” e che un approccio quantitativo può individuare quelle piccole deviazioni su cui costruire profitto.
Perché il mercato resta battibile
La teoria della quota efficiente presume informazione simmetrica; nei fatti esistono tre frizioni strutturali:
Limite informativo – pochi operatori possiedono micro-dati proprietari.
Inerzia algoritmica – molti bookmaker aggiornano i modelli solo a fine stagione.
Crowd-bias – l’eccesso di denaro “ricreativo” gonfia le squadre popolari.
Quando il crowd-bias sposta la probabilità implicita, Smartodds arbitra l’inefficienza; all’aumento di volume informato, la posizione viene hedgiata per cristallizzare il vantaggio.
L’edge, quindi, non è statico: vive finché l’informazione rimane privata o costosa da replicare.
Il caso Benham dimostra che il gaming sportivo è un dominio adatto al price-discovery quantitativo: raccolta dati verticale, modellazione bayesiana real-time, controllo della varianza e gestione prudente del bankroll possono generare rendimento strutturale.
Per i bookmaker che cercano consulenze sul pricing delle quote, la roadmap è chiara: investire in micro-dati, stimare l’incertezza reale, aggiornare in continuo le distribuzioni e agire solo su edge filtrati statisticamente.
Così si trasforma lo sport in un mercato scientifico, dove disciplina quantitativa e conoscenza del gioco convergono per produrre valore a medio-lungo termine.