OddsForge 方法論完整公開:五信號融合 + Dixon-Coles + Gemini Rebalancer
OddsForge 預測引擎使用 6 個獨立信號加權融合, Market Consensus 25%、Dixon-Coles Poisson 25%、Form & Momentum 20%、 Sharp Money Divergence 15%、Head-to-Head 10%、Bookmaker Odds Anchor 5%, 融合結果經 Google Gemini 作為 LLM Rebalancer 後處理(針對足球平局率系統性低估等已知偏差修正)。 引擎建立在 Dixon-Coles 1997、Levitt 2004、Hubáček 2019、Kelly 1956 等 4 篇核心學術論文之上。 2026 Q2 96 場真實預測整體命中率 55.7%、ROI -16.5%; 其中 High Confidence 區段 75.9% 命中率 + ROI +2.8% 是唯一獲利區段。 本頁完整公開信號權重、數學公式、工程實作、已知限制與失敗案例—— 所有原始 dataset 開放下載(CC-BY-4.0)以供獨立驗證。
1. 整體架構與信號權重
OddsForge 預測引擎的設計哲學是信號分散——沒有單一信號擁有絕對話語權, 也沒有任何信號的權重超過 25%。這個設計選擇來自 value betting 的核心洞察: 當市場已經訂價時,alpha 來自於擁有市場沒有納入的信號,而不是更精準地擬合市場本身的價格。
| 信號 | 權重 | 資料來源 | 學術依據 | 深度教學 |
|---|---|---|---|---|
| Market Consensus | 25% | The Odds API(24 家莊家) | Forrest-Goddard-Simmons 2005 | 賠率分析教學 |
| Dixon-Coles Poisson | 25% | Football-Data.org 積分榜 | Dixon & Coles 1997 | 泊松分布教學 |
| Form & Momentum | 20% | 近 5 場戰績 | Goddard-Asimakopoulos 2004 | Elo 教學 |
| Sharp Divergence | 15% | Pinnacle vs soft books | Levitt 2004 | 本頁 §4 |
| Head-to-Head | 10% | 近 5 次對戰歷史 | Maher 1982 | 本頁 §5 |
| Bookmaker Anchor | 5% | Pinnacle 或 5dimes | Kuypers 2000 | Value Bet 教學 |
融合後的初步概率分布再經 Gemini Rebalancer(見 §6)做最終 calibration 修正, 輸出三向概率(home/draw/away)+ 信心度標籤(high/medium/low)+ 中文 reasoning 段落。 完整 production 實證見 OddsForge 2026 Q2 戰報, 信心度分群實證見 AI 信心度實證。
2. Dixon-Coles Poisson 比分矩陣
Dixon & Coles (1997) 是足球比分預測的奠基論文, 發表於 Journal of the Royal Statistical Society Series C,DOI:10.1111/1467-9876.00065 ,免費 PDF 見arXiv 預印本 。
核心模型假設:兩隊得分服從獨立 Poisson 分布, 均值 λ 由 attacking strength × defensive strength × home advantage 決定:
λ_home = α_home × β_away × γ × λ_avg λ_away = α_away × β_home × λ_avg 其中: α = attacking strength(相對於聯賽平均,>1 表示強) β = defensive strength(相對於聯賽平均,<1 表示強) γ = home advantage(典型值 1.2-1.4) λ_avg = 聯賽場均進球數
Dixon-Coles 的關鍵創新是低分修正項 τ, 解決純 Poisson 模型對 0-0、1-1、0-1、1-0 比分系統性低估的問題:
P(X=x, Y=y) = τ(x, y) × Poisson(x | λ_home) × Poisson(y | λ_away) τ(0, 0) = 1 - λ_home × λ_away × ρ τ(0, 1) = 1 + λ_home × ρ τ(1, 0) = 1 + λ_away × ρ τ(1, 1) = 1 - ρ 其餘情況 τ = 1 其中 ρ 為待估參數,典型值 -0.1 到 -0.2
OddsForge 實作時使用 6×6 比分矩陣(0-5 球), 並對近期賽事加 time-decay 權重(ξ = 0.0065)以反映球隊狀態變化。 原論文用 0.85 time-decay 後 log-likelihood 相比 baseline 改善約 5%, 對應 1995-96 全季產生約 10% ROI 的策略性投注機會。
完整 Python 實作(含 30 行可執行程式碼)見泊松分布完整教學。
3. Market Consensus(24 家莊家)
Market Consensus 信號透過 The Odds API 實時拉 24 家國際莊家的 h2h(勝平負)市場賠率, 計算去除 vig 後的平均隱含概率:
步驟 1:對每家莊家算原始隱含概率 p_raw = 1 / decimal_odds 步驟 2:去除該家的 vig(margin) vig = sum(p_raw) - 1 p_fair = p_raw / sum(p_raw) 步驟 3:跨 24 家平均得到 market consensus p_market = mean(p_fair across 24 books)
學術依據來自 Forrest, Goddard & Simmons (2005), 他們用約 10,000 場英格蘭足球資料證明 bookmaker odds 的預測準確度 逐漸超越獨立 statistical model(log-likelihood 改善約 10%)。 這是為什麼 Market Consensus 拿到 25% 的高權重——但只有 25%, 因為剩下 75% 是 OddsForge 試圖找出市場沒納入的信息。
5. Form & Head-to-Head 信號
Form & Momentum 信號使用近 5 場戰績計算動態球隊強度:
form_score = sum(points_last_5) / 15 其中 win=3、draw=1、loss=0 範圍 [0, 1],相對於聯賽平均歸一化 主客場分開計算:home_form vs away_form
學術依據:Goddard & Asimakopoulos (2004) 證明加入「球賽對 end-of-season 重要性」「杯賽參與」「兩隊主場地理距離」等 contextual covariate 後, ordered probit 模型在英格蘭聯賽 10 年資料上能找出 8% 正報酬機會。 深度教學見 Elo 評分系統教學。
Head-to-Head 信號拉近 5 次直接對戰結果, 理論依據來自 Maher (1982) 1982 年的 Statistica Neerlandica 論文, 證明特定球隊配對存在 long-term correlation(宿敵效應)。 OddsForge 用簡單 weighted average 而非完整 Bayesian update, 以避免小樣本過擬合。
6. Gemini LLM Rebalancer 後處理
融合後的初步機率分布有兩個已知系統性偏差:
- 足球平局率被低估——純 Poisson 模型即使加上 Dixon-Coles τ 修正後仍系統性低估 1-1、0-0 比分
- 極端賠率信心過度——當 favored side implied probability > 0.7 時,模型容易給過高信心
OddsForge 使用 Google Gemini Pro 作為 LLM Rebalancer 做最終修正。 這個設計的工程實證見即將發布的「Gemini Rebalancer 90 天實證」文章 (Phase C3 後續主題)。Rebalancer 的 prompt 結構:
SYSTEM: 你是運動賽事預測 calibration 顧問。
評估初步預測,根據以下原則修正:
1. 足球平局率不應低於 22%
2. implied probability > 0.75 應降信心
3. 信號間衝突 > 30% 應降信心
USER: 賽事:{home} vs {away} ({league})
初步預測:home={p_home}, draw={p_draw}, away={p_away}
五信號明細:{signals}
賠率:{odds}
輸出 JSON:{
"adjusted": {home, draw, away},
"confidence": "high"|"medium"|"low",
"reasoning": "<100 字中文>"
}Confidence 標籤的實證表現見AI 信心度實證研究:High Confidence 75.9% 命中率(ROI +2.8%)vs Medium 44.2%(ROI -25.6%), 差距 31.7 個百分點,是少數有實質預測力的 LLM 後處理應用案例。
7. 已知限制與失敗模式
OddsForge 的方法論透明承諾包含誠實揭露失敗:
| 限制 | 證據 | 改進方向 |
|---|---|---|
| NBA / MLB alpha 不足 | NBA ROI -18.1%、MLB -23.2%(Q2 96 場) | 投手對戰矩陣 / playoff context 信號待加 |
| 小聯賽樣本不足 | 德甲 1 場、義甲 2 場 → 不足以結論 | 擴大資料蒐集週期至 12 個月 |
| Sharp Money 偵測未觸發 | sharpConfirmed = 0/79(demo tenant 流量不足) | 改 cron 觸發 movement refresh |
| Dixon-Coles 對極短賠平局風險 | 拜仁 vs 海登海姆 home prob 0.764 → 結果 0-0 | Gemini Rebalancer 加強平局率下限 |
| 系統去重 bug | 尤文圖斯 vs 維羅納連兩天進精選 | 已修,下季報告驗證 |
| High Confidence 過度悲觀 | implied 0.71 vs 實際 0.759(calibration plot) | Rebalancer prompt 調整 |
失敗案例完整討論見OddsForge Q2 戰報 §7。
8. 學術引用清單
Modelling Association Football Scores and Inefficiencies in the Football Betting Market
Dixon, M.J. and Coles, S.G. (1997)
Journal of the Royal Statistical Society: Series C, 46(2), 265–280
DOI: 10.1111/1467-9876.00065
— 比分矩陣 + tau 修正的奠基論文
Why are Gambling Markets Organised so Differently from Financial Markets?
Levitt, S.D. (2004)
The Economic Journal, 114(495), 223–246
DOI: 10.1111/j.1468-0297.2004.00207.x
— Sharp money / market efficiency 的核心論文(諾貝爾獎得主)
Learning to predict soccer results from relational data with gradient boosted trees
Hubáček, O., Šourek, G., Železný, F. (2019)
Machine Learning, 108(1), 29–47
DOI: 10.1007/s10994-018-5704-1
— 現代 ML 模型在足球預測的代表作(53-54% 命中率為 SOTA 基準)
A New Interpretation of Information Rate
Kelly, J.L. Jr. (1956)
Bell System Technical Journal, 35(4), 917–926
DOI: 10.1002/j.1538-7305.1956.tb03809.x
— 凱利公式原始論文(最佳 stake sizing)
Modelling association football scores
Maher, M.J. (1982)
Statistica Neerlandica, 36(3), 109–118
DOI: 10.1111/j.1467-9574.1982.tb00782.x
— 早於 Dixon-Coles 15 年的奠基論文(attacking/defensive parameter)
Analysis of sports data by using bivariate Poisson models
Karlis, D., Ntzoufras, I. (2003)
Journal of the Royal Statistical Society: Series D, 52(3), 381–393
DOI: 10.1111/1467-9884.00366
— Bivariate Poisson 改良(diagonal-inflated 修正平局)
Forecasting football results and the efficiency of fixed-odds betting
Goddard, J., Asimakopoulos, I. (2004)
Journal of Forecasting, 23(1), 51–66
DOI: 10.1002/for.877
— Form & momentum + contextual covariate 路線
Odds-setters as forecasters: The case of English football
Forrest, D., Goddard, J., Simmons, R. (2005)
International Journal of Forecasting, 21(3), 551–564
DOI: 10.1016/j.ijforecast.2005.03.003
— 證明 bookmaker 預測準確度逐年提升 → Market Consensus 25% 權重的依據
pi-football: A Bayesian network model for forecasting Association Football match outcomes
Constantinou, A.C., Fenton, N.E., Neil, M. (2012)
Knowledge-Based Systems, 36, 322–339
DOI: 10.1016/j.knosys.2012.07.008
— Bayesian Network 路線代表(與 Ensemble 路線對比)
Information and efficiency: an empirical study of a fixed odds betting market
Kuypers, T. (2000)
Applied Economics, 32(11), 1353–1363
DOI: 10.1080/00036840050151449
— Bookmaker behavioral model(最大化 share rather than minimize risk)
The Kelly Capital Growth Investment Criterion: Theory and Practice
MacLean, L.C., Thorp, E.O., Ziemba, W.T. (Eds.) (2011)
World Scientific Handbook in Financial Economics, Vol. 3
— Half Kelly / Fractional Kelly 系統論述
Verification of forecasts expressed in terms of probability
Brier, G.W. (1950)
Monthly Weather Review, 78(1), 1–3
— Brier Score(probabilistic forecast evaluation)的原始定義
Eric Chiu · OddsForge 創辦人
量化分析背景,運動博彩 AI 系統開發者。OddsForge 平台技術主導, 負責五信號融合預測引擎與 Dixon-Coles 比分模型實作。 方法論透明戰略主導者——所有 settled picks 結算完整公開、原始 dataset 開放下載(CC-BY-4.0)。 聯繫:Telegram @eric16888999。
最後更新:2026 年 5 月 4 日