技術文件方法論透明Boss Page2026-05-04 · 最後更新

OddsForge 方法論完整公開：五信號融合 + Dixon-Coles + Gemini Rebalancer

OddsForge 預測引擎使用 6 個獨立信號加權融合， Market Consensus 25%、Dixon-Coles Poisson 25%、Form & Momentum 20%、 Sharp Money Divergence 15%、Head-to-Head 10%、Bookmaker Odds Anchor 5%，融合結果經 Google Gemini 作為 LLM Rebalancer 後處理（針對足球平局率系統性低估等已知偏差修正）。引擎建立在 Dixon-Coles 1997、Levitt 2004、Hubáček 2019、Kelly 1956 等 4 篇核心學術論文之上。 2026 Q2 96 場真實預測整體命中率 55.7%、ROI -16.5%；其中 High Confidence 區段 75.9% 命中率 + ROI +2.8% 是唯一獲利區段。本頁完整公開信號權重、數學公式、工程實作、已知限制與失敗案例—— 所有原始 dataset 開放下載（CC-BY-4.0）以供獨立驗證。

1. 整體架構與信號權重

OddsForge 預測引擎的設計哲學是信號分散——沒有單一信號擁有絕對話語權，也沒有任何信號的權重超過 25%。這個設計選擇來自 value betting 的核心洞察：當市場已經訂價時，alpha 來自於擁有市場沒有納入的信號，而不是更精準地擬合市場本身的價格。

信號	權重	資料來源	學術依據	深度教學
Market Consensus	25%	The Odds API（24 家莊家）	Forrest-Goddard-Simmons 2005	賠率分析教學
Dixon-Coles Poisson	25%	Football-Data.org 積分榜	Dixon & Coles 1997	泊松分布教學
Form & Momentum	20%	近 5 場戰績	Goddard-Asimakopoulos 2004	Elo 教學
Sharp Divergence	15%	Pinnacle vs soft books	Levitt 2004	本頁 §4
Head-to-Head	10%	近 5 次對戰歷史	Maher 1982	本頁 §5
Bookmaker Anchor	5%	Pinnacle 或 5dimes	Kuypers 2000	Value Bet 教學

融合後的初步概率分布再經 Gemini Rebalancer（見 §6）做最終 calibration 修正，輸出三向概率（home/draw/away）+ 信心度標籤（high/medium/low）+ 中文 reasoning 段落。完整 production 實證見 OddsForge 2026 Q2 戰報，信心度分群實證見 AI 信心度實證。

2. Dixon-Coles Poisson 比分矩陣

Dixon & Coles (1997) 是足球比分預測的奠基論文，發表於 Journal of the Royal Statistical Society Series C，DOI:10.1111/1467-9876.00065 ，免費 PDF 見arXiv 預印本。

核心模型假設：兩隊得分服從獨立 Poisson 分布，均值 λ 由 attacking strength × defensive strength × home advantage 決定：

λ_home = α_home × β_away × γ × λ_avg
λ_away = α_away × β_home × λ_avg

其中：
  α = attacking strength（相對於聯賽平均，>1 表示強）
  β = defensive strength（相對於聯賽平均，<1 表示強）
  γ = home advantage（典型值 1.2-1.4）
  λ_avg = 聯賽場均進球數

Dixon-Coles 的關鍵創新是低分修正項 τ，解決純 Poisson 模型對 0-0、1-1、0-1、1-0 比分系統性低估的問題：

P(X=x, Y=y) = τ(x, y) × Poisson(x | λ_home) × Poisson(y | λ_away)

τ(0, 0) = 1 - λ_home × λ_away × ρ
τ(0, 1) = 1 + λ_home × ρ
τ(1, 0) = 1 + λ_away × ρ
τ(1, 1) = 1 - ρ
其餘情況 τ = 1

其中 ρ 為待估參數，典型值 -0.1 到 -0.2

OddsForge 實作時使用 6×6 比分矩陣（0-5 球），並對近期賽事加 time-decay 權重（ξ = 0.0065）以反映球隊狀態變化。原論文用 0.85 time-decay 後 log-likelihood 相比 baseline 改善約 5%，對應 1995-96 全季產生約 10% ROI 的策略性投注機會。

完整 Python 實作（含 30 行可執行程式碼）見泊松分布完整教學。

3. Market Consensus（24 家莊家）

Market Consensus 信號透過 The Odds API 實時拉 24 家國際莊家的 h2h（勝平負）市場賠率，計算去除 vig 後的平均隱含概率：

步驟 1：對每家莊家算原始隱含概率
  p_raw = 1 / decimal_odds

步驟 2：去除該家的 vig（margin）
  vig = sum(p_raw) - 1
  p_fair = p_raw / sum(p_raw)

步驟 3：跨 24 家平均得到 market consensus
  p_market = mean(p_fair across 24 books)

學術依據來自 Forrest, Goddard & Simmons (2005)，他們用約 10,000 場英格蘭足球資料證明 bookmaker odds 的預測準確度逐漸超越獨立 statistical model（log-likelihood 改善約 10%）。這是為什麼 Market Consensus 拿到 25% 的高權重——但只有 25%，因為剩下 75% 是 OddsForge 試圖找出市場沒納入的信息。

4. Sharp Money Divergence 偵測

Sharp Money 信號的理論基礎來自 Levitt (2004)Why are Gambling Markets Organised so Differently from Financial Markets?發表於 The Economic Journal，DOI:10.1111/j.1468-0297.2004.00207.x 。

Levitt 證明 bookmaker 不像股市 market maker 撮合買賣，而是主動承擔風險並系統性 exploit bettor bias。其中 Pinnacle 因低 vig（2-3%）+ 接受高額注碼，被視為市場 sharp money 的代表，其賠率變動往往領先軟莊家 5-15 分鐘。

OddsForge 偵測邏輯：

對每場賽事，計算：
  pinnacle_implied = 1 / pinnacle_odds (去 vig)
  soft_avg = mean(1 / odds for soft_books) (去 vig)
  divergence = pinnacle_implied - soft_avg

若 |divergence| > 5%（特定方向）：
  sharpConfirmed = true
  signal_direction = sign(divergence)

已知限制（誠實揭露）

OddsForge production 截至 2026-05-04，sharpConfirmed 觸發場次為 0/79 settled picks。根因：movement 偵測機制是 on-demand 觸發（用戶打開頁面才更新），而 demo tenant 平常訪問量不足以累積資料。預計 2026 Q4 累積足夠樣本後發布完整 Sharp Money 90 天實證研究。

5. Form & Head-to-Head 信號

Form & Momentum 信號使用近 5 場戰績計算動態球隊強度：

form_score = sum(points_last_5) / 15
其中 win=3、draw=1、loss=0
範圍 [0, 1]，相對於聯賽平均歸一化

主客場分開計算：home_form vs away_form

學術依據：Goddard & Asimakopoulos (2004) 證明加入「球賽對 end-of-season 重要性」「杯賽參與」「兩隊主場地理距離」等 contextual covariate 後， ordered probit 模型在英格蘭聯賽 10 年資料上能找出 8% 正報酬機會。深度教學見 Elo 評分系統教學。

Head-to-Head 信號拉近 5 次直接對戰結果，理論依據來自 Maher (1982) 1982 年的 Statistica Neerlandica 論文，證明特定球隊配對存在 long-term correlation（宿敵效應）。 OddsForge 用簡單 weighted average 而非完整 Bayesian update，以避免小樣本過擬合。

6. Gemini LLM Rebalancer 後處理

融合後的初步機率分布有兩個已知系統性偏差：

足球平局率被低估——純 Poisson 模型即使加上 Dixon-Coles τ 修正後仍系統性低估 1-1、0-0 比分
極端賠率信心過度——當 favored side implied probability > 0.7 時，模型容易給過高信心

OddsForge 使用 Google Gemini Pro 作為 LLM Rebalancer 做最終修正。這個設計的工程實證見即將發布的「Gemini Rebalancer 90 天實證」文章（Phase C3 後續主題）。Rebalancer 的 prompt 結構：

SYSTEM: 你是運動賽事預測 calibration 顧問。
        評估初步預測，根據以下原則修正：
        1. 足球平局率不應低於 22%
        2. implied probability > 0.75 應降信心
        3. 信號間衝突 > 30% 應降信心

USER: 賽事：{home} vs {away} ({league})
      初步預測：home={p_home}, draw={p_draw}, away={p_away}
      五信號明細：{signals}
      賠率：{odds}

輸出 JSON：{
  "adjusted": {home, draw, away},
  "confidence": "high"|"medium"|"low",
  "reasoning": "<100 字中文>"
}

Confidence 標籤的實證表現見AI 信心度實證研究：High Confidence 75.9% 命中率（ROI +2.8%）vs Medium 44.2%（ROI -25.6%），差距 31.7 個百分點，是少數有實質預測力的 LLM 後處理應用案例。

7. 已知限制與失敗模式

OddsForge 的方法論透明承諾包含誠實揭露失敗：

限制	證據	改進方向
NBA / MLB alpha 不足	NBA ROI -18.1%、MLB -23.2%（Q2 96 場）	投手對戰矩陣 / playoff context 信號待加
小聯賽樣本不足	德甲 1 場、義甲 2 場 → 不足以結論	擴大資料蒐集週期至 12 個月
Sharp Money 偵測未觸發	sharpConfirmed = 0/79（demo tenant 流量不足）	改 cron 觸發 movement refresh
Dixon-Coles 對極短賠平局風險	拜仁 vs 海登海姆 home prob 0.764 → 結果 0-0	Gemini Rebalancer 加強平局率下限
系統去重 bug	尤文圖斯 vs 維羅納連兩天進精選	已修，下季報告驗證
High Confidence 過度悲觀	implied 0.71 vs 實際 0.759（calibration plot）	Rebalancer prompt 調整

失敗案例完整討論見OddsForge Q2 戰報 §7。

8. 學術引用清單

Modelling Association Football Scores and Inefficiencies in the Football Betting Market

Dixon, M.J. and Coles, S.G. (1997)

Journal of the Royal Statistical Society: Series C, 46(2), 265–280

DOI: 10.1111/1467-9876.00065

Publisher Open PDF

— 比分矩陣 + tau 修正的奠基論文

Why are Gambling Markets Organised so Differently from Financial Markets?

Levitt, S.D. (2004)

The Economic Journal, 114(495), 223–246

DOI: 10.1111/j.1468-0297.2004.00207.x

Publisher Open PDF

— Sharp money / market efficiency 的核心論文（諾貝爾獎得主）

Learning to predict soccer results from relational data with gradient boosted trees

Hubáček, O., Šourek, G., Železný, F. (2019)

Machine Learning, 108(1), 29–47

DOI: 10.1007/s10994-018-5704-1

Publisher

— 現代 ML 模型在足球預測的代表作（53-54% 命中率為 SOTA 基準）

A New Interpretation of Information Rate

Kelly, J.L. Jr. (1956)

Bell System Technical Journal, 35(4), 917–926

DOI: 10.1002/j.1538-7305.1956.tb03809.x

Publisher Open PDF

— 凱利公式原始論文（最佳 stake sizing）

Modelling association football scores

Maher, M.J. (1982)

Statistica Neerlandica, 36(3), 109–118

DOI: 10.1111/j.1467-9574.1982.tb00782.x

Open PDF

— 早於 Dixon-Coles 15 年的奠基論文（attacking/defensive parameter）

Analysis of sports data by using bivariate Poisson models

Karlis, D., Ntzoufras, I. (2003)

Journal of the Royal Statistical Society: Series D, 52(3), 381–393

DOI: 10.1111/1467-9884.00366

Open PDF

— Bivariate Poisson 改良（diagonal-inflated 修正平局）

Forecasting football results and the efficiency of fixed-odds betting

Goddard, J., Asimakopoulos, I. (2004)

Journal of Forecasting, 23(1), 51–66

DOI: 10.1002/for.877

Publisher

— Form & momentum + contextual covariate 路線

Odds-setters as forecasters: The case of English football

Forrest, D., Goddard, J., Simmons, R. (2005)

International Journal of Forecasting, 21(3), 551–564

DOI: 10.1016/j.ijforecast.2005.03.003

Publisher

— 證明 bookmaker 預測準確度逐年提升 → Market Consensus 25% 權重的依據

pi-football: A Bayesian network model for forecasting Association Football match outcomes

Constantinou, A.C., Fenton, N.E., Neil, M. (2012)

Knowledge-Based Systems, 36, 322–339

DOI: 10.1016/j.knosys.2012.07.008

Open PDF

— Bayesian Network 路線代表（與 Ensemble 路線對比）

Information and efficiency: an empirical study of a fixed odds betting market

Kuypers, T. (2000)

Applied Economics, 32(11), 1353–1363

DOI: 10.1080/00036840050151449

— Bookmaker behavioral model（最大化 share rather than minimize risk）

The Kelly Capital Growth Investment Criterion: Theory and Practice

MacLean, L.C., Thorp, E.O., Ziemba, W.T. (Eds.) (2011)

World Scientific Handbook in Financial Economics, Vol. 3

— Half Kelly / Fractional Kelly 系統論述

Verification of forecasts expressed in terms of probability

Brier, G.W. (1950)

Monthly Weather Review, 78(1), 1–3

— Brier Score（probabilistic forecast evaluation）的原始定義

Eric Chiu · OddsForge 創辦人

量化分析背景，運動博彩 AI 系統開發者。OddsForge 平台技術主導，負責五信號融合預測引擎與 Dixon-Coles 比分模型實作。方法論透明戰略主導者——所有 settled picks 結算完整公開、原始 dataset 開放下載（CC-BY-4.0）。聯繫：Telegram @eric16888999。

最後更新：2026 年 5 月 4 日

本頁完整 dataset 開放下載：CSV·JSON·彙總 stats（CC-BY-4.0 授權）