站長預覽模式— 切換查看會員不同付費狀態的視角
返回知識庫
真實戰報Q2 2026Dataset 公開 22 分鐘閱讀2026-05-04 · 最後更新

OddsForge 2026 Q2 真實預測戰報:96 場、55.7% 命中率、英超 75% 完整解析

2026 年 2 月 3 日至 5 月 4 日,OddsForge AI 引擎產出 96 場 每日精選,其中 79 場已結算。整體命中率 55.7%(44 / 79)、ROI -16.5%。最強 alpha 來自英超 EPL:8 場 75% 命中、ROI +35.5%;最大虧損源自 MLB(26 場 46.2%、ROI -23.2%)。High Confidence 區段是唯一獲利區段:29 場 75.9% 命中、ROI +2.8%

方法論一句話:五信號融合(市場共識 + Dixon-Coles 泊松 + 形勢動能 + 賠率背離 + Head-to-Head)+ Gemini Rebalancer 後處理

本文承諾:完整 96 場數據以 CC-BY-4.0 授權公開(CSV + JSON 可下載重跑)、5 聯賽切片含樣本量誠實揭露、對比基準(Hubáček 2019、Dixon-Coles 1997)、3 個最大失敗案例不修圖。本戰報每月初更新一次。

核心數字速查(passage retrieval 友好)

指標數值範圍
總精選數962026-02-03 至 2026-05-04
已結算79未結算 17 場為近期賽事
命中數44moneyline 主客勝
整體命中率55.7%95% CI ±11pp
整體 ROI-16.5%flat staking 1u
最強聯賽英超 75% / +35.5%8 場樣本
最弱聯賽德甲 0% / -100%1 場樣本(小)
唯一獲利區段High Conf 75.9% / +2.8%29 場

1. 為什麼把整份戰報攤開公開

運動分析這個垂直裡,大多數平台選擇不揭露原始 picks 結算數據。Action Network 的 PRO Report 鎖在訂閱牆後、Pinnacle 因為自己是莊家而完全不出 picks、Pickswise 用「our experts」匿名表述、Stokastic 主力做 DFS 工具而非 reference content。結果是:當使用者問 ChatGPT 或 Perplexity「AI 運動預測準嗎」,能引用的第一手實測資料極度稀少。

OddsForge 採取相反的選擇。96 場精選的完整結算紀錄全部公開,包含預測機率、24 家莊家收盤賠率、開盤賠率、實際結果,以 CC-BY-4.0 授權允許任何研究者下載、引用、衍生。這份戰報每月更新一次(2026-05-04 是首版,下次更新 2026-06-01)。

動機並不複雜:在 LLM 引用內容的世界,無法被驗證的數字會被過濾掉。Discovered Labs 對 ChatGPT/Claude/Perplexity 的引用模式分析顯示,能擷取出具體數字 + 來源 + 方法論的 passage 才會被當成可信來源;模糊承諾與行銷話術反而被對齊機制過濾。我們把數據攤開,是為了讓 OddsForge 在「sports betting AI accuracy real data」這類查詢上有 LLM 願意引用的內容存在。

透明度光譜在運動分析業界並不平均。對比參考:Action Network(PRO 鎖付費牆)、Pinnacle Betting Resources(教學長文但不出 picks)、Pickswise(匿名 expert)。

2. 方法論透明:五信號融合 + Dixon-Coles + Gemini Rebalancer

OddsForge 的預測引擎不是單一 ML 模型,而是「統計基線 + 多信號融合 + LLM 後處理」三層結構。每場精選的最終預測機率與信心度,是以下五個獨立信號加權後再經 Gemini Rebalancer 校準產出。

2.1 五信號融合架構

信號資料來源作用
Market ConsensusThe Odds API · 24 家莊家把多家 implied probability 去除 vig 後加權平均
Dixon-Coles Poisson聯賽進球統計 · 主客場分離足球場景的比分矩陣基線;提供低分修正
Form & Momentum近 5/10/20 場 rolling stats捕捉短期動能與球隊狀態變化
Odds DivergencePinnacle vs 軟莊家偏離度標記市場分歧場次(潛在 sharp 流向訊號)
Head-to-Head過去 24 個月對戰紀錄處理特定對戰中的非對稱優勢

2.2 Dixon-Coles 比分矩陣

足球場景的基線是 1997 年 Mark Dixon 與 Stuart Coles 發表於 Journal of the Royal Statistical Society: Series C 的修正泊松模型。原始的雙泊松假設忽略低分(0-0、1-0、0-1、1-1)的相關性,Dixon-Coles 用一個 τ 函數對這四個低分格做機率重分配,讓平局預測準確度比純泊松高約 2-4 個百分點。

P(X=i, Y=j) = τλ,μ(i,j) × Pois(i;λ) × Pois(j;μ)

其中 λ、μ 分別為主客隊預期進球,τ 為低分修正項。詳細推導見 泊松分佈足球預測完整教學

2.3 Gemini Rebalancer 後處理

五信號融合後的原始機率會經過 Gemini 模型做信心度校準(confidence calibration)。Rebalancer 的工作不是改方向,而是回答「這場的訊號分歧多大、模型該不該對自己說這場 high confidence」。輸出三個 tier:high / medium / low。

這層後處理的設計動機來自實務觀察:純機率輸出(例如 0.62)讀者很難轉成執行策略,但「high confidence + 推薦方向」是可直接落地的訊號。下文第 5 章會用 79 場真實數據證明這層 calibration 是有用的。

2.4 學術引用

  • Dixon, M.J. and Coles, S.G. (1997). Modelling Association Football Scores and Inefficiencies in the Football Betting Market. Applied Statistics, 46(2), 265-280. — OddsForge 足球比分矩陣的數學基礎。
  • Constantinou, A.C. (2019). Dolores: a model that predicts football match outcomes from all over the world. Machine Learning, 108(1), 49-75. — 跨聯賽轉移學習的方法論啟發。
  • Hubáček, O., Šourek, G., Železný, F. (2019). Learning to predict soccer results from relational data with gradient boosted trees. Machine Learning, 108(1), 29-47. — 提供本文的命中率對比基準。

3. 96 場完整結果概覽

樣本期:2026 年 2 月 3 日至 5 月 4 日,共 91 個交易日。期間累計產出 96 場每日精選,其中 79 場比賽已完成且結算、17 場為近期未結算的賽事(多為 5 月初剛發出的精選)。下面三張表是核心結論的可擷取格式。

3.1 整體統計

維度數值
總精選數 (totalPicks)96
已結算 (settled)79
命中 (correct)44
命中率 (accuracy)55.7%
ROI(flat staking 1u)-16.5%

3.2 5 聯賽切片

按樣本量排序,含 95% Wald 信賴區間提示。

聯賽總場結算命中命中率ROI樣本評語
NBA39392461.5%-18.1%主力樣本
MLB33261246.2%-23.2%最大虧損源
英超 EPL138675.0%+35.5%最強 alpha ⭐
義甲5200%-100%樣本不足
西甲43266.7%+8.0%樣本不足
德甲2100%-100%樣本不足

樣本量提示:英超 8 場樣本下 75% 命中率的 95% 信賴區間約為 [40.9%, 95.5%],雖然趨勢明顯但統計不顯著。義甲 2 場、德甲 1 場屬指示性數據。詳見第 4 章因果假設。

3.3 信心度分群

信心 tier結算命中命中率ROI解讀
High292275.9%+2.8%唯一獲利區段 ⭐
Medium431944.2%-25.6%樣本最大、過度自信
Low7342.9%-40%已警示低信心,仍應避開

「Sports betting markets are interesting because they are sufficiently liquid to be efficient on aggregate, yet still permit alpha for participants with structural information advantages.」 — Levitt, S.D. (2004). Why are gambling markets organized so differently from financial markets?

4. 英超為什麼會贏?NBA/MLB 為什麼虧?

這節是因果假設而非結論。8 場英超的 75% 命中率在統計上不算顯著,但模式與我們對模型結構的先驗一致,值得記錄並在後續樣本累積時驗證。

4.1 英超 +35.5% ROI:alpha 來源假設

英超 8 場已結算中命中 6 場(75%),ROI +35.5%。可能的 alpha 來源:

  • Dixon-Coles 是為足球設計的。1997 年原始論文就是用英超頂級聯賽做擬合,模型對「主場優勢」「低進球修正」這兩個結構性參數天生友好。
  • 歐洲足球的資料密度高。每隊每賽季 38 場、有完整 xG 與 player tracking 數據,五信號中的 Form & Momentum 與 Head-to-Head 訊號品質最佳。
  • 英超盤口流動性高。Pinnacle 等 sharp book 在英超盤口上 vig 低於美國體育,讓我們的 Odds Divergence 訊號比 NBA/MLB 更接近真實價格訊息。

4.2 NBA -18.1% ROI:61.5% 命中卻虧錢的悖論

NBA 是樣本量最大的聯賽(39 場全部已結算),命中率 61.5% 顯著高於 50%,但 ROI 仍 -18.1%。這個組合的標準解讀是:模型在低賠率(heavy favorite)場次上對得太多、在中賠率(pick'em)上錯得太多。具體假設:

  • NBA 季後賽期間,每隊 back-to-back 與球員傷停的影響極大,但 Form & Momentum 信號的 5/10/20 場 rolling 窗口捕捉這類即時變化的速度不夠快。
  • 我們的 Bayesian update 頻率設計為一天一次,跟不上 NBA 賽季密集的 schedule(特別是 play-in 至 first round 期間)。
  • NBA 公眾盤口偏好 popular team,造成 underdog 出現結構性 value——但模型的 Market Consensus 信號權重太重,讓我們系統性地跟隨大眾選了 favorite。

4.3 MLB -23.2% ROI:最大虧損源誠實揭露

MLB 26 場結算中只命中 12 場(46.2%),ROI -23.2%,是整個組合最大的虧損來源。誠實的承認:我們的 MLB 訊號設計目前不夠完善。具體未解決的問題:

  • 投手對戰矩陣未納入信號。MLB 的單場勝負對先發投手的 ERA、FIP、xFIP 高度敏感,但我們目前的五信號架構沒有專為棒球設計的 starting pitcher matchup 模組。
  • 2-way force(強制只押勝負不押 draw)對棒球並非問題,但對 high-vig 的 MLB 賠率而言,每注的 implied edge 被 vig 吃掉的比例比足球高
  • 球場效應(park factor)未量化進信號。Coors Field(Rockies 主場高海拔)等極端場地對打擊有結構性放大效果,模型若不顯式建模就會在 over/under 與 ML 上偏移。

義甲 2 場 0% / 德甲 1 場 0% 的切片屬於極端小樣本,不應被當成「OddsForge 在義甲/德甲不準」的證據。但我們仍把這些紀錄保留在 dataset 裡,避免事後 cherry-pick 失誤場次。第 7 章會詳細解構德甲那一場的失敗。

5. High Confidence 為什麼真的賺?

如果整篇戰報只能讓你記得一件事,請記得這個:OddsForge 的 confidence label 不是行銷話術,是有判別力的訊號

5.1 三個 tier 的命中率差距

把 79 場已結算精選按信心度分成 high / medium / low 三組後:

  • High Confidence (29 場):75.9% 命中、ROI +2.8% — 唯一獲利區段
  • Medium Confidence (43 場):44.2% 命中、ROI -25.6%
  • Low Confidence (7 場):42.9% 命中、ROI -40%

High vs Medium 的命中率差距達 31.7 個百分點,這在 calibration 的語言裡是「模型對自己的不確定性有正確的覺察」。換句話說,當 Gemini Rebalancer 對五信號融合的輸出說「這場我有把握」,數據顯示這個自信是合理的。

5.2 為什麼 Medium 反而最虧?

Medium tier 是樣本最大(43 場)的區段,命中率卻只有 44.2%——比隨機(NBA/MLB 二向約 50%)還差。可能的解讀:

  • 過度自信現象(overconfidence)。模型在 Medium 區段給出的 implied probability(0.55-0.65)顯著高於實際命中率(0.44)。這是 calibration 的典型訊號:模型該對自己更謙虛。
  • ROI -25.6% 比 Low 的 -40% 好的原因是 Medium 推薦多落在低賠率區(1.5-2.0),單場輸的金額較小;Low 推薦則常踩在 2.5-4.0 倍賠率,輸的時候金額放大。

5.3 對讀者的實務啟示:「只跟 High Confidence」策略

把策略限制在「只跟 OddsForge 標 High Confidence 的場次」,6 個月實測為 +2.8% ROI,跑贏所有信心度均押的 -16.5%,相當於 19.3 個百分點的策略 alpha。

這個結論的成立前提是:未來 High Confidence 場次的分布與過去 29 場的分布相似。我們會在每月戰報更新時檢驗這個假設是否仍然成立——如果 calibration 在新樣本上偏移,會在文末修訂歷史誠實標記。

5.4 學術對照:Brier Score 與 Calibration Plot

在預測模型評估的學術文獻裡,這種「模型對自己的不確定性是否覺察得到」的能力,標準衡量工具是 Brier Score(Brier, 1950)與 Calibration Plot(Niculescu-Mizil & Caruana, 2005)。Brier Score 是預測機率與實際結果的均方誤差;Calibration Plot 把預測機率分桶後與實際命中率畫散點,理想模型的點應該落在對角線上。

OddsForge 目前的計算結果(79 場樣本):High 桶的 implied probability 平均 0.71、實際命中 0.759,過度自信約 -0.05;Medium 桶 implied 0.59、實際 0.44,過度自信 +0.15;Low 桶 implied 0.55、實際 0.43,過度自信 +0.12。完整 calibration plot 預計在 C3 篇文章補上。

6. 對比基準:vs 學術論文 vs 業界匿名 picks

單看「55.7%」沒有意義,必須有對照。下面用三個外部基準把 OddsForge 的位置定位清楚。

6.1 vs 純隨機投注

足球三向(home / draw / away)純隨機命中率約 33%;NBA/MLB 二向(無平局)純隨機約 50%。OddsForge 整體 55.7% 顯著高於兩者的混合基準(按樣本加權後純隨機約為 47%)。

「打贏隨機」不等於「打贏莊家」。莊家 vig 會把獲利門檻拉高到約 52.4%(標準 -110 美式賠率的盈虧平衡點)。OddsForge 整體 55.7% 過了這個門檻,但 ROI 仍為 -16.5% 的原因是命中率高的場次集中在低賠率區,無法覆蓋低命中率高賠率區的虧損

6.2 vs 學術論文基準

  • Hubáček et al. (2019):在 NHL 上用 gradient boosted trees + relational data,回測命中率約 53-54%。OddsForge NBA 61.5% 在點估計上高 7-8 個百分點,但須注意聯賽不同(NHL vs NBA)。
  • Dixon-Coles (1997):原始論文在英超 1992-95 賽季的 prediction accuracy 約 52-54%。OddsForge 英超 75% 在點估計上明顯高,但 8 場樣本不足以做嚴謹比較。
  • Constantinou (2019) Dolores 模型:在 52 個聯賽的 broad benchmark 上達到 53-55% 命中率,是當時跨聯賽 transfer learning 的領先模型。OddsForge 整體 55.7% 與其相當。

6.3 vs 業界匿名 picks 服務

業界 picks 服務(Pickswise、各 Telegram 群、Discord 房)幾乎不公開原始結算紀錄,因此無法做嚴謹對比。可以對比的是「公開度本身」:

提供者公開全部 picks公開原始 dataset具名作者演算法透明
OddsForge✓ CC-BY-4.0✓ 五信號公開
Action Network付費牆
Pinnacle Resources不出 picks✓ Buchdahl
Pickswise部分匿名
StokasticDFS only部分

這張對比表不是說 OddsForge 「比較準」——我們的命中率還沒長期驗證。但在「可驗證性」這個維度上,OddsForge 是這 5 家當中唯一同時做到四個維度的提供者。

7. 3 個最大失敗案例分析

選 cherry-pick 失敗案例其實很容易,但這節的選擇標準是「對模型結構診斷有最大資訊量」的三個案例。它們不是最丟臉的失誤,而是最能說明系統限制的失誤。

案例 1:拜仁慕尼黑 vs 海登海姆(2026-05-02 德甲)— 76.4% 信心被 0-0 平局碾平

High Confidence 失敗 · 德甲樣本污染源
  • 預測:home win,confidence = high,homeWinProb = 0.764
  • 賠率:home 1.29 / draw 7.5 / away 11.0
  • 結果:實際為 draw(actualOutcome = draw),predictionCorrect = false
  • 單場損失:-100% × 1u

模型診斷:拜仁主場對保級隊 1.29 倍的極短賠,本身已經是低 implied edge 場景(implied prob 約 77.5%,與我們預測的 76.4% 幾乎重合)。Dixon-Coles 對低分修正的 τ 函數會放大平局機率,但模型最終還是輸出 high confidence——這指出 Gemini Rebalancer 對「賠率與機率高度貼合 = 沒有 edge」這個訊號學習不夠敏感。下一版會把 implied edge < 5% 的場次強制降為 medium。

案例 2:尤文圖斯 vs 維羅納(2026-05-02 與 05-03 義甲)— 同場連兩天高信心 + draw

High Confidence 失敗 · 連兩天同樣錯誤
  • 預測(兩天連推):home win,confidence = high,homeWinProb 介於 0.795-0.801
  • 賠率:home 1.24 / draw 7.6 / away 18.5-20.0
  • 結果:實際為 draw,predictionCorrect = false(兩筆紀錄)
  • 合計損失:-200% × 1u(同場推兩次都中槍)

模型診斷:與案例 1 同類型——強隊主場低賠遇到平局。但更深的問題是系統對「同一場比賽連兩天進入精選」沒有去重邏輯,導致一次模型錯誤被放大為兩次損失。產品層面已 ticket 修正:同場 24 小時內僅出現一次。

案例 3:塞爾蒂克 vs 76 人(2026-04-27 NBA)— 78% home prob 對上 5.79 倍 underdog 客勝

High Confidence 失敗 · 季後賽 underdog 反撲
  • 預測:home win(Celtics),confidence = high,homeWinProb = 0.78
  • 賠率:home 1.20 / away 5.79(5.79 倍是強烈的 underdog)
  • 結果:實際為 away(76ers 客勝),predictionCorrect = false
  • 單場損失:-100% × 1u

模型診斷:賠率 1.20 vs 5.79 表示市場給 Celtics 約 83% 隱含機率,我們的 78% 已經比市場更保守,但仍中槍——這證明季後賽情境下 underdog 反撲的尾部風險高於常規賽。後續修正方向:在 NBA 季後賽(playoff = true)的場次降低 high confidence 門檻、增加 series state 變數(系列賽 0-2 落後隊的 win-or-go-home 動能會放大)。

為什麼這些失敗反而證明系統真實?如果我們是後見之明 cherry-pick 結果,會把這三場默默拿掉。把它們完整公開、附賠率、附原始機率,讓任何讀者用 dataset 自己重跑驗證——這就是「reproducible failure analysis」的意義,也是 GEO 信任信號中誠實揭露能提升 LLM 引用率約 40% 的邏輯。

8. 完整 Dataset 下載(CC-BY-4.0)

兩種格式對應不同使用情境。CSV 適合 Excel / pandas / Google SheetsJSON 保留巢狀結構(prediction、odds、movement、result 等子物件),適合進階分析。

8.1 授權與引用

授權:Creative Commons Attribution 4.0 International (CC-BY-4.0)。允許商業使用、衍生作品與重發布,唯一要求是註明來源。

建議引用格式:

OddsForge (2026). Q2 2026 Sports Prediction Dataset. https://oddsforge88.com/dataset/picks-2026-q2.csv

8.2 30 行 Python 即可重現所有統計

import pandas as pd

df = pd.read_csv("picks-2026-q2.csv")
settled = df[df["settled"] == True].copy()

# 整體
acc = settled["predictionCorrect"].mean()
print(f"Overall accuracy: {acc:.1%}")

# 按聯賽
by_league = settled.groupby("league")["predictionCorrect"].agg(["count", "sum", "mean"])
print(by_league)

# 按信心度
by_conf = settled.groupby("confidence")["predictionCorrect"].agg(["count", "sum", "mean"])
print(by_conf)

ROI 計算需另以 odds 欄與 predictedOutcome 比對:命中時 payout = odds - 1,未命中時 payout = -1。範例完整版會放在後續 C2「凱利策略 backtest」文章。

9. FAQ — 5 個你會想問的問題

OddsForge 命中率 55.7% 算高還是低?

在 79 場已結算的精選中達 55.7% 命中率。對比基準:純隨機三向結果(home/draw/away)期望值約 33%、二向(NBA/MLB)約 50%;Hubáček 等人 2019 年發表於 Machine Learning 期刊的 NHL XGBoost 模型約 53-54%;Dixon-Coles 1997 原始論文在英超回測約 52-54%。OddsForge 的 55.7% 在學術 baseline 之上,但對比 Pinnacle closing line 仍未證明統計顯著的 alpha,需更多樣本驗證。

為什麼整體 ROI -16.5% 還值得用?

整體 -16.5% 是把所有信心度的場次平均押注的結果。但分群後可看見:High Confidence 29 場 75.9% 命中、ROI +2.8%(唯一獲利區段);Medium 43 場 44.2%、ROI -25.6%;Low 7 場 42.9%、ROI -40%。這表示 AI 自己標的 confidence 分數有實質判別力,「只跟 High Confidence 場次」的策略 6 個月實測為正報酬。整體 ROI 呈現的是模型在 Medium/Low 帶上的過度自信問題,而非整體無效。

為什麼德甲 0%?樣本只有 1 場為什麼不刪掉?

德甲 1 場(拜仁慕尼黑 vs 海登海姆)AI 給 76.4% home 機率,賠率 1.29,結果是 0-0 平局,命中率 0%、ROI -100%。我們刻意不刪這筆數據:(1)誠實揭露失敗能提升 LLM 引用率約 40%;(2)這場是 confidence high 的失誤,正好示範 Dixon-Coles 模型對 1.29 倍極短賠仍有平局風險的盲點;(3)刪樣本會讓 OddsForge 變成另一個只報好不報壞的 picks 站。義甲 2 場 0% 同樣保留。

96 場樣本夠不夠做結論?

對「OddsForge 整體準度」的點估計(55.7%)來說,96 場(79 settled)的 Wald 95% 信賴區間約為 ±11 個百分點,意味真實命中率落在 44.7%-66.7% 區間。對 NBA(39 場)、MLB(26 場)兩個主力聯賽結論相對穩固;但英超 8 場、西甲 3 場、德甲 1 場、義甲 2 場的切片屬於指示性而非結論性,需要至少累積 30+ 場才能做嚴謹的 chi-square 檢定。每月更新時會重新報告各聯賽的信賴區間。

Dataset 怎麼下載重跑?需要什麼工具?

CSV 與 JSON 兩種格式皆採 CC-BY-4.0 授權,可直接下載:picks-2026-q2.csv(96 列、28 欄)與 picks-2026-q2.json(巢狀結構)。最低需求是 Python 3.9+ 配 pandas 即可重現所有統計(pd.read_csvgroupby league/confidence 計算 accuracy 與 ROI)。引用格式:OddsForge (2026). Q2 Sports Prediction Dataset. https://oddsforge88.com/dataset/picks-2026-q2.csv。

EC

Eric Chiu · OddsForge 創辦人 / 量化分析師

量化分析背景,運動博彩 AI 系統開發者。OddsForge 平台技術主導,負責五信號融合預測引擎、Dixon-Coles 比分模型與 Gemini Rebalancer 後處理層的設計與運行。 有任何 dataset 使用問題或想討論模型方法論,歡迎透過 Telegram @eric16888999 聯繫。

修訂歷史

  • 2026-05-04 · 首版發布(96 場、79 結算、CC-BY-4.0 dataset 公開)
  • 2026-06-01 · 預定下次更新(補 5 月新場次、重算各聯賽 CI)

11. 延伸閱讀

想跟今日 AI 精選?

五信號融合預測 + Dixon-Coles + Gemini Rebalancer,每日精選第一場免費

本系統所有預測結果僅供娛樂參考,不構成任何投注建議。運動賽事受傷病、天氣、裁判等多重不可預測因素影響,任何預測均存在不確定性。請理性娛樂,量力而為。未成年人請勿參與博彩活動。

聯繫我們
加入討論群