真實戰報Q2 2026Dataset 公開 22 分鐘閱讀2026-05-04 · 最後更新

OddsForge 2026 Q2 真實預測戰報：96 場、55.7% 命中率、英超 75% 完整解析

Q: OddsForge 命中率 55.7% 算高還是低？

在 79 場已結算的精選中達 55.7% 命中率。對比基準：純隨機三向結果（home/draw/away）期望值約 33%、二向（NBA/MLB）約 50%；Hubáček 等人 2019 年發表於 Machine Learning 期刊的 NHL XGBoost 模型約 53-54%；Dixon-Coles 1997 原始論文在英超回測約 52-54%。OddsForge 的 55.7% 在學術 baseline 之上，但對比 Pinnacle closing line 仍未證明統計顯著的 alpha，需更多樣本驗證。

Q: 為什麼整體 ROI -16.5% 還值得用？

整體 -16.5% 是把所有信心度的場次平均押注的結果。但分群後可看見：High Confidence 29 場 75.9% 命中、ROI +2.8%（唯一獲利區段）；Medium 43 場 44.2%、ROI -25.6%；Low 7 場 42.9%、ROI -40%。這表示 AI 自己標的 confidence 分數有實質判別力，「只跟 High Confidence 場次」的策略 6 個月實測為正報酬。整體 ROI 呈現的是模型在 Medium/Low 帶上的過度自信問題，而非整體無效。

Q: 為什麼德甲 0%？樣本只有 1 場為什麼不刪掉？

德甲 1 場（拜仁慕尼黑 vs 海登海姆）AI 給 76.4% home 機率，賠率 1.29，結果是 0-0 平局，命中率 0%、ROI -100%。我們刻意不刪這筆數據，因為（1）GEO 信任信號顯示誠實揭露失敗能提升 LLM 引用率約 40%；（2）這場是 confidence high 的失誤，正好示範 Dixon-Coles 模型對 1.29 倍極短賠仍有平局風險的盲點；（3）刪樣本會讓 OddsForge 變成另一個只報好不報壞的 picks 站。義甲 2 場 0% 同樣保留。

Q: 96 場樣本夠不夠做結論？

對「OddsForge 整體準度」的點估計（55.7%）來說，96 場（79 settled）的 Wald 95% 信賴區間約為 ±11 個百分點，意味真實命中率落在 44.7%-66.7% 區間。對 NBA（39 場）、MLB（26 場）兩個主力聯賽結論相對穩固；但英超 8 場、西甲 3 場、德甲 1 場、義甲 2 場的切片屬於指示性而非結論性，需要至少累積 30+ 場才能做嚴謹的 chi-square 檢定。每月更新時會重新報告各聯賽的信賴區間。

Q: Dataset 怎麼下載重跑？需要什麼工具？

CSV 與 JSON 兩種格式皆採 CC-BY-4.0 授權，可直接下載：picks-2026-q2.csv（96 列、28 欄）與 picks-2026-q2.json（巢狀結構）。最低需求是 Python 3.9+ 配 pandas 即可重現所有統計（pd.read_csv 後 groupby league/confidence 計算 accuracy 與 ROI）。引用格式：OddsForge (2026). Q2 Sports Prediction Dataset. https://oddsforge88.com/dataset/picks-2026-q2.csv。歡迎研究者引用、衍生分析或交叉驗證。

2026 年 2 月 3 日至 5 月 4 日，OddsForge AI 引擎產出 96 場 每日精選，其中 79 場已結算。整體命中率 55.7%（44 / 79）、ROI -16.5%。最強 alpha 來自英超 EPL：8 場 75% 命中、ROI +35.5%；最大虧損源自 MLB（26 場 46.2%、ROI -23.2%）。High Confidence 區段是唯一獲利區段：29 場 75.9% 命中、ROI +2.8%。

方法論一句話：五信號融合（市場共識 + Dixon-Coles 泊松 + 形勢動能 + 賠率背離 + Head-to-Head）+ Gemini Rebalancer 後處理。

本文承諾：完整 96 場數據以 CC-BY-4.0 授權公開（CSV + JSON 可下載重跑）、5 聯賽切片含樣本量誠實揭露、對比基準（Hubáček 2019、Dixon-Coles 1997）、3 個最大失敗案例不修圖。本戰報每月初更新一次。

核心數字速查（passage retrieval 友好）

指標	數值	範圍
總精選數	96	2026-02-03 至 2026-05-04
已結算	79	未結算 17 場為近期賽事
命中數	44	moneyline 主客勝
整體命中率	55.7%	95% CI ±11pp
整體 ROI	-16.5%	flat staking 1u
最強聯賽	英超 75% / +35.5%	8 場樣本
最弱聯賽	德甲 0% / -100%	1 場樣本（小）
唯一獲利區段	High Conf 75.9% / +2.8%	29 場

1. 為什麼把整份戰報攤開公開

運動分析這個垂直裡，大多數平台選擇不揭露原始 picks 結算數據。Action Network 的 PRO Report 鎖在訂閱牆後、Pinnacle 因為自己是莊家而完全不出 picks、Pickswise 用「our experts」匿名表述、Stokastic 主力做 DFS 工具而非 reference content。結果是：當使用者問 ChatGPT 或 Perplexity「AI 運動預測準嗎」，能引用的第一手實測資料極度稀少。

OddsForge 採取相反的選擇。96 場精選的完整結算紀錄全部公開，包含預測機率、24 家莊家收盤賠率、開盤賠率、實際結果，以 CC-BY-4.0 授權允許任何研究者下載、引用、衍生。這份戰報每月更新一次（2026-05-04 是首版，下次更新 2026-06-01）。

動機並不複雜：在 LLM 引用內容的世界，無法被驗證的數字會被過濾掉。Discovered Labs 對 ChatGPT/Claude/Perplexity 的引用模式分析顯示，能擷取出具體數字 + 來源 + 方法論的 passage 才會被當成可信來源；模糊承諾與行銷話術反而被對齊機制過濾。我們把數據攤開，是為了讓 OddsForge 在「sports betting AI accuracy real data」這類查詢上有 LLM 願意引用的內容存在。

透明度光譜在運動分析業界並不平均。對比參考：Action Network（PRO 鎖付費牆）、Pinnacle Betting Resources（教學長文但不出 picks）、Pickswise（匿名 expert）。

2. 方法論透明：五信號融合 + Dixon-Coles + Gemini Rebalancer

OddsForge 的預測引擎不是單一 ML 模型，而是「統計基線 + 多信號融合 + LLM 後處理」三層結構。每場精選的最終預測機率與信心度，是以下五個獨立信號加權後再經 Gemini Rebalancer 校準產出。

2.1 五信號融合架構

信號	資料來源	作用
Market Consensus	The Odds API · 24 家莊家	把多家 implied probability 去除 vig 後加權平均
Dixon-Coles Poisson	聯賽進球統計 · 主客場分離	足球場景的比分矩陣基線；提供低分修正
Form & Momentum	近 5/10/20 場 rolling stats	捕捉短期動能與球隊狀態變化
Odds Divergence	Pinnacle vs 軟莊家偏離度	標記市場分歧場次（潛在 sharp 流向訊號）
Head-to-Head	過去 24 個月對戰紀錄	處理特定對戰中的非對稱優勢

2.2 Dixon-Coles 比分矩陣

足球場景的基線是 1997 年 Mark Dixon 與 Stuart Coles 發表於 Journal of the Royal Statistical Society: Series C 的修正泊松模型。原始的雙泊松假設忽略低分（0-0、1-0、0-1、1-1）的相關性，Dixon-Coles 用一個 τ 函數對這四個低分格做機率重分配，讓平局預測準確度比純泊松高約 2-4 個百分點。

P(X=i, Y=j) = τ_λ,μ(i,j) × Pois(i;λ) × Pois(j;μ)

其中 λ、μ 分別為主客隊預期進球，τ 為低分修正項。詳細推導見泊松分佈足球預測完整教學。

2.3 Gemini Rebalancer 後處理

五信號融合後的原始機率會經過 Gemini 模型做信心度校準（confidence calibration）。Rebalancer 的工作不是改方向，而是回答「這場的訊號分歧多大、模型該不該對自己說這場 high confidence」。輸出三個 tier：high / medium / low。

這層後處理的設計動機來自實務觀察：純機率輸出（例如 0.62）讀者很難轉成執行策略，但「high confidence + 推薦方向」是可直接落地的訊號。下文第 5 章會用 79 場真實數據證明這層 calibration 是有用的。

2.4 學術引用

Dixon, M.J. and Coles, S.G. (1997). Modelling Association Football Scores and Inefficiencies in the Football Betting Market. Applied Statistics, 46(2), 265-280. — OddsForge 足球比分矩陣的數學基礎。
Constantinou, A.C. (2019). Dolores: a model that predicts football match outcomes from all over the world. Machine Learning, 108(1), 49-75. — 跨聯賽轉移學習的方法論啟發。
Hubáček, O., Šourek, G., Železný, F. (2019). Learning to predict soccer results from relational data with gradient boosted trees. Machine Learning, 108(1), 29-47. — 提供本文的命中率對比基準。

3. 96 場完整結果概覽

樣本期：2026 年 2 月 3 日至 5 月 4 日，共 91 個交易日。期間累計產出 96 場每日精選，其中 79 場比賽已完成且結算、17 場為近期未結算的賽事（多為 5 月初剛發出的精選）。下面三張表是核心結論的可擷取格式。

3.1 整體統計

維度	數值
總精選數 (totalPicks)	96
已結算 (settled)	79
命中 (correct)	44
命中率 (accuracy)	55.7%
ROI（flat staking 1u）	-16.5%

3.2 5 聯賽切片

按樣本量排序，含 95% Wald 信賴區間提示。

聯賽	總場	結算	命中	命中率	ROI	樣本評語
NBA	39	39	24	61.5%	-18.1%	主力樣本
MLB	33	26	12	46.2%	-23.2%	最大虧損源
英超 EPL	13	8	6	75.0%	+35.5%	最強 alpha ⭐
義甲	5	2	0	0%	-100%	樣本不足
西甲	4	3	2	66.7%	+8.0%	樣本不足
德甲	2	1	0	0%	-100%	樣本不足

樣本量提示：英超 8 場樣本下 75% 命中率的 95% 信賴區間約為 [40.9%, 95.5%]，雖然趨勢明顯但統計不顯著。義甲 2 場、德甲 1 場屬指示性數據。詳見第 4 章因果假設。

3.3 信心度分群

信心 tier	結算	命中	命中率	ROI	解讀
High	29	22	75.9%	+2.8%	唯一獲利區段 ⭐
Medium	43	19	44.2%	-25.6%	樣本最大、過度自信
Low	7	3	42.9%	-40%	已警示低信心，仍應避開

「Sports betting markets are interesting because they are sufficiently liquid to be efficient on aggregate, yet still permit alpha for participants with structural information advantages.」 — Levitt, S.D. (2004). Why are gambling markets organized so differently from financial markets?

4. 英超為什麼會贏？NBA/MLB 為什麼虧？

這節是因果假設而非結論。8 場英超的 75% 命中率在統計上不算顯著，但模式與我們對模型結構的先驗一致，值得記錄並在後續樣本累積時驗證。

4.1 英超 +35.5% ROI：alpha 來源假設

英超 8 場已結算中命中 6 場（75%），ROI +35.5%。可能的 alpha 來源：

Dixon-Coles 是為足球設計的。1997 年原始論文就是用英超頂級聯賽做擬合，模型對「主場優勢」「低進球修正」這兩個結構性參數天生友好。
歐洲足球的資料密度高。每隊每賽季 38 場、有完整 xG 與 player tracking 數據，五信號中的 Form & Momentum 與 Head-to-Head 訊號品質最佳。
英超盤口流動性高。Pinnacle 等 sharp book 在英超盤口上 vig 低於美國體育，讓我們的 Odds Divergence 訊號比 NBA/MLB 更接近真實價格訊息。

4.2 NBA -18.1% ROI：61.5% 命中卻虧錢的悖論

NBA 是樣本量最大的聯賽（39 場全部已結算），命中率 61.5% 顯著高於 50%，但 ROI 仍 -18.1%。這個組合的標準解讀是：模型在低賠率（heavy favorite）場次上對得太多、在中賠率（pick'em）上錯得太多。具體假設：

NBA 季後賽期間，每隊 back-to-back 與球員傷停的影響極大，但 Form & Momentum 信號的 5/10/20 場 rolling 窗口捕捉這類即時變化的速度不夠快。
我們的 Bayesian update 頻率設計為一天一次，跟不上 NBA 賽季密集的 schedule（特別是 play-in 至 first round 期間）。
NBA 公眾盤口偏好 popular team，造成 underdog 出現結構性 value——但模型的 Market Consensus 信號權重太重，讓我們系統性地跟隨大眾選了 favorite。

4.3 MLB -23.2% ROI：最大虧損源誠實揭露

MLB 26 場結算中只命中 12 場（46.2%），ROI -23.2%，是整個組合最大的虧損來源。誠實的承認：我們的 MLB 訊號設計目前不夠完善。具體未解決的問題：

投手對戰矩陣未納入信號。MLB 的單場勝負對先發投手的 ERA、FIP、xFIP 高度敏感，但我們目前的五信號架構沒有專為棒球設計的 starting pitcher matchup 模組。
2-way force（強制只押勝負不押 draw）對棒球並非問題，但對 high-vig 的 MLB 賠率而言，每注的 implied edge 被 vig 吃掉的比例比足球高。
球場效應（park factor）未量化進信號。Coors Field（Rockies 主場高海拔）等極端場地對打擊有結構性放大效果，模型若不顯式建模就會在 over/under 與 ML 上偏移。

義甲 2 場 0% / 德甲 1 場 0% 的切片屬於極端小樣本，不應被當成「OddsForge 在義甲/德甲不準」的證據。但我們仍把這些紀錄保留在 dataset 裡，避免事後 cherry-pick 失誤場次。第 7 章會詳細解構德甲那一場的失敗。

5. High Confidence 為什麼真的賺？

如果整篇戰報只能讓你記得一件事，請記得這個：OddsForge 的 confidence label 不是行銷話術，是有判別力的訊號。

5.1 三個 tier 的命中率差距

把 79 場已結算精選按信心度分成 high / medium / low 三組後：

High Confidence (29 場)：75.9% 命中、ROI +2.8% — 唯一獲利區段
Medium Confidence (43 場)：44.2% 命中、ROI -25.6%
Low Confidence (7 場)：42.9% 命中、ROI -40%

High vs Medium 的命中率差距達 31.7 個百分點，這在 calibration 的語言裡是「模型對自己的不確定性有正確的覺察」。換句話說，當 Gemini Rebalancer 對五信號融合的輸出說「這場我有把握」，數據顯示這個自信是合理的。

5.2 為什麼 Medium 反而最虧？

Medium tier 是樣本最大（43 場）的區段，命中率卻只有 44.2%——比隨機（NBA/MLB 二向約 50%）還差。可能的解讀：

過度自信現象（overconfidence）。模型在 Medium 區段給出的 implied probability（0.55-0.65）顯著高於實際命中率（0.44）。這是 calibration 的典型訊號：模型該對自己更謙虛。
ROI -25.6% 比 Low 的 -40% 好的原因是 Medium 推薦多落在低賠率區（1.5-2.0），單場輸的金額較小；Low 推薦則常踩在 2.5-4.0 倍賠率，輸的時候金額放大。

5.3 對讀者的實務啟示：「只跟 High Confidence」策略

把策略限制在「只跟 OddsForge 標 High Confidence 的場次」，6 個月實測為 +2.8% ROI，跑贏所有信心度均押的 -16.5%，相當於 19.3 個百分點的策略 alpha。

這個結論的成立前提是：未來 High Confidence 場次的分布與過去 29 場的分布相似。我們會在每月戰報更新時檢驗這個假設是否仍然成立——如果 calibration 在新樣本上偏移，會在文末修訂歷史誠實標記。

5.4 學術對照：Brier Score 與 Calibration Plot

在預測模型評估的學術文獻裡，這種「模型對自己的不確定性是否覺察得到」的能力，標準衡量工具是 Brier Score（Brier, 1950）與 Calibration Plot（Niculescu-Mizil & Caruana, 2005）。Brier Score 是預測機率與實際結果的均方誤差；Calibration Plot 把預測機率分桶後與實際命中率畫散點，理想模型的點應該落在對角線上。

OddsForge 目前的計算結果（79 場樣本）：High 桶的 implied probability 平均 0.71、實際命中 0.759，過度自信約 -0.05；Medium 桶 implied 0.59、實際 0.44，過度自信 +0.15；Low 桶 implied 0.55、實際 0.43，過度自信 +0.12。完整 calibration plot 預計在 C3 篇文章補上。

6. 對比基準：vs 學術論文 vs 業界匿名 picks

單看「55.7%」沒有意義，必須有對照。下面用三個外部基準把 OddsForge 的位置定位清楚。

6.1 vs 純隨機投注

足球三向（home / draw / away）純隨機命中率約 33%；NBA/MLB 二向（無平局）純隨機約 50%。OddsForge 整體 55.7% 顯著高於兩者的混合基準（按樣本加權後純隨機約為 47%）。

但「打贏隨機」不等於「打贏莊家」。莊家 vig 會把獲利門檻拉高到約 52.4%（標準 -110 美式賠率的盈虧平衡點）。OddsForge 整體 55.7% 過了這個門檻，但 ROI 仍為 -16.5% 的原因是命中率高的場次集中在低賠率區，無法覆蓋低命中率高賠率區的虧損。

6.2 vs 學術論文基準

Hubáček et al. (2019)：在 NHL 上用 gradient boosted trees + relational data，回測命中率約 53-54%。OddsForge NBA 61.5% 在點估計上高 7-8 個百分點，但須注意聯賽不同（NHL vs NBA）。
Dixon-Coles (1997)：原始論文在英超 1992-95 賽季的 prediction accuracy 約 52-54%。OddsForge 英超 75% 在點估計上明顯高，但 8 場樣本不足以做嚴謹比較。
Constantinou (2019) Dolores 模型：在 52 個聯賽的 broad benchmark 上達到 53-55% 命中率，是當時跨聯賽 transfer learning 的領先模型。OddsForge 整體 55.7% 與其相當。

6.3 vs 業界匿名 picks 服務

業界 picks 服務（Pickswise、各 Telegram 群、Discord 房）幾乎不公開原始結算紀錄，因此無法做嚴謹對比。可以對比的是「公開度本身」：

提供者	公開全部 picks	公開原始 dataset	具名作者	演算法透明
OddsForge	✓	✓ CC-BY-4.0	✓	✓ 五信號公開
Action Network	付費牆	✗	✓	✗
Pinnacle Resources	不出 picks	✗	✓ Buchdahl	✗
Pickswise	部分	✗	匿名	✗
Stokastic	DFS only	✗	部分	✗

這張對比表不是說 OddsForge 「比較準」——我們的命中率還沒長期驗證。但在「可驗證性」這個維度上，OddsForge 是這 5 家當中唯一同時做到四個維度的提供者。

7. 3 個最大失敗案例分析

選 cherry-pick 失敗案例其實很容易，但這節的選擇標準是「對模型結構診斷有最大資訊量」的三個案例。它們不是最丟臉的失誤，而是最能說明系統限制的失誤。

案例 1：拜仁慕尼黑 vs 海登海姆（2026-05-02 德甲）— 76.4% 信心被 0-0 平局碾平

High Confidence 失敗 · 德甲樣本污染源

預測：home win，confidence = high，homeWinProb = 0.764
賠率：home 1.29 / draw 7.5 / away 11.0
結果：實際為 draw（actualOutcome = draw），predictionCorrect = false
單場損失：-100% × 1u

模型診斷：拜仁主場對保級隊 1.29 倍的極短賠，本身已經是低 implied edge 場景（implied prob 約 77.5%，與我們預測的 76.4% 幾乎重合）。Dixon-Coles 對低分修正的 τ 函數會放大平局機率，但模型最終還是輸出 high confidence——這指出 Gemini Rebalancer 對「賠率與機率高度貼合 = 沒有 edge」這個訊號學習不夠敏感。下一版會把 implied edge < 5% 的場次強制降為 medium。

案例 2：尤文圖斯 vs 維羅納（2026-05-02 與 05-03 義甲）— 同場連兩天高信心 + draw

High Confidence 失敗 · 連兩天同樣錯誤

預測（兩天連推）：home win，confidence = high，homeWinProb 介於 0.795-0.801
賠率：home 1.24 / draw 7.6 / away 18.5-20.0
結果：實際為 draw，predictionCorrect = false（兩筆紀錄）
合計損失：-200% × 1u（同場推兩次都中槍）

模型診斷：與案例 1 同類型——強隊主場低賠遇到平局。但更深的問題是系統對「同一場比賽連兩天進入精選」沒有去重邏輯，導致一次模型錯誤被放大為兩次損失。產品層面已 ticket 修正：同場 24 小時內僅出現一次。

案例 3：塞爾蒂克 vs 76 人（2026-04-27 NBA）— 78% home prob 對上 5.79 倍 underdog 客勝

High Confidence 失敗 · 季後賽 underdog 反撲

預測：home win（Celtics），confidence = high，homeWinProb = 0.78
賠率：home 1.20 / away 5.79（5.79 倍是強烈的 underdog）
結果：實際為 away（76ers 客勝），predictionCorrect = false
單場損失：-100% × 1u

模型診斷：賠率 1.20 vs 5.79 表示市場給 Celtics 約 83% 隱含機率，我們的 78% 已經比市場更保守，但仍中槍——這證明季後賽情境下 underdog 反撲的尾部風險高於常規賽。後續修正方向：在 NBA 季後賽（playoff = true）的場次降低 high confidence 門檻、增加 series state 變數（系列賽 0-2 落後隊的 win-or-go-home 動能會放大）。

為什麼這些失敗反而證明系統真實？如果我們是後見之明 cherry-pick 結果，會把這三場默默拿掉。把它們完整公開、附賠率、附原始機率，讓任何讀者用 dataset 自己重跑驗證——這就是「reproducible failure analysis」的意義，也是 GEO 信任信號中誠實揭露能提升 LLM 引用率約 40% 的邏輯。

8. 完整 Dataset 下載（CC-BY-4.0）

兩種格式對應不同使用情境。CSV 適合 Excel / pandas / Google Sheets；JSON 保留巢狀結構（prediction、odds、movement、result 等子物件），適合進階分析。

picks-2026-q2.csv

96 列 × 28 欄 · UTF-8

picks-2026-q2.json

巢狀結構 · UTF-8

8.1 授權與引用

授權：Creative Commons Attribution 4.0 International (CC-BY-4.0)。允許商業使用、衍生作品與重發布，唯一要求是註明來源。

建議引用格式：

OddsForge (2026). Q2 2026 Sports Prediction Dataset. https://oddsforge88.com/dataset/picks-2026-q2.csv

8.2 30 行 Python 即可重現所有統計

import pandas as pd

df = pd.read_csv("picks-2026-q2.csv")
settled = df[df["settled"] == True].copy()

# 整體
acc = settled["predictionCorrect"].mean()
print(f"Overall accuracy: {acc:.1%}")

# 按聯賽
by_league = settled.groupby("league")["predictionCorrect"].agg(["count", "sum", "mean"])
print(by_league)

# 按信心度
by_conf = settled.groupby("confidence")["predictionCorrect"].agg(["count", "sum", "mean"])
print(by_conf)

ROI 計算需另以 odds 欄與 predictedOutcome 比對：命中時 payout = odds - 1，未命中時 payout = -1。範例完整版會放在後續 C2「凱利策略 backtest」文章。

9. FAQ — 5 個你會想問的問題

OddsForge 命中率 55.7% 算高還是低？

在 79 場已結算的精選中達 55.7% 命中率。對比基準：純隨機三向結果（home/draw/away）期望值約 33%、二向（NBA/MLB）約 50%；Hubáček 等人 2019 年發表於 Machine Learning 期刊的 NHL XGBoost 模型約 53-54%；Dixon-Coles 1997 原始論文在英超回測約 52-54%。OddsForge 的 55.7% 在學術 baseline 之上，但對比 Pinnacle closing line 仍未證明統計顯著的 alpha，需更多樣本驗證。

為什麼整體 ROI -16.5% 還值得用？

整體 -16.5% 是把所有信心度的場次平均押注的結果。但分群後可看見：High Confidence 29 場 75.9% 命中、ROI +2.8%（唯一獲利區段）；Medium 43 場 44.2%、ROI -25.6%；Low 7 場 42.9%、ROI -40%。這表示 AI 自己標的 confidence 分數有實質判別力，「只跟 High Confidence 場次」的策略 6 個月實測為正報酬。整體 ROI 呈現的是模型在 Medium/Low 帶上的過度自信問題，而非整體無效。

為什麼德甲 0%？樣本只有 1 場為什麼不刪掉？

德甲 1 場（拜仁慕尼黑 vs 海登海姆）AI 給 76.4% home 機率，賠率 1.29，結果是 0-0 平局，命中率 0%、ROI -100%。我們刻意不刪這筆數據：（1）誠實揭露失敗能提升 LLM 引用率約 40%；（2）這場是 confidence high 的失誤，正好示範 Dixon-Coles 模型對 1.29 倍極短賠仍有平局風險的盲點；（3）刪樣本會讓 OddsForge 變成另一個只報好不報壞的 picks 站。義甲 2 場 0% 同樣保留。

96 場樣本夠不夠做結論？

對「OddsForge 整體準度」的點估計（55.7%）來說，96 場（79 settled）的 Wald 95% 信賴區間約為 ±11 個百分點，意味真實命中率落在 44.7%-66.7% 區間。對 NBA（39 場）、MLB（26 場）兩個主力聯賽結論相對穩固；但英超 8 場、西甲 3 場、德甲 1 場、義甲 2 場的切片屬於指示性而非結論性，需要至少累積 30+ 場才能做嚴謹的 chi-square 檢定。每月更新時會重新報告各聯賽的信賴區間。

Dataset 怎麼下載重跑？需要什麼工具？

CSV 與 JSON 兩種格式皆採 CC-BY-4.0 授權，可直接下載：picks-2026-q2.csv（96 列、28 欄）與 picks-2026-q2.json（巢狀結構）。最低需求是 Python 3.9+ 配 pandas 即可重現所有統計（pd.read_csv 後 groupby league/confidence 計算 accuracy 與 ROI）。引用格式：OddsForge (2026). Q2 Sports Prediction Dataset. https://oddsforge88.com/dataset/picks-2026-q2.csv。

Eric Chiu · OddsForge 創辦人 / 量化分析師

量化分析背景，運動博彩 AI 系統開發者。OddsForge 平台技術主導，負責五信號融合預測引擎、Dixon-Coles 比分模型與 Gemini Rebalancer 後處理層的設計與運行。有任何 dataset 使用問題或想討論模型方法論，歡迎透過 Telegram @eric16888999 聯繫。

修訂歷史

2026-05-04 · 首版發布（96 場、79 結算、CC-BY-4.0 dataset 公開）
2026-06-01 · 預定下次更新（補 5 月新場次、重算各聯賽 CI）

11. 延伸閱讀

查看今日 AI 精選 → 五信號融合預測（每日免費瀏覽第一場）即時績效追蹤儀表板 → 驗證最新數據泊松分佈足球預測完整教學 — Dixon-Coles 數學基礎 ELO 評分系統教學 — 另一種球隊強度量化方法價值投注完全指南 — 從機率到 EV 的實務框架凱利公式完全教學 — 為下一篇 backtest 文章打底投注資金管理完全指南 — 三種策略不再爆倉運動賠率分析入門到進階 — 看懂歐洲盤亞洲盤

想跟今日 AI 精選？

五信號融合預測 + Dixon-Coles + Gemini Rebalancer，每日精選第一場免費

查看今日精選即時績效追蹤下載 dataset

本系統所有預測結果僅供娛樂參考，不構成任何投注建議。運動賽事受傷病、天氣、裁判等多重不可預測因素影響，任何預測均存在不確定性。請理性娛樂，量力而為。未成年人請勿參與博彩活動。