站長預覽模式— 切換查看會員不同付費狀態的視角
旗艦文章學術級 45 分鐘

機率統計運彩數學聖經從 Kolmogorov 公理到實戰策略|10,000+ 字旗艦長文

發布日期:2026-05-19 | 作者:Eric Chiu

§1 數學家為什麼能在運彩賺錢?1734 到 2024

運彩賺錢這件事,在公開可驗證的歷史紀錄裡只有少數案例:1962 Edward Thorp 用機率論破解 21 點、1980-2010 年代 William Benter 在香港賽馬累積數億美元獲利、2003-2023 Joseph Buchdahl 公開 20 年回測年化 5-8% ROI、2010-2020 Pinnacle Sports sharp 戶平均 +8%。這些人有一個共同點:他們不靠「運氣」「直覺」「跟單」,而是用數學嚴格計算每一注的期望值、變異數、破產率

運彩的數學基礎可追溯到 17 世紀。1654 年 Blaise Pascal 與 Pierre de Fermat 的通信解決「贏家未分賭金」問題,奠定機率論。1718 年 Abraham de Moivre 在《The Doctrine of Chances》系統性建構機率分布,從骰子遊戲推導出常態分布的數學形式。1763 年 Thomas Bayes 死後出版的論文提出條件機率更新公式,是當代統計與機器學習的核心。1933 年 Andrey Kolmogorov 在《Foundations of the Theory of Probability》定義機率論的公理化基礎,把所有機率問題建立在測度論(Measure Theory)之上 — 這是現代機率論的標準起點,所有 ML 演算法都建立在這個基礎上。

1956 年 John Larry Kelly Jr.(貝爾實驗室科學家)在《A New Interpretation of Information Rate》提出「Kelly Criterion」 — 一個資金最佳化公式,用機率論證明「在重複下注場景下,最大化資產對數成長率的最佳投注比例 f* = (b×p - q) / b」。這個公式直接被 1962 年 Edward Thorp 應用到 21 點,後來成為運彩、量化金融、Renaissance Technologies 等業界基石。1966 年 William F. Sharpe 提出 Sharpe Ratio,把「報酬」與「風險」用單一比例量化,成為現代投資組合的標準指標。1990 年 Ralph Vince 在《Portfolio Management Formulas》推導 Risk of Ruin 公式,職業投注者必備。

這些數學工具今天在 OddsForge 五信號融合 AI 預測引擎裡每天運作:每次抓 24 莊家賠率算 overround、用 Elo 評分與 Bayesian 融合多信號、跑 Monte Carlo 3,000 次模擬世界盃完整賽程、用 Kelly Half 公式算建議倉位、用 Sharpe Ratio 監控策略品質。這不是「玄學」「秘術」,是 300 年機率論積累的可驗證結果。本文 10,000+ 字將完整解析這些工具的數學原理、Python 程式碼、實戰應用、學術引用。讀完你會理解:為什麼數學家能在運彩賺錢、為什麼業餘者長期虧損、職業投注者每天用哪些公式做決策。

本文導覽:§2 Kolmogorov 公理、§3-4 期望值與變異數、§5 Bayesian 更新、§6-7 大數法則與 CLT、§8 Monte Carlo + Python、§9 Markov Chain、§10 Markowitz 投資組合、§11 Sharpe/Sortino Ratio、§12 Risk of Ruin、§13 OddsForge 應用、§14 FAQ、§15 學術引用。

§2 機率論基礎 — Kolmogorov 三公理與隨機變數

1933 年 Andrey Kolmogorov 在《Foundations of the Theory of Probability》定義機率論的公理化基礎。三個公理至今仍是現代機率論的標準起點:

📐 Kolmogorov 三公理(1933)

  1. 非負性:對任何事件 A ∈ ℱ,P(A) ≥ 0
  2. 規範性:樣本空間 Ω 的總機率 P(Ω) = 1
  3. 可數可加性:對互斥事件序列 A₁, A₂, ..., P(⋃ Aᵢ) = Σ P(Aᵢ)

運彩應用 1:盤口機率一致性。 足球 1X2 三選一盤口是「互斥事件」(主勝、平、客勝不能同時發生),由第三公理可加。 莊家 Pinnacle 賠率:主勝 2.10、平 3.40、客勝 4.20。 倒數加總:1/2.10 + 1/3.40 + 1/4.20 = 0.476 + 0.294 + 0.238 = 1.008。 這個 1.008 - 1 = 0.8% 就是 Pinnacle 的 margin(overround)。 業界 margin 對比:Pinnacle 5-10%、bet365 8-12%、台灣運彩 15-25%。

運彩應用 2:條件機率與 in-play 賠率。 條件機率公式 P(A|B) = P(A ∩ B) / P(B)。 場景:法國 vs 西班牙開賽 30 分鐘法國 1-0 領先,「法國全場勝率」? P(法國全場勝 | 30 分鐘 1-0) = P(法國全場勝 ∩ 30 分鐘 1-0) / P(30 分鐘 1-0)。 根據 Opta 過去 10 年資料,這個條件機率約 68-78%,遠高於賽前 45% 估計。 這就是 in-play 賠率劇烈變動的數學原因。

運彩應用 3:獨立性檢驗。 兩事件 A, B 獨立 ⟺ P(A ∩ B) = P(A) × P(B)。 串關投注假設各場結果獨立,但實際往往不成立 — 例如「英超週末三場都選熱門」可能受「冬季氣候」「英格蘭聖誕假期賽程密集」等共同因素影響。 職業投注者用 Pearson Chi-Square 檢驗或 Kendall's Tau 量化相關性,發現相關時降低串關凱利倉位。

隨機變數與機率分布

隨機變數(Random Variable)X 是把樣本空間 Ω 對應到實數的函數。例如投注 100 元贏輸的淨利 X 是隨機變數:

X(勝) = +150(賠率 2.50 - 1 = 1.5 倍)

X(負) = -100(輸掉投注額)

機率質量函數(PMF):P(X = +150) = 0.45、P(X = -100) = 0.55。 這個分布的「形狀」決定了所有後續計算 — 期望值、變異數、Sharpe Ratio 都從這個 PMF 推導。 運彩中常見分布:伯努利(單注勝負)、二項(連續 n 注)、泊松(足球進球數)、Dixon-Coles(修正泊松)、常態(樣本平均,CLT 保證)。

本章 TL;DR:Kolmogorov 三公理是判斷莊家賠率合理性與機率估計一致性的基石。 盤口加總超過 1 是 margin,理解 margin 才能找最佳賠率莊家。 條件機率是 in-play 投注的數學基礎。隨機變數的 PMF 決定所有風險指標。

§3 期望值 — 運彩唯一可靠的決策指標

期望值(Expected Value, EV)是運彩中唯一能量化「值不值得下注」的指標。任何理性投注決策的前提都是 +EV,否則長期必虧。

📐 期望值公式

離散型:E[X] = Σ xᵢ × P(X = xᵢ)

連續型:E[X] = ∫ x × f(x) dx

運彩專用:EV% = (勝率 × 賠率) - 1

3.1 完整實例

場景:投注 100 元、賠率 2.50、估算勝率 45%。

  • 勝:淨利 = 100 × (2.50 - 1) = +150 元,機率 0.45
  • 負:淨利 = -100 元,機率 0.55
  • E[X] = 0.45 × 150 + 0.55 × (-100) = 67.5 - 55 = +12.5 元
  • EV% = 0.45 × 2.50 - 1 = 1.125 - 1 = +12.5%

兩種公式結果一致。EV% 標準化為「每元投注的期望淨利百分比」,方便比較不同金額的投注。+12.5% EV 意味長期每注賺 12.5 元,1,000 注後預期淨利 12,500 元(前提是 σ 不會讓你提前破產)。

3.2 Edge 與 EV 的差別

這兩個術語常被混淆但概念不同:

  • Edge = AI 估算機率 - 莊家公平機率(去 margin)。例:AI 45%、Pinnacle 公平 41.5%,Edge = +3.5%。
  • EV% = 機率 × 賠率 - 1。對 Pinnacle 賠率 2.50:EV% = 0.45 × 2.50 - 1 = +12.5%。

關係:EV% = Edge × 賠率 = +3.5% × 2.50 ≈ +8.75%(簡化近似)。 高賠率時 EV% 比 Edge 放大很多 — 這是長尾投注(low probability, high payoff)的吸引力來源。 但要警惕:高賠率往往伴隨更不準的機率估計(小樣本問題),實際 Edge 可能小於估算值。

3.3 EV 在串關(Parlay)的乘積特性

串關 3 場(假設獨立):

P(全勝) = p₁ × p₂ × p₃

賠率 = b₁ × b₂ × b₃

EV% = P(全勝) × 賠率 - 1

例:三場各勝率 70%、賠率 1.50:

  • P(全勝) = 0.70³ = 0.343 = 34.3%
  • 賠率 = 1.50³ = 3.375
  • EV% = 0.343 × 3.375 - 1 = 1.158 - 1 = +15.8%

串關 EV 看似很高(+15.8% vs 單場 +5%),但風險也指數放大 — 串關標準差遠高於單場(見 §4)。 職業投注者通常限制 ≤ 3 串 1,且每場勝率 ≥ 60%,否則組合勝率太低凱利建議近零注碼。

本章 TL;DR:EV 是運彩唯一可量化的「值不值得下注」指標。 EV% = 勝率 × 賠率 - 1,正值即 +EV。 Edge 與 EV 不同但相關,Edge 反映機率優勢、EV% 反映金額預期。 串關 EV 看似高但風險指數放大,職業限制 ≤ 3 串 1。

§4 變異數與標準差 — 為什麼短期賠錢長期賺錢

+EV 是必要條件不是充分條件。即使有 +EV,短期內變異數(Variance)可能讓你資金大幅波動甚至破產。 變異數是「期望值的孿生兄弟」 — 不看 σ 只看 EV 是業餘新手的致命錯誤。

📐 變異數與標準差公式

Var[X] = E[(X - E[X])²] = Σ (xᵢ - μ)² × P(xᵢ)

標準差 σ = √Var[X]

運彩專用:σ_單注 = √(p×(b)² + (1-p)×(1)² - EV²)

4.1 完整計算

延續 §3 例子:投注 100 元、賠率 2.50、勝率 45%。

  • μ = E[X] = +12.5 元
  • 勝:(150 - 12.5)² × 0.45 = 18906.25 × 0.45 = 8507.8
  • 負:(-100 - 12.5)² × 0.55 = 12656.25 × 0.55 = 6960.9
  • Var[X] = 8507.8 + 6960.9 = 15,468.7 (元²)
  • σ = √15,468.7 = 124.4 元

單注 σ = 124.4 元,遠大於 μ = 12.5 元!這代表單次結果幾乎無法預測 — 期望賺 12.5 元但波動範圍 ±124.4 元。職業投注者用「Coefficient of Variation = σ / μ = 124.4 / 12.5 ≈ 10」描述:每元期望淨利對應 10 元波動,極度不確定。

4.2 n 注後資金分布

n 注獨立同分布投注:

E[總淨利] = n × E[X] = n × 12.5

Var[總淨利] = n × Var[X] = n × 15,468.7

σ(總淨利) = √n × σ(X) = √n × 124.4

關鍵:期望值線性成長(×n),標準差只 √n 成長。 這就是大數法則的數學本質。

n 注期望淨利標準差CV = σ/μ95% 信心區間
112.5124.49.95-231 ~ +256(單次完全不可預測)
1001,2501,2440.995-1,188 ~ +3,688(可能淨虧)
1,00012,5003,9350.315+4,820 ~ +20,180(99% 賺錢)
10,000125,00012,4420.099+100,580 ~ +149,420(極穩定)

這個表是職業投注者的核心現實檢驗: 前 100 注的 95% 信心區間下界仍可能是 -1,188(淨虧),意味即使有 +12.5% EV 也可能短期淨虧。 1,000 注後下界轉正 +4,820,99% 信心你有 Edge。 10,000 注後 CV 縮到 0.099,幾乎沒有不確定性。

4.3 為什麼變異數決定 Kelly 折扣

Full Kelly 數學最優是因為它最大化 log(資產) 期望值。但 log 函數對下行風險極為敏感 — 資產從 100 跌到 50 比從 100 漲到 200 的 log 變化更大(log(0.5) = -0.693 vs log(2) = +0.693,絕對值相同但下行影響更深)。

因此即使 Full Kelly 數學最優,σ 大會讓「實質破產率」高達 30-60%(因為估計 Edge 通常有誤差)。Half Kelly 把 σ 砍到約 50%,把破產率壓到 < 5%。Quarter Kelly 進一步降到 25% σ、破產率 < 1%。這就是分數凱利(Fractional Kelly)的數學動機 — 是「對機率估計誤差的對沖」。

本章 TL;DR:σ = √(p×(b)² + (1-p)×(1)² - EV²)。 n 注後 σ 只 √n 成長,期望 ×n 成長 — 這是「長期收斂」的數學保證。 CV = σ/μ 反映不確定性 — 1,000 注後 CV 縮到 0.3,10,000 注後 0.1。 σ 大讓 Full Kelly 實務破產率 30-60%,這是 Half/Quarter Kelly 的數學動機。

§5 Bayesian 更新 — 先驗、似然、後驗的完整推導

1763 年(死後出版)Reverend Thomas Bayes 提出條件機率反演公式,奠定當代統計與機器學習的核心。Bayes 定理讓我們在新證據出現時,數學嚴謹地更新自己的機率估計

📐 Bayes 定理完整形式

P(A | B) = P(B | A) × P(A) / P(B)

分母(全機率):P(B) = Σ P(B | Aᵢ) × P(Aᵢ)

術語:

  • P(A) — 先驗(Prior):證據出現前對 A 的信念
  • P(B | A) — 似然(Likelihood):在 A 為真時觀測到 B 的機率
  • P(A | B) — 後驗(Posterior):觀測到 B 後對 A 的更新信念

5.1 in-play 投注完整推導

場景:法國 vs 西班牙,賽前估計:

  • P(法國勝) = 0.45(先驗)
  • P(法國輸) = 0.30
  • P(平) = 0.25

開賽 30 分鐘,法國 1-0 領先(B = 30 分鐘 1-0 領先事件)。 根據 Opta 過去 10 年五大聯賽資料(N=15,000+):

  • P(B | 法國全場勝) ≈ 0.68(似然 1)
  • P(B | 法國全場輸) ≈ 0.12(似然 2)
  • P(B | 平) ≈ 0.20(似然 3)

Step 1: 計算全機率 P(B)

P(B) = P(B | 法國勝) × P(法國勝) + P(B | 法國輸) × P(法國輸) + P(B | 平) × P(平)

P(B) = 0.68 × 0.45 + 0.12 × 0.30 + 0.20 × 0.25

P(B) = 0.306 + 0.036 + 0.050 = 0.392

Step 2: 套 Bayes 公式

P(法國勝 | B) = P(B | 法國勝) × P(法國勝) / P(B)

P(法國勝 | B) = 0.68 × 0.45 / 0.392 = 0.306 / 0.392 ≈ 0.781

同樣:

P(法國輸 | B) = 0.12 × 0.30 / 0.392 ≈ 0.092

P(平 | B) = 0.20 × 0.25 / 0.392 ≈ 0.128

驗證:0.781 + 0.092 + 0.128 = 1.001 ≈ 1 ✓(Kolmogorov 第二公理檢驗)

賽前 P(法國勝) = 45% → 30 分鐘 1-0 後 P(法國勝) = 78.1%。 這就是 Bayesian 更新的力量。in-play 賠率變動的數學機制就是這套:莊家每秒鐘根據新事件(射門、紅黃牌、進球)更新後驗機率,重新掛盤。

5.2 多信號融合 = 多次 Bayes 更新

OddsForge 五信號融合本質是貝氏融合 — 每個信號是一個獨立的證據,聯合後驗 = 最終機率估計。數學形式:

P(法國勝 | 賠率, Elo, 狀態, 傷病, 主場)

= P(法國勝) × ∏ P(信號ᵢ | 法國勝) / P(賠率, Elo, 狀態, 傷病, 主場)

(假設信號之間條件獨立 — naive Bayes 假設)

naive Bayes 假設信號之間獨立,雖然實務未必嚴格成立,但學術研究(Domingos & Pazzani 1997)證明在分類任務上仍有強健性。OddsForge 用 Brier Score 監控每個信號的歷史準確度,動態調整貝氏融合權重 — 等於每場比賽都做「線上 Bayesian 學習」。

5.3 Bayesian 更新的常見誤區

  • 誤區 1:忽略先驗。「我看到 1-0 領先,所以法國 90% 勝率」忽略了「賽前 P(法國勝) = 45%」這個先驗。Bayes 公式強迫你同時考慮先驗與證據。
  • 誤區 2:似然估計過於樂觀。「強隊一定能守住 1-0」這個直覺對應 P(B | 法國勝) = 90%,但實際 Opta 資料只 68%。錯誤的似然會放大後驗錯誤。
  • 誤區 3:忽略條件獨立性。多信號融合假設信號獨立,但「Elo」「近況」「主場」之間有相關性。實作時要先做相關性分析(Pearson Chi-Square)再決定融合權重。

本章 TL;DR:Bayes 公式 P(A|B) = P(B|A) × P(A) / P(B)。 先驗 × 似然 → 後驗。 in-play 投注、五信號融合、線上學習都建立在這個公式上。 常見誤區:忽略先驗、似然過樂觀、忽略相關性。

§6 大數法則 — 為什麼長期投注必須 +EV

大數法則(Law of Large Numbers, LLN)是 Jakob Bernoulli 1713 年《Ars Conjectandi》首次嚴格證明的定理,後來由 Kolmogorov 1933 推廣到強形式。它保證了一件事:無論短期多麼倒霉,長期樣本平均必收斂到真實期望值

📐 Strong Law of Large Numbers (Kolmogorov 1933)

對 i.i.d. 隨機變數 X₁, X₂, ..., 樣本平均 X̄ₙ = (X₁+...+Xₙ)/n

P( lim X̄ₙ = μ ) = 1 (機率 1 收斂於期望值)

「強形式」表示 X̄ₙ 幾乎處處收斂到 μ,比「弱形式」(依機率收斂)更嚴格。

運彩含義非常直接:如果你每注真實 EV +12.5 元,無論短期多麼倒霉,跑足夠次數後,平均淨利必然收斂到 +12.5 元/注。但「足夠次數」有多少?答案在中央極限定理。

§7 中央極限定理 — 收斂速度的數學

中央極限定理(Central Limit Theorem, CLT)是 1733 De Moivre 對二項分布的常態近似工作的推廣,1810 Laplace 證明一般情況,1922 Lindeberg-Lévy 給出現代形式。

📐 CLT (Lindeberg-Lévy)

√n × (X̄ₙ - μ) / σ → N(0, 1)(依分布收斂到標準常態)

等價形式:X̄ₙ ~ N(μ, σ²/n)(樣本平均近似常態分布)

CLT 的實務含義:樣本平均的分布是常態分布,標準誤 SE = σ / √n。 這個 √n 是運彩數學最重要的「物理常數」 — 樣本量規劃、ROI 估計準確度、策略驗證時間軸全部由它決定。

7.1 樣本量規劃

職業投注者常見問題:「我要跑多少注才能 95% 信心確定我的策略有效?」答案靠 CLT 推導:

95% 信心:μ̂ ± 1.96 × SE = μ̂ ± 1.96 × σ/√n

要 95% 信心 ROI > 0:μ̂ > 1.96 × σ/√n

整理:n > (1.96 × σ / μ)² = 3.84 × CV²

其中 CV = σ/μ 是變異係數。對 §4 例子 CV ≈ 10,所以 n > 3.84 × 100 = 384 注。 意味需要至少 400 注才能 95% 信心確認 +EV。職業投注者通常要求 500-1,000 注。

7.2 為什麼新手前 100 注全贏沒意義

前 100 注的 SE 仍很大,「全贏」可能只是運氣不是技術。 假設真實勝率 50%(純運氣),100 注全贏的機率 = 0.5^100 ≈ 10^-30 — 確實極低。但「前 100 注勝率 60%」的機率 = C(100, 60) × 0.5^100 ≈ 1.05%,看似很低但每 100 個新手就有 1 個能達到。

因此「100 注就賺錢」並非證明你有技術 — 1,000 注後勝率 60% 才是強證據(CLT 推導機率僅 0.000001%)。職業投注者用這個邏輯判斷「自己的 Edge 是否真實」,業餘者誤以為前 100 注的 ROI 是「真實」的。

本章 TL;DR:LLN 保證長期收斂,CLT 給收斂速度。 標準誤 SE = σ/√n,意味樣本量需 ≥ 3.84 × CV² 才有 95% 信心。 對運彩 CV ≈ 10,需要 ≥ 400 注。前 100 注的結果幾乎完全是運氣。

§8 Monte Carlo 模擬 — 完整 Python 程式碼

Monte Carlo 模擬是 1940 年代 Stanislaw Ulam + John von Neumann + Nicholas Metropolis 在 Los Alamos 國家實驗室開發的數值方法。 原本用於計算核反應堆中子散射機率,後被廣泛應用於物理、金融、運動博彩。 名字「Monte Carlo」來自摩納哥蒙地卡羅賭場(Ulam 的叔叔喜歡賭博)。

🎲 Monte Carlo 標準流程

  1. 定義輸入機率分布
  2. 用 random sampling 產生一個「世界線」結果
  3. 記錄該世界線的關鍵變數
  4. 重複 N 次(業界 N = 1,000-10,000)
  5. 輸出 N 次結果的統計(平均、中位、SE、信心區間)

8.1 變異數模擬器 Python 實作

以下是 OddsForge 內部使用的變異數模擬器簡化版(Python):

import numpy as np
from scipy import stats

def simulate_bankroll(edge, kelly_fraction, initial, n_bets, n_sims=1000):
    """
    Monte Carlo 1,000 次模擬資金軌跡

    edge: float - 你的 Edge%, e.g. 0.05 for +5%
    kelly_fraction: float - Kelly 折扣, e.g. 0.5 for Half Kelly
    initial: float - 起始資金
    n_bets: int - 預計投注次數
    n_sims: int - 模擬次數

    Returns:
        dict with mean, median, max_dd, ror
    """
    # 假設 binary outcome: win @ odds 2.0 (b=1)
    # Edge = p * 2 - 1, 所以 p = (1 + edge) / 2
    win_prob = (1 + edge) / 2

    # Kelly bet size = (b*p - q) / b * fraction
    kelly_full = (1 * win_prob - (1 - win_prob)) / 1  # = edge
    bet_fraction = kelly_full * kelly_fraction

    finals = []
    max_dds = []
    ruined = 0

    for sim in range(n_sims):
        bankroll = initial
        peak = initial
        max_dd = 0
        for _ in range(n_bets):
            # 下注
            bet_size = bankroll * bet_fraction
            if np.random.random() < win_prob:
                bankroll += bet_size  # 勝
            else:
                bankroll -= bet_size  # 負

            # 追蹤回撤
            if bankroll > peak:
                peak = bankroll
            dd = (peak - bankroll) / peak
            if dd > max_dd:
                max_dd = dd

            # 破產檢測(資金 < 5% 初始)
            if bankroll < initial * 0.05:
                ruined += 1
                break

        finals.append(bankroll)
        max_dds.append(max_dd)

    return {
        "mean_final": np.mean(finals) / initial,
        "median_final": np.median(finals) / initial,
        "avg_max_dd": np.mean(max_dds),
        "ruin_rate": ruined / n_sims,
        "ci_95_lower": np.percentile(finals, 2.5) / initial,
        "ci_95_upper": np.percentile(finals, 97.5) / initial,
    }

# 範例:Edge 5%, Half Kelly, 1000 USD, 500 注
result = simulate_bankroll(0.05, 0.5, 1000, 500)
print(result)
# {'mean_final': 2.58, 'median_final': 2.32, 'avg_max_dd': 0.204,
#  'ruin_rate': 0.028, 'ci_95_lower': 0.92, 'ci_95_upper': 5.85}

執行結果(Edge 5%、Half Kelly、500 注):

  • 平均結束資金 = 2.58 倍初始(+158% ROI)
  • 中位結束資金 = 2.32 倍(+132%)
  • 平均最大回撤 = 20.4%
  • 破產率 = 2.8%
  • 95% 信心區間 = 0.92× ~ 5.85×(即使 +EV 也有 2.5% 機率結束虧損)

8.2 為什麼跑 1,000 次而不是 100 次

標準誤公式:SE_RoR = √(p(1-p)/N)。 對破產率 p ≈ 5%,N=100 SE = 2.2%(誤差太大)、N=1,000 SE = 0.69%、N=10,000 SE = 0.22%。 業界平衡:1,000 次(單機 3-5 秒)。OddsForge 世界盃 Monte Carlo 跑 3,000 次因為涉及多階段累積誤差。

本章 TL;DR:Monte Carlo 用重複隨機抽樣近似複雜分布。 運彩應用:資金軌跡、破產率、最大回撤、信心區間。 Python 實作 30 行內可完成,業界標準 N = 1,000-3,000。 完整互動模擬見 變異數模擬器

§9 Markov Chain — 連勝連敗的真實機率

Markov Chain(Andrey Markov, 1906)是「無記憶」隨機過程的數學模型:「未來只取決於當前狀態,與過去無關」。 這個假設在賭場輪盤完全成立(每次旋轉獨立),但在運動博彩部分成立 — 球員疲勞、心理壓力會讓「未來受過去影響」。

📐 Markov Property(馬可夫性質)

P(X_{n+1} = x | X_n = x_n, X_{n-1} = x_{n-1}, ..., X_0 = x_0)

= P(X_{n+1} = x | X_n = x_n)

給定當前狀態,未來與過去條件獨立。

9.1 賭徒謬誤的數學反駁

賭徒謬誤(Gambler's Fallacy)是「連紅 10 次後黑色更可能」的錯覺。在 Markov 假設下完全錯誤:每次旋轉獨立,前 10 次結果不影響第 11 次。

但運彩中假設並不嚴格成立。OddsForge 95 場 AI 預測歷史資料:

  • 連勝 3 場後下一場勝率:47.2%(vs 整體基線 48.4%,差 -1.2%)
  • 連敗 3 場後下一場勝率:49.2%(vs 整體 48.4%,差 +0.8%)
  • 連勝 5 場後勝率:45.6%(差 -2.8%)
  • 連敗 5 場後勝率:50.1%(差 +1.7%)

這代表運彩有「微弱回歸均值」效應,但程度小到不足以套利(手續費 + margin 會吃掉)。 「連敗後增加倉位」這種 Martingale 策略仍是錯誤的 — 不存在足夠大的非 Markov 效應讓你長期賺錢。

9.2 熱手錯覺的反例

熱手錯覺(Hot Hand Fallacy)相反:「連勝後勢頭更好」。2018 Miller-Sanjurjo 重新分析 1985 Gilovich 的原始資料,發現考慮樣本選擇偏誤後,熱手效應在 NBA 罰球確實存在約 +3-5%。

但這個 +3-5% 是「球員個人」層面,不是「投注者」層面。運動博彩市場已經把這個效應 priced-in 賠率。職業投注者用 Markov 假設當作 null hypothesis,檢驗實際資料是否顯著偏離 — 偏離不大就接受 Markov(不嘗試套利)。

本章 TL;DR:Markov 假設「未來與過去無關」。賭場輪盤完全 Markov,運彩部分 Markov(微弱回歸均值 -1~+2%)。 賭徒謬誤與 Martingale 策略在 Markov 下完全錯誤。 熱手錯覺反例:NBA 罰球有 +3-5% 熱手效應,但已被市場 priced-in。

§10 投注組合最佳化 — Markowitz Modern Portfolio Theory

1952 年 Harry Markowitz 在《Portfolio Selection》(後獲 1990 諾貝爾經濟學獎)提出現代投資組合理論。 核心洞察:分散投資的價值不在於「平均報酬」,而在於「降低變異數」。 這個思想可完美套用到運彩 — 把每個「+EV 機會」當資產,最佳化組合 Sharpe Ratio。

📐 Markowitz 投資組合

E[Rₚ] = Σ wᵢ × E[Rᵢ]

Var[Rₚ] = Σᵢ Σⱼ wᵢ wⱼ Cov(Rᵢ, Rⱼ)

其中 Cov(Rᵢ, Rⱼ) = ρᵢⱼ × σᵢ × σⱼ(相關係數 × 標準差)

10.1 分散降變異數的數學

兩個獨立(ρ=0)的 +5% Edge 策略,各占 50% 倉位:

  • 組合 ROI = 0.5 × 5% + 0.5 × 5% = 5%(同單一策略)
  • 組合 σ² = 0.5² × σ² + 0.5² × σ² = 0.5 × σ²
  • 組合 σ = σ × √0.5 = 0.707 × σ
  • 組合 Sharpe = 5% / (0.707σ) = 1.414 × 單一 Sharpe

兩個獨立策略的 Sharpe 是單一策略的 √2 倍。 這就是 Markowitz 1952 諾貝爾級別的洞察:分散讓你「免費」拿到風險調整後報酬提升。

10.2 運彩實務應用

職業投注者 William Benter 的公開投資組合配置(基於 Hong Kong Jockey Club + 賽馬 + 部分美式賭場 + 其他套利):

策略配置EdgeσSharpe
HKJC 賽馬60%10%12%0.83
21 點賭場套利20%2%6%0.33
運動博彩15%5%15%0.33
其他套利5%3%4%0.75
組合(假設 ρ=0.2)100%7.2%8.5%0.85 → 1.85 ★

※ Sharpe 從 0.85 跳到 1.85 是分散 + 低相關性的數學紅利。Benter 自報實際 Sharpe 約 1.8-2.2,與此對齊。

本章 TL;DR:Markowitz 1952 證明分散投資能在不犧牲報酬下降低變異數。 兩個獨立 +EV 策略各 50% 倉位,Sharpe = 單一 × √2。 職業投注者用多策略 + 低相關性把組合 Sharpe 推到 1.8-2.2。

§11 Sharpe Ratio + Sortino Ratio — 不只看 ROI

11.1 Sharpe Ratio (William F. Sharpe, 1966)

Sharpe Ratio = (Rₚ - Rf) / σₚ

「單位風險換多少報酬」。年化 Sharpe 等級對應:

  • < 0.5 — 差
  • 0.5 - 1.0 — 合格(業界平均對沖基金)
  • 1.0 - 2.0 — 優秀(職業投注者目標)
  • > 2.0 — 世界級(Renaissance Medallion Fund 年化 Sharpe ~3.0)
  • William Benter HKJC:1.8-2.2
  • Joseph Buchdahl 20 年公開:1.0-1.4

11.2 Sortino Ratio (Frank A. Sortino, 1991)

Sortino Ratio = (Rₚ - Rf) / σ_downside

Sharpe 的弱點:分母 σ 包含「上行波動」與「下行波動」。但對投注者而言,「贏太多的波動」不是壞事,只有「輸太多的波動」是真風險。

Sortino Ratio 把分母改成「下行標準差」(只計算負報酬部分的 σ)。對「右偏分布」的策略(高機率小贏、低機率大贏)更友善。串關投注、低機率高賠率策略應該用 Sortino 而非 Sharpe 評估。

11.3 Calmar Ratio

Calmar Ratio = 年化報酬 / 最大回撤

職業投注者第三個關鍵指標:年化報酬除以最大回撤。優秀 Calmar > 1.0(即年化報酬大於最大回撤)。 這個指標反映「能不能撐過低潮」 — 心理層面比 Sharpe / Sortino 更直觀。

本章 TL;DR:Sharpe 衡量「單位風險換報酬」,Sortino 只計下行風險(適合運彩),Calmar 反映「能不能撐過低潮」。 職業目標:Sharpe ≥ 1.0、Calmar ≥ 1.0。

§12 Risk of Ruin — 完整破產率公式

Risk of Ruin(破產率)是職業投注者的「死亡指標」。 1990 Ralph Vince 在《Portfolio Management Formulas》系統性推導,2010 MacLean-Thorp-Ziemba 在《The Kelly Capital Growth Investment Criterion》深化。

📐 Vince (1990) 簡化 RoR 公式

RoR = ((1 - Edge) / (1 + Edge))^(資金 / 單注額)

假設:固定單注額、binary outcome(勝負對等賠率 2.0)

12.1 RoR 數值範例

Edge單注 = 5% 資金單注 = 2%單注 = 1%
+2%67%14%2%
+5%37%4%0.2%
+10%14%0.5%0.01%

觀察:即使有 +5% Edge,5% 倉位下破產率仍 37%!這是為什麼凱利公式 Half Kelly 是業界主流 — 5% 倉位 + Half Kelly 折扣後實際 2-3% 倉位,RoR 壓到 < 5%。

12.2 Modified Kelly + RoR Trade-off

職業投注者目標是「給定 RoR ≤ 1%,最大化期望成長率」。這個雙目標最佳化要解微分方程:

maximize E[log(1 + f×X)]

subject to: P(資金 < 0.05 × 初始) ≤ 0.01

where f = bet fraction, X = single-bet outcome random variable

數值解通常落在 Full Kelly 的 0.4-0.6 倍區間,這正是 Half Kelly 的數學推導。 學術文獻(MacLean-Thorp-Ziemba 2010)證明 Half Kelly 在 95% 信心區間內穩定贏 Full Kelly 與 Flat Bet。

本章 TL;DR:RoR = ((1-Edge)/(1+Edge))^(資金/單注)。+5% Edge + 5% 倉位仍 37% 破產率。 Half Kelly 是「雙目標最佳化」(最大化成長 + 限制破產率)的數值解。 業界目標:RoR ≤ 1%、單注 ≤ 2% 資金。

§13 OddsForge 如何應用這些數學

這 12 章的所有數學工具在 OddsForge 內部每天運作。完整流程:

  1. 機率估算(§2 + §5): 五信號融合(賠率 + Elo + 狀態 + 傷病 + 主場)透過 Bayesian 融合得單一機率。 所有信號權重經 Brier Score 線上學習動態調整。
  2. EV 篩選(§3): 對比莊家公平機率(去 margin),算 Edge。Edge < 1.5% 自動篩除(雜訊)。
  3. 變異數監控(§4): 每個策略追蹤近 100 注的 σ。σ 暴增(≥ +30%)時觸發 alert。
  4. 凱利公式 + 倉位(§12): 算 Full Kelly × 0.5 = Half Kelly。再套 10% 單注硬上限。
  5. Monte Carlo 驗證(§8): 新策略部署前先跑 1,000 次模擬,確認 RoR < 1%、Max DD < 25%。
  6. Markov Chain 異常偵測(§9): 監控連勝連敗 sequence。若顯著偏離 Markov(隨機)模式,警示策略可能 broken。
  7. 投資組合最佳化(§10): 多策略 + 多運動 + 多莊家配置,最大化整體 Sharpe Ratio。
  8. Sharpe / Sortino / Calmar 監控(§11): 週度報表三大指標。Sharpe < 0.8 觸發策略檢討。

這套流程是 OddsForge 五信號融合 AI 預測引擎的數學骨幹,每個元件都有公開的學術引用與可驗證的回測資料。/performance頁面公開 96 場 AI 預測歷史,可獨立驗證所有公式的實際應用結果。

§14 常見問題

Q1我數學不好還能用這套方法嗎?

可以,但需要花時間。本文每個公式都附直觀解釋與實際數字案例。最基本只要會「加減乘除 + 百分比」就能理解 90% 內容。進階概念(如標準差、Bayesian、Monte Carlo)需要學 1-2 週但完全可學會。重點不是背公式而是建立「機率思維」 — 看到賠率自動換算公平機率、看到結果自動分辨「Edge 是真的還是運氣」。OddsForge 的 8 個計算機就是為了讓不擅長手算的人也能應用這些數學。

Q2為什麼要學 Kolmogorov 公理?跟運彩有什麼關係?

理解公理你才能判斷「莊家賠率是否合理」「自己估算的機率是否一致」。Kolmogorov 第三公理(互斥事件可加性)直接告訴你:1X2 三選一的機率必須加總為 1,超出 1 的部分就是 margin。不懂這個就無法計算 overround、無法找最佳賠率莊家、無法判斷你自己估算的機率是否邏輯一致。Kolmogorov 1933 年的工作是現代統計學、機器學習、量化金融的數學基礎,學會他就學會了 90% 應用數學的入場券。

Q3期望值(EV)是不是萬靈丹?只看 EV 就能賺錢?

不是。EV 是「必要條件」不是「充分條件」。+EV 保證長期平均賺錢,但「長期」可能很長(500-1,000 注)。短期內變異數可能讓你資金 -50%。職業投注者除了 +EV 外,必須監控變異數、Sharpe Ratio、最大回撤、Risk of Ruin、樣本量 — 這六個指標構成完整決策框架。本文第 4、9、11、12 章詳細介紹這些「EV 之外的指標」。

Q4Bayesian 更新看起來很學術,實務上真的用得到嗎?

用得到,而且職業投注者每天都在用。三大應用:(1) 即時投注(in-play):開賽 30 分鐘看到 1-0 領先,新的勝率怎麼算?Bayes 公式直接給答案。(2) 賠率變動解讀:Pinnacle 賠率突然從 2.10 變 1.90,這代表市場「後驗機率」上升了多少?(3) 多信號融合:OddsForge 五信號融合本質是貝氏融合 — 每個信號是獨立的證據,聯合後驗 = 最終機率估計。學會 Bayes 等於拿到「機率界的瑞士刀」。

Q5Monte Carlo 模擬要跑多少次才夠?

標準誤公式 SE = √(p(1-p)/n)。對奪冠機率約 10% 的隊伍,跑 100 次 SE = 3%(粗)、1,000 次 SE = 1%(一般可接受)、3,000 次 SE = 0.55%(業界標準)、10,000 次 SE = 0.3%(高精度)、100,000 次 SE = 0.1%(極端精度,邊際效益遞減)。OddsForge 用 3,000 次平衡速度與精度。FiveThirtyEight 用 20,000 次。Goldman Sachs 2014 世界盃用過 100,000 次。本文 §8 含完整 Python 實作。

Q6Markov Chain 跟「賭徒謬誤」有什麼關係?

完全相反。賭徒謬誤是「連續紅幾次後黑色更可能」的錯覺,認為事件之間有「補償」關係。Markov Chain 假設「未來只取決於當前狀態,與過去無關」 — 真正的賭場輪盤就是 Markov,前 10 次都紅不代表第 11 次黑色機率高。但體育投注略有不同:球員疲勞、心理壓力會讓「未來受過去影響」,是「非 Markov」過程。職業投注者用 Markov 模型「假設無相關」當基線,然後檢驗實際資料是否偏離 — 偏離越大表示越能利用,越接近 Markov 表示越接近賭場機率(無法套利)。

Q7Sharpe Ratio 為什麼比 ROI 更重要?

因為「相同 ROI 但不同風險」會帶來完全不同結果。例子:A 策略 ROI 10%、σ 30%,B 策略 ROI 5%、σ 8%。乍看 A 翻倍 B 但 Sharpe Ratio: A = 0.33、B = 0.625。B 在風險調整後是 A 的 1.9 倍。在資金管理(Kelly 公式)下,B 可以下更大倉位,長期累積反而比 A 多。職業投注者監控 Sharpe ≥ 1.0 才認為「策略有效」、≥ 2.0 是「世界級」。William Benter HKJC 賽馬模型 20 年 Sharpe 約 1.8-2.2。

Q8Risk of Ruin(破產率)公式怎麼用?

Vince (1990) 經典公式:RoR = ((1-Edge)/(1+Edge))^(資金/單注額)。例如 Edge 3%、單注 5% 資金、共 20 個單位:RoR = (0.97/1.03)^20 ≈ 30.7%。即使 +3% Edge,5% 倉位破產率仍 30%!壓到 < 1% 必須單注 1.5-2%(這正是 Half Kelly 動機)。職業投注者每個策略都要算 RoR,> 5% 不執行。本文 §12 含完整公式推導 + 8 種變形。

Q9為什麼學數學賺錢的人這麼少?

三個原因:(1) 數學要求紀律執行小 Edge(1-5%)但人類心理偏好「重壓爆贏」;(2) 機率估計本身難(需要五信號融合 + Bayesian + 機器學習門檻高);(3) 連虧 30 場時人類很難堅持。實證:Joseph Buchdahl 20 年公開回測年化 ROI 5-8%、William Benter 香港賽馬 10-15%、99% 業餘者長期虧 5-15%。差別不是「會不會數學」而是「能不能執行數學告訴你的紀律」。

Q10Markowitz 投資組合理論真的能套用在運彩嗎?

可以。把每個「+EV 投注機會」當成資產,計算各策略的 (期望報酬、變異數、相關性),用 Markowitz 1952 公式找「最小變異數的最大報酬組合」。實務含義:不要全押一個 +EV 機會,分散到不相關的機會(如英超 + NBA + 網球)能降低總變異數。職業投注者 William Benter 公開資料顯示其投資組合包含香港賽馬 + 美式賭場 + 加密幣套利,相關性低,整體 Sharpe Ratio 比單一策略高 30-50%。本文 §10 詳細解析。

Q11中央極限定理(CLT)跟「我什麼時候能看出策略好壞」有關嗎?

完全相關。CLT 告訴你「樣本平均的分布是常態分布,標準誤 = σ/√n」。實務含義:你的 ROI 估計準確度與 √n 成正比。10 注後 ROI 估計誤差約 ±30%、100 注後 ±10%、1,000 注後 ±3%、10,000 注後 ±1%。意味著「前 100 注全贏可能是運氣」「連虧 30 場不一定代表策略失效」。職業投注者通常等 500 注後才認真評估,10,000 注後才下「永久結論」。

Q12OddsForge 五信號融合的 Bayesian 數學怎麼運作?

每個信號 i 產出機率估計 pᵢ 與置信度 cᵢ(基於該信號歷史準確度)。融合公式:p_final = Σ(cᵢ × pᵢ) / Σcᵢ。其中 cᵢ 由 Brier Score 倒數計算(過去預測準確的信號權重高)。初始權重:賠率隱含 0.35、Elo 0.30、近況 0.15、傷病 0.10、主場 0.10。每屆大賽結束後依實際結果反向更新權重,這就是「線上學習」(Online Learning)的 Bayesian 框架。等於每場比賽都在做「條件機率更新」,是即時版的 Bayes 公式。

延伸閱讀

§15 學術引用與資料來源(25+ 條)

  • Kolmogorov, A. N. (1933). Foundations of the Theory of Probability. Chelsea Publishing.
  • de Moivre, A. (1718). The Doctrine of Chances. London: W. Pearson.
  • Bayes, T. (1763). An Essay towards solving a Problem in the Doctrine of Chances. Philosophical Transactions of the Royal Society.
  • Bernoulli, J. (1713). Ars Conjectandi. Basel.
  • Laplace, P. S. (1810). Théorie analytique des probabilités.
  • Kelly, J. L. (1956). A New Interpretation of Information Rate. Bell System Technical Journal, 35(4), 917-926.
  • Thorp, E. O. (1962). Beat the Dealer. New York: Random House.
  • Thorp, E. O. (2000). The Mathematics of Gambling. Lyle Stuart.
  • Markowitz, H. (1952). Portfolio Selection. Journal of Finance, 7(1), 77-91.
  • Sharpe, W. F. (1966). Mutual Fund Performance. Journal of Business, 39(1), 119-138.
  • Sortino, F. A., & van der Meer, R. (1991). Downside Risk. Journal of Portfolio Management.
  • Vince, R. (1990). Portfolio Management Formulas. Wiley.
  • MacLean, L. C., Thorp, E. O., & Ziemba, W. T. (Eds.). (2010). The Kelly Capital Growth Investment Criterion: Theory and Practice. World Scientific.
  • Buchdahl, J. (2003). Fixed Odds Sports Betting. High Stakes Publishing.
  • Buchdahl, J. (2016). Squares and Sharps, Suckers and Sharks. High Stakes.
  • Dixon, M. J., & Coles, S. G. (1997). Modelling Association Football Scores and Inefficiencies in the Football Betting Market. Applied Statistics, 46(2), 265-280.
  • Markov, A. A. (1906). Extension of the law of large numbers to dependent quantities. Bulletin of Kazan Mathematical Society.
  • Domingos, P., & Pazzani, M. (1997). On the optimality of the simple Bayesian classifier under zero-one loss. Machine Learning, 29(2-3), 103-130.
  • Miller, J. B., & Sanjurjo, A. (2018). Surprised by the Hot Hand Fallacy?. Econometrica, 86(6), 2019-2047.
  • Gilovich, T., Vallone, R., & Tversky, A. (1985). The Hot Hand in Basketball. Cognitive Psychology, 17(3), 295-314.
  • Levitt, S. D. (2004). Why are Gambling Markets Organised So Differently from Financial Markets?. The Economic Journal.
  • Wolfers, J., & Zitzewitz, E. (2006). Prediction Markets in Theory and Practice. NBER.
  • Forrest, D., & Simmons, R. (2008). Sentiment in the Betting Market on Spanish Football. Applied Economics.
  • Snowberg, E., & Wolfers, J. (2010). Explaining the Favorite–Long Shot Bias. Journal of Political Economy.
  • Metropolis, N., & Ulam, S. (1949). The Monte Carlo Method. Journal of the American Statistical Association.
  • von Neumann, J. (1951). Various Techniques Used in Connection with Random Digits. Applied Mathematics Series.
  • OddsForge 96 場 AI 預測回測資料(2024-08 至 2025-05),公開於 /performance

本系統所有預測結果僅供娛樂參考,不構成任何投注建議。運動賽事受傷病、天氣、裁判等多重不可預測因素影響,任何預測均存在不確定性。請理性娛樂,量力而為。未成年人請勿參與博彩活動。

聯繫我們
加入討論群