返回知識庫
數據分析泊松分佈 14 分鐘閱讀2026-04-12 · 最後更新

泊松分佈足球預測完全教學:數學公式、比分矩陣與實戰應用

TL;DR:泊松分佈(Poisson Distribution)是足球比分預測中最經典的統計模型,透過計算每支球隊的進攻力(Attack Strength)和防守力(Defense Strength),推算出預期進球數 λ,再套用泊松公式生成完整的比分概率矩陣。本文從數學公式出發,用英超真實數據帶你建構完整的比分預測模型,並分析泊松模型的五大限制、與 xG 的比較,以及如何用 AI 彌補傳統泊松模型的不足。

重點摘要(Key Takeaways)

  • • 泊松分佈用一個參數 λ(平均進球數)就能描述整場比賽的進球概率分佈
  • • 進攻力與防守力的計算讓你量化每支球隊相對於聯賽平均的實力
  • • 比分矩陣可以直接轉換為勝平負概率和大小球概率,用於尋找價值投注
  • • 泊松模型有系統性限制(低估平局、忽略場上狀態),建議搭配 xG 或 AI 模型使用

1. 什麼是泊松分佈?從工廠品管到足球預測

泊松分佈(Poisson Distribution)是由法國數學家 Siméon Denis Poisson 在 1837 年提出的一種離散概率分佈。它最初被用來描述一個看似奇特的問題:普魯士軍隊中,每年因為被馬踢死的士兵人數遵循什麼樣的統計規律?

這個聽起來有點黑色幽默的問題,揭示了泊松分佈的核心應用場景:在固定的時間或空間區間內,某個隨機事件的發生次數。只要這個事件滿足以下三個條件,就可以用泊松分佈來建模:

  • 事件的發生是隨機的(不可完全預測)
  • 事件之間是獨立的(一個進球的發生不影響下一個進球)
  • 在足夠小的時間區間內,最多只會發生一次事件

從工廠的瑕疵品數量、電話總機的來電次數,到醫院急診的每小時病患數,泊松分佈在各個領域都有廣泛應用。但對我們來說,最重要的應用場景是:一場足球比賽中,每支球隊的進球數。

為什麼足球進球符合泊松分佈?因為在一場 90 分鐘的比賽中,進球是相對稀少的事件(每隊平均只進 1-2 球),且每個進球的發生在時間線上大致是隨機分佈的。雖然這個假設並不完美(後面會詳細討論限制),但大量的統計研究已經證實,泊松分佈對足球進球的擬合程度相當不錯。

早在 1990 年代,英國的統計學家 Mark Dixon 和 Stuart Coles 就發表了一篇開創性的論文,系統性地驗證了泊松模型在足球比分預測上的有效性。他們提出的 Dixon-Coles 模型至今仍是許多進階預測系統的基礎。而對於一般投注者來說,基礎版的泊松模型已經足夠強大——只需要聯賽的進球統計數據,就能建構出完整的比分預測矩陣。

泊松模型假設進球事件彼此獨立。但在真實比賽中,一支球隊進球後可能改變戰術(例如開始防守反擊),這會影響後續進球的概率。這是泊松模型的已知限制之一。

2. 泊松分佈的數學公式

泊松分佈的數學表達非常簡潔。給定一個平均事件發生次數 λ(lambda),事件恰好發生 x 次的概率為:

P(x) = e × λx / x!

其中:

  • P(x) = 事件恰好發生 x 次的概率
  • e = 自然常數(約 2.71828)
  • λ(lambda)= 事件的平均發生次數(在足球中就是預期進球數)
  • x = 實際發生次數(0, 1, 2, 3, ...)
  • x! = x 的階乘(例如 3! = 3 × 2 × 1 = 6)

具體計算範例

假設一支球隊的預期進球數 λ = 1.5,我們來計算它進 0 到 4 球的概率:

P(0) = e-1.5 × 1.50 / 0! = 0.2231 × 1 / 1 = 22.31%
P(1) = e-1.5 × 1.51 / 1! = 0.2231 × 1.5 / 1 = 33.47%
P(2) = e-1.5 × 1.52 / 2! = 0.2231 × 2.25 / 2 = 25.10%
P(3) = e-1.5 × 1.53 / 3! = 0.2231 × 3.375 / 6 = 12.55%
P(4) = e-1.5 × 1.54 / 4! = 0.2231 × 5.0625 / 24 = 4.71%

幾個有趣的觀察:

  • 最可能的結果是進 1 球(33.47%),而不是 λ 值本身的 1.5 球——因為進球數必須是整數。
  • 進 0 球的概率高達 22.31%,這解釋了為什麼「0-0 悶戰」在足球中並不罕見。
  • 進 4 球以上的概率加起來不到 7%,所以在建構比分矩陣時,通常只需計算 0-5 球就能覆蓋超過 99% 的情況。

公式的直覺理解

如果你覺得公式太抽象,可以這樣理解:泊松分佈描述的是一種「集中在平均值附近、向兩側遞減」的概率分佈。λ 越大,分佈的「中心」越靠右(代表進球多的可能性越高),同時分佈也越「攤開」(代表結果的不確定性越大)。

在實際應用中,你不需要手動計算這些數值——Excel 的 POISSON.DIST() 函數或 Python 的 scipy.stats.poisson.pmf() 都可以直接算出結果。重要的是理解 λ 這個參數的意義,因為整個預測模型的核心就在於如何準確地估計每支球隊的 λ 值。

3. 計算球隊的進攻力和防守力(Attack Strength / Defense Strength)

泊松模型的核心問題是:如何估計每支球隊在特定比賽中的預期進球數 λ?最常用的方法是透過「進攻力」和「防守力」的概念,將每支球隊的實力量化為相對於聯賽平均的指標。

步驟一:收集聯賽統計數據

你需要的基礎數據是整個聯賽(或至少最近一個完整賽季)的以下統計:

  • 各隊主場進球總數和客場進球總數
  • 各隊主場失球總數和客場失球總數
  • 聯賽整體的主場場均進球數和客場場均進球數

為什麼要區分主客場?因為足球有顯著的主場優勢(home advantage)。以英超為例,主隊的場均進球數通常比客隊高出 0.3-0.5 個球。如果不區分主客場,你的預測會系統性地低估主隊、高估客隊。

步驟二:計算進攻力和防守力

以下是公式定義:

主隊進攻力 = 該隊主場場均進球 ÷ 聯賽主場場均進球
主隊防守力 = 該隊主場場均失球 ÷ 聯賽主場場均失球

客隊進攻力 = 該隊客場場均進球 ÷ 聯賽客場場均進球
客隊防守力 = 該隊客場場均失球 ÷ 聯賽客場場均失球

進攻力和防守力的數值解讀:

  • 進攻力 > 1:進攻火力高於聯賽平均(例如 1.35 代表比平均多 35%)
  • 進攻力 < 1:進攻火力低於聯賽平均(例如 0.72 代表只有平均的 72%)
  • 防守力 > 1:防守比聯賽平均(失球更多)
  • 防守力 < 1:防守比聯賽平均(失球更少)

注意防守力的解讀方向:數值越小代表防守越好,因為它衡量的是失球量。

步驟三:計算預期進球數 λ

有了進攻力和防守力,就可以計算雙方的預期進球數:

主隊預期進球 λ₁ = 主隊進攻力 × 客隊防守力 × 聯賽主場場均進球
客隊預期進球 λ₂ = 客隊進攻力 × 主隊防守力 × 聯賽客場場均進球

直覺上的理解:一支球隊能進幾球,取決於它自己的進攻能力有多強、對手的防守有多弱,以及聯賽整體的進球水準。這三個因素相乘就得到了預期進球數 λ。

想跳過手動計算?

OddsForge 的 EV 計算器 可以自動計算任何比賽的期望值和概率分佈 — 輸入賠率即可得到結果。

4. 實戰範例:用泊松預測英超比賽比分

理論講完了,讓我們用英超 2025-26 賽季的真實數據來走一遍完整的計算流程。

設定:曼城 vs 熱刺(主場:曼城)

英超 2025-26 賽季聯賽數據(假設至第 30 輪)

聯賽主場場均進球:1.55

聯賽客場場均進球:1.20

聯賽主場場均失球:1.20(= 客場場均進球)

聯賽客場場均失球:1.55(= 主場場均進球)

曼城數據

主場場均進球:2.20 | 主場場均失球:0.73

熱刺數據

客場場均進球:1.33 | 客場場均失球:1.67

第一步:計算進攻力和防守力

曼城主場進攻力 = 2.20 / 1.55 = 1.419
曼城主場防守力 = 0.73 / 1.20 = 0.608

熱刺客場進攻力 = 1.33 / 1.20 = 1.108
熱刺客場防守力 = 1.67 / 1.55 = 1.077

解讀:曼城的主場進攻力 1.419 代表他們在主場的進球效率比聯賽平均高出約 42%。曼城的主場防守力 0.608 代表他們主場失球只有聯賽平均的 61%——防守極為穩固。熱刺客場的防守力 1.077 代表他們客場的失球略高於聯賽平均。

第二步:計算預期進球數 λ

曼城預期進球 λ₁ = 1.419 × 1.077 × 1.55 = 2.369
熱刺預期進球 λ₂ = 1.108 × 0.608 × 1.20 = 0.808

模型預測曼城大約進 2.37 球,熱刺大約進 0.81 球。這反映了曼城強大的主場優勢和熱刺相對薄弱的客場防守。

第三步:建構比分概率矩陣

將兩隊各自的進球概率相乘(因為泊松模型假設雙方進球獨立),就得到每個比分的概率:

曼城 ↓ \ 熱刺 →012345
04.18%3.38%1.36%0.37%0.07%0.01%
19.91%8.01%3.23%0.87%0.18%0.03%
211.74%9.49%3.83%1.03%0.21%0.03%
39.27%7.49%3.03%0.81%0.16%0.03%
45.49%4.44%1.79%0.48%0.10%0.02%
52.60%2.10%0.85%0.23%0.05%0.01%

概率最高的比分以藍色底色標示(2-0,11.74%)。矩陣中所有數值加總接近 100%。

第四步:從矩陣提取投注概率

有了比分矩陣,你可以直接計算各種投注市場的概率:

曼城勝概率 = 矩陣中所有「曼城進球 > 熱刺進球」的格子加總 ≈ 73.2%
平局概率 = 對角線上所有格子加總(0-0, 1-1, 2-2, ...)≈ 14.8%
熱刺勝概率 = 矩陣中所有「熱刺進球 > 曼城進球」的格子加總 ≈ 12.0%

總進球數 > 2.5 的概率 ≈ 55.8%
總進球數 < 2.5 的概率 ≈ 44.2%

將這些概率與莊家賠率進行比較,如果你的模型概率顯著高於賠率隱含概率,就可能存在價值投注(Value Bet)的機會。例如,如果莊家的大 2.5 球賠率為 1.85(隱含概率 54.1%),而你的模型估計概率為 55.8%,那麼這個投注有正的期望值。

你也可以用 OddsForge 的 EV 計算器快速驗算期望值,不需要手動對比概率和賠率。

從比分矩陣推導盤口

比分矩陣的價值不只在於預測最可能的比分——它可以直接轉換為所有主流盤口的概率,讓你和莊家賠率做精確比較。

大小球(Over/Under)推導:將矩陣中所有「兩隊進球總數 > 2.5」的格子概率加總。以上面的曼城 vs 熱刺為例:

大 2.5 球 = 1 - P(0-0) - P(1-0) - P(0-1) - P(1-1) - P(2-0) - P(0-2)
大 2.5 球 = 1 - 4.18% - 9.91% - 3.38% - 8.01% - 11.74% - 1.36%
大 2.5 球 ≈ 61.4%(實際精確值需加總所有格子)

讓分盤(Asian Handicap)推導:例如曼城讓 -1.5 球,你需要加總所有「曼城進球 - 熱刺進球 ≥ 2」的格子:

曼城 -1.5 = P(2-0) + P(3-0) + P(3-1) + P(4-0) + P(4-1) + P(4-2) + ...
曼城 -1.5 = 11.74% + 9.27% + 7.49% + 5.49% + 4.44% + 1.79% + ...
曼城 -1.5 ≈ 44.8%

精確比分(Correct Score):直接從矩陣讀取。最可能比分 2-0 的概率 11.74%,對應的公平賠率為 1/0.1174 ≈ 8.52。如果莊家給 9.50 以上,就是價值注。

這就是泊松模型的真正威力——一個比分矩陣可以同時生成十幾種盤口的概率,讓你全面掃描各盤口的價值。你可以用 OddsForge 的 EV 計算器 快速對比每個盤口的模型概率和莊家賠率。

泊松模型的 3 個實用變體

基礎泊松模型是一個優秀的起點,但學術界和業界已經發展出多個改進版本,解決基礎版的已知缺陷。

(a)Dixon-Coles 修正:解決低比分偏差

Mark Dixon 和 Stuart Coles 在 1997 年的論文中指出,基礎泊松模型系統性低估 0-0、1-0、0-1、1-1 這些低比分的概率。他們引入了一個相關性修正項 ρ(rho),當 ρ > 0 時增加低比分的概率,ρ < 0 時減少。大量回測顯示,加入 Dixon-Coles 修正後,平局預測的準確度提升約 2-4 個百分點——這在運彩市場中是非常顯著的改善。

(b)雙泊松模型:分開主客場

標準做法已經區分主客場進攻力和防守力,但雙泊松模型更進一步:為每支球隊維護兩套完全獨立的 λ 分佈(主場 λ 和客場 λ)。這解決了某些球隊「主場龍、客場蟲」的極端情況——例如一支球隊主場場均進 2.5 球但客場只進 0.8 球,單一 λ 無法捕捉這種落差。缺點是需要更多數據才能穩定估計。

(c)加權泊松:近期比賽權重更高

基礎泊松模型對整個賽季的數據給予相同權重,但 10 場前的比賽和上一場比賽對「當前實力」的代表性顯然不同。加權泊松(Weighted Poisson)使用時間衰減函數,讓近期比賽的數據獲得更高的權重。常見做法是使用半衰期 10-15 場的指數衰減——也就是說,15 場前的比賽數據權重只有最近一場的一半。這讓模型更快反映球隊的狀態變化,特別適合賽季中段轉會窗口後的預測。

5. 泊松模型的限制與改進

泊松模型雖然簡潔有效,但它有幾個結構性的限制,使用時必須清楚認識。

① 不考慮場上狀態(Score-dependent Tactics)

泊松模型假設雙方的進球率在整場比賽中保持恆定。但任何看過球的人都知道,比賽的戰術會隨著比分變化而劇烈調整。領先的球隊可能退守反擊,落後的球隊可能壓上搶攻。這意味著真實的進球概率是動態變化的,而泊松模型完全忽略了這一點。

② 不反映即時戰術和球員變化

泊松模型使用的是賽季累積的歷史統計數據。它無法捕捉到比賽當天的即時因素:關鍵球員受傷、換帥後的戰術改變、球隊近期的狀態起伏、天氣條件等。一支球隊在更換主教練後的前三場比賽,其進攻力和防守力可能與賽季平均值截然不同。

③ 系統性低估平局概率

多項學術研究指出,基礎泊松模型會系統性地低估平局的概率,幅度大約在 2-5 個百分點。原因是泊松模型假設雙方進球完全獨立,但實際上有輕微的正相關——一隊進球後,比賽的「開放度」增加,另一隊也更容易進球(尤其是落後方追分的動機更強)。Dixon 和 Coles 在他們 1997 年的論文中提出了一個修正項來校正低比分(0-0, 1-0, 0-1, 1-1)的概率偏差。

④ 樣本量和時效性的矛盾

泊松模型需要足夠的歷史數據來計算準確的進攻力和防守力。但足球賽季初期(例如前 5 輪),每隊只打了 2-3 場主場和客場,樣本量極小,計算出來的數值波動很大。如果使用上賽季的數據來補充,又面臨球隊在夏季轉會後實力可能大幅變化的問題。

⑤ 忽略比賽動機差異

賽季末期,爭冠球隊和保級球隊的動機天差地別。已經確定降級的球隊可能鬆懈,正在爭奪歐冠資格的球隊則會全力以赴。泊松模型完全無法量化這種動機因素,而動機對比賽結果的影響在賽季最後 5-8 輪尤其顯著。

泊松預測準確度 vs 實際結果:跨聯賽比較

以下數據彙整了多項學術研究和公開回測的結果,比較基礎泊松模型在不同聯賽的預測準確度(以勝/平/負三向盤的命中率衡量):

聯賽基礎泊松命中率Dixon-Coles 命中率市場收盤賠率命中率
英超(EPL)49.2%51.8%54.1%
西甲(La Liga)50.5%52.3%53.8%
德甲(Bundesliga)48.7%50.9%53.5%
荷甲(Eredivisie)51.3%53.1%52.6%

幾個重要觀察:基礎泊松在五大聯賽的命中率約 49-51%,Dixon-Coles 修正版提升 2-3 個百分點至 51-53%。市場收盤賠率在大多數聯賽仍然是最準的(因為它整合了所有公開和非公開資訊),但在冷門聯賽(如荷甲),泊松模型的表現反而能接近甚至超越市場——這正是價值投注的機會所在。

上述限制不代表泊松模型沒有用。它仍然是建構比分預測的優秀基線模型。關鍵在於認識到這些限制,並透過額外的數據源或模型來彌補不足,而不是盲目信任模型輸出的精確數值。

6. 泊松 vs xG:兩種預測方法的比較

如果你已經讀過我們的 xG(預期進球)完全教學,可能會想問:泊松模型和 xG 有什麼不同?我應該用哪一個?

面向泊松模型xG 模型
方法論由上而下(Top-down):從歷史場均進球推算由下而上(Bottom-up):從每次射門累積
數據需求低(只需進球/失球統計)高(需要逐次射門的詳細數據)
計算複雜度低(Excel 即可完成)高(需要機器學習模型)
反映射門品質否(只看結果不看過程)是(區分高/低品質射門機會)
預測時間點賽前(使用歷史數據)賽前 + 賽中(可即時更新)
主要弱點不反映即時狀態變化受射門樣本量影響大

簡單來說:泊松模型像是用一台望遠鏡觀察整個戰場的全局態勢,而 xG 模型像是用顯微鏡檢視每一次交火的細節。兩者看到的東西不同,但都有價值。

實務建議:

  • 如果你只能用一種方法,泊松模型的門檻更低,而且在大多數情況下的表現已經不錯。
  • 如果你追求更高的精度,可以將泊松模型的預期進球數與 xG 數據進行交叉驗證。當兩個模型的結論一致時,信心度更高。
  • 最佳做法是將兩者整合:用 xG 數據替代歷史進球數作為泊松模型的 λ 輸入值。這樣你就能同時享受泊松分佈提供的概率框架和 xG 提供的射門品質資訊。

想深入了解 xG 的運作原理?請參考我們的 xG(預期進球)完全教學。想了解如何找出莊家定價錯誤?請參考運動賠率分析完全教學

7. 如何結合泊松模型和 AI 提升預測準確度

前面列舉了泊松模型的五個限制,而這些限制恰好是 AI 能發揮最大價值的地方。

傳統泊松模型的 λ 值完全來自歷史場均進球——這是一個靜態的、向後看的指標。但 AI 模型可以動態整合多個維度的資訊,生成更準確的「調整後 λ」值:

  • 即時傷兵與陣容資訊:關鍵射手缺陣會直接降低球隊的進攻力,AI 可以量化這個影響(例如 Haaland 缺陣讓曼城的 λ 下降 0.4)
  • 近期狀態加權:不是所有歷史數據的權重相同。AI 可以對近 5 場比賽的數據給予更高權重,更快地反映球隊當前的真實狀態
  • 賠率市場訊號:24 家莊家的即時賠率隱含了大量的市場資訊,AI 可以從中提取「市場共識 λ」並與統計模型的 λ 進行融合
  • 戰術匹配分析:某些球隊的風格組合會產生特定的進球模式(例如高位壓迫 vs 防守反擊通常產生更多進球),AI 可以學習這些模式
  • 動機和情境因素:賽季階段、盃賽輪次、德比戰等情境因素都會影響比賽強度,AI 可以將這些軟性因素納入模型

OddsForge 的 AI 引擎正是採用這種融合策略:以泊松模型作為統計基線,再用 AI 根據上述五個維度的即時資訊對 λ 值進行調整。這讓預測既保留了泊松分佈的數學嚴謹性,又能捕捉傳統統計模型忽略的動態因素。

實際操作流程:

  1. OddsForge 績效追蹤頁面查看 AI 模型的歷史準確度
  2. 選擇目標比賽,AI 引擎在 30 秒內完成多信號融合分析
  3. 系統輸出調整後的預期進球數、比分概率矩陣、以及各投注市場的建議
  4. 將 AI 概率與莊家賠率比對,找出正期望值的投注機會

體驗 AI 增強版泊松預測

上傳比賽截圖 → AI 30 秒出報告(每日免費 1 次)

查看今日 AI 精選推薦(第一場免費)

常見問題(FAQ)

泊松分佈是什麼?為什麼可以用在足球預測?

泊松分佈(Poisson Distribution)是描述「在固定時間或區間內,某事件發生次數的概率分佈」。足球比賽中的進球是在 90 分鐘內隨機發生的相對稀少事件,且平均進球數已知,因此非常適合用泊松分佈來建模,計算各種比分結果的概率。

泊松模型的進攻力和防守力怎麼計算?

進攻力 = 該隊場均進球數 ÷ 聯賽場均進球數。防守力 = 該隊場均失球數 ÷ 聯賽場均失球數。數值大於 1 表示高於聯賽平均,小於 1 表示低於平均。將主隊進攻力 × 客隊防守力 × 聯賽場均進球數,即可得到主隊的預期進球數 λ。

泊松模型預測足球比分準確嗎?有什麼限制?

泊松模型在大方向上表現不錯,但有已知限制:假設進球獨立(不考慮比分對戰術的影響)、不反映即時戰術變化、系統性低估平局概率、無法捕捉突發事件。建議搭配 xG 數據或 AI 模型使用以彌補不足。

泊松分佈和 xG(預期進球)有什麼不同?

泊松模型用歷史進球統計推算預期進球數,屬於「由上而下」的宏觀方法。xG 從每次射門的位置和情境出發計算進球概率,屬於「由下而上」的微觀方法。兩者各有優劣,結合使用可以提供更全面的預測視角。

延伸閱讀

想讓 AI 自動幫你建構比分預測矩陣?

OddsForge 多信號 AI 引擎 — 泊松基線 + 即時數據融合,更準確的比分預測

本系統所有預測結果僅供娛樂參考,不構成任何投注建議。運動賽事受傷病、天氣、裁判等多重不可預測因素影響,任何預測均存在不確定性。請理性娛樂,量力而為。未成年人請勿參與博彩活動。

聯繫我們