足球 xG(預期進球)完整解讀:計算原理、數據解讀與實戰應用
TL;DR:xG(Expected Goals,預期進球)是衡量每次射門進球概率的統計指標,範圍 0 到 1。它考量射門距離、角度、身體部位、防守壓力等 20 多個變數,由機器學習模型從近百萬次歷史射門中訓練而成。當球隊實際進球長期高於 xG,代表過度表現,未來可能回歸均值;反之則可能反彈。搭配賠率分析,xG 趨勢是尋找價值投注的核心工具之一。
1. 什麼是 xG — Expected Goals 的概念
xG,全稱 Expected Goals(預期進球),是現代足球數據分析中最重要的統計指標之一。簡單來說,xG 衡量的是每一次射門轉化為進球的概率,數值範圍從 0 到 1。一次 xG = 0.75 的射門機會代表,在歷史上類似條件的射門中,每 100 次會有 75 次進球。
xG 的概念在足球數據社群醞釀多年,但公認的系統化里程碑是 2012 年 Sam Green 在 OptaPro Analytics Forum 上的發表。Green 的研究首次將射門的空間與情境變數整合進一個統一的概率框架中,為後來商業化 xG 模型奠定了基礎。
此後,各大數據公司紛紛開發自己的 xG 模型。Opta(Stats Perform 旗下)、StatsBomb 和 Stats Perform 是目前最主流的三家供應商,它們的模型各有特色:Opta 的模型依賴海量歷史數據和傳統統計方法;StatsBomb 則以精細的「360 度凍結畫面」(freeze-frame)數據聞名,能捕捉射門瞬間場上所有球員的位置;Stats Perform 的模型則強調深度學習與即時數據整合。
一場比賽中,一支球隊所有射門的 xG 加總就是該隊該場比賽的總 xG。例如,利物浦某場比賽 15 次射門,各自的 xG 為 0.08、0.35、0.12、0.72……加總為 2.45 xG,代表根據射門品質,這些機會在統計上「預期」能轉化為大約 2.45 個進球。
xG 的核心價值在於:它剝離了運氣和射手個人能力的影響,專注於射門機會本身的品質。這讓我們能更客觀地評估一支球隊的攻防表現,而不是只看最終比分。
2. xG 怎麼計算 — 20+ 變數完整解釋
xG 模型的核心是一個分類問題:給定一次射門的所有條件,預測它進球的概率。現代 xG 模型通常使用 logistic regression(邏輯回歸)或 neural network(神經網路)進行建模,訓練數據來自近 100 萬次甚至更多的歷史射門記錄。
以下是影響 xG 計算的主要變數,按重要性排列:
核心空間變數
- 射門距離(Distance to Goal):射門位置到球門中心的距離。距離越近,xG 越高。禁區內中央位置的射門 xG 通常在 0.15–0.40 之間,而 25 碼外的遠射 xG 可能只有 0.02–0.05。
- 射門角度(Angle to Goal):射門位置與兩根門柱形成的角度。角度越大,可射入的球門面積越大,xG 越高。小角度側面射門(如底線附近)的 xG 通常很低。
射門情境變數
- 身體部位(Body Part):腳射、頭球還是其他部位。腳射的平均轉化率高於頭球,因為控制精度更好。頭球的 xG 通常會被下調。
- 防守壓力(Defensive Pressure):射門瞬間,防守球員與射手之間的距離和數量。StatsBomb 的 freeze-frame 數據可以精確量化這個變數。無人防守的空門機會 xG 接近 0.90,而在密集防守下的射門可能只有 0.03。
- 守門員位置(GK Position):守門員相對於球門和射門路線的位置。守門員站位良好時會降低 xG,而守門員出擊失誤導致的空門則大幅提高 xG。
- 比賽狀態(Game State):射門時球隊是領先、落後還是平手。研究顯示,領先的球隊射門品質可能下降(打反擊為主),而落後的球隊可能更積極進攻。
- 是否為反擊(Fast Break / Counter):反擊中的射門通常 xG 較高,因為防守陣型未復位,空間更大。
傳球與前置動作變數
- 傳球類型(Assist Type):直塞球(through ball)通常創造更高品質的射門機會;橫傳(cutback)讓射手面對球門,xG 偏高;角球和自由球的射門 xG 則因擁擠的禁區而偏低。
- 射門前觸球次數(Touches Before Shot):一腳觸球直接射門(first-time finish)與多次觸球盤帶後射門的 xG 不同。一腳射門在某些情境下反而因防守來不及反應而 xG 較高。
- 傳球距離與方向:最後一腳傳球的距離和方向也會影響射門品質。
其他變數
- 射門前是否有盤帶突破
- 是否為定位球延伸的射門(角球二次進攻等)
- 比賽時間(下半場體能下降可能影響射門精度)
- 主客場因素
- 射門軌跡預期方向(部分進階模型)
Stats Perform 公開資料顯示,他們的 xG 模型訓練數據涵蓋超過 50 個聯賽的近 100 萬次歷史射門。模型在驗證集上的表現通常以 Brier Score 和 AUC-ROC 來衡量,頂級模型的 AUC-ROC 可達 0.78–0.82,代表預測能力遠優於隨機猜測。更多建模細節可參考 Stats Perform 的公開研究報告。
3. xG 能告訴我們什麼 — 過度表現與均值回歸
xG 最強大的應用是辨別球隊表現中的「真實實力」與「運氣成分」。核心邏輯很簡單:
實際進球 > xG = 過度表現(Overperformance)
球隊進球數超出射門品質所預期的水準,可能受益於射手超常發揮或對手門將失常。長期來看,有向 xG 回歸的趨勢。
實際進球 < xG = 表現不足(Underperformance)
球隊創造了足夠好的機會,但臨門一腳轉化不佳。未來有反彈的潛力。
經典案例:2015-16 Leicester City 奇蹟賽季
2015-16 賽季的 Leicester City(萊斯特城)以 5000 賠 1 的大冷門奪得英超冠軍,是足球史上最不可思議的成就。然而,xG 數據揭示了一個重要訊號:Leicester 整季的 xG 遠低於他們的實際進球數。Jamie Vardy 和 Riyad Mahrez 的射門轉化率大幅超出歷史平均值,團隊 xG 差值(Goals - xG)為正且幅度顯著。
這個訊號意味著什麼?均值回歸的力量很強大。果然在 2016-17 賽季,Leicester 的進球數大幅下滑,最終排名跌至第 12 名。他們的射門機會品質(xG)本就不支撐冠軍級別的進球產出,前一季的超常表現在統計層面上是不可持續的。
反例:2023-24 Brighton 的系統性優勢
並非所有 xG 偏離都會回歸。2023-24 賽季的 Brighton(布萊頓)在 Roberto De Zerbi 的戰術體系下,持續展現出 xG 超額表現。有趣的是,這種超額表現跨越了多個賽季,暗示這不是運氣,而是戰術系統帶來的結構性優勢——例如持續創造出模型未能完全捕捉的高品質射門位置,或者球員在特定戰術環境下射門品質的提升。
這個案例提醒我們:xG 是一個強大的工具,但解讀時必須結合戰術脈絡。持續且穩定的 xG 偏離可能代表真實的結構性因素,而非純粹運氣。
4. 各聯賽 xG 數據對比
不同聯賽因為戰術風格、節奏和防守強度的差異,呈現出截然不同的 xG 分布。以下是歐洲五大聯賽近期賽季的場均數據概覽:
| 聯賽 | 場均 xG(兩隊合計) | 場均實際進球 | 差異 | 觀察 |
|---|---|---|---|---|
| 德甲 Bundesliga | ~3.10 | ~3.18 | +0.08 | 節奏最快,攻守轉換頻繁,空間大 |
| 英超 Premier League | ~2.82 | ~2.85 | +0.03 | 高強度對抗,頂尖射手群集 |
| 西甲 La Liga | ~2.68 | ~2.55 | -0.13 | 控球為主,防守組織嚴密 |
| 法甲 Ligue 1 | ~2.70 | ~2.72 | +0.02 | PSG 拉高整體 xG 均值 |
| 義甲 Serie A | ~2.50 | ~2.58 | +0.08 | 戰術最成熟,低位防守壓縮空間 |
從表格可以觀察到幾個重點:德甲場均 xG 最高(約 3.10),因為德甲球隊普遍採用高位壓迫和快速攻守轉換,留出大量射門空間。義甲場均 xG 最低(約 2.50),反映了義大利足球以戰術紀律和防守組織著稱的傳統。
西甲的負差異值(-0.13)特別值得注意。這代表西甲球隊的實際進球持續低於 xG,可能與西甲門將的整體水準和防守戰術有關。對於分析西甲比賽的玩家,這意味著大球可能較難出現。更多關於各聯賽賠率特徵的分析,請參考我們的 賠率分析指南:五大聯賽章節。
5. xG 在賠率分析中的應用
xG 不僅是球迷和媒體的談資,它在賠率分析和價值投注辨識中扮演關鍵角色。核心思路是利用 xG 差值(實際進球 vs xG)來發現市場定價偏差。
基本策略:xG 差值找價值投注
當一支球隊的 xG 持續高於實際進球,但盤口尚未反映這個事實時,就存在潛在的價值投注機會。邏輯如下:
- 球隊 A 近 10 場平均 xG 為 2.1,但實際平均進球只有 1.3。
- 莊家根據近期比分(1.3 場均進球)設定盤口,賠率反映的是較低的進攻期望。
- 然而 xG 數據顯示,球隊 A 的射門品質支撐 2.1 場均進球。隨著均值回歸,進球數很可能上升。
- 此時投注球隊 A 的「大球」或「勝」可能具有正期望值。
進階原則:趨勢比單場更重要
單場比賽的 xG 波動極大——一次點球就是 0.76 xG。因此,在賠率分析中應該使用 rolling average(滾動平均),通常取近 5–10 場的 xG 均值:
5 場滾動 xG:反應較快,適合捕捉近期狀態變化(如新教練效應、關鍵球員傷缺)
10 場滾動 xG:更穩定,降低單場極端值的干擾,更適合中長期趨勢分析
進階玩家會同時觀察攻擊端 xG(xGF)和防守端 xG(xGA),兩者的差值(xGF - xGA)能更全面地反映球隊的攻防平衡。一支 xGF 高但 xGA 也高的球隊,大球可能更有價值;而 xGF 高、xGA 低的球隊,則在讓分盤上更有吸引力。
xG 與盤口定價的時間差
這是最關鍵的概念:莊家的盤口更新存在時間差。雖然頂級莊家已經在模型中納入 xG 數據,但中小型莊家和部分亞洲盤口可能反應較慢。特別是在以下場景中,xG 能提供「市場尚未定價」的資訊優勢:
- 新教練上任初期(戰術改變導致 xG 結構性變化,但盤口仍基於舊數據)
- 關鍵球員復出或受傷(個體對團隊 xG 的邊際影響尚未被盤口完全消化)
- 賽程密集期(體能下降對 xG 的影響經常被低估)
6. xG 的局限性
xG 是一個強大但不完美的工具。理解它的局限性和你的數據一樣重要,否則很容易掉入「數據迷信」的陷阱。
① 不考慮射手個人能力
標準 xG 模型計算的是「某個位置上的平均射手」射進這球的概率。但 Mohamed Salah 在禁區左側的切入射門和一個普通射手在同一位置的射門,xG 值是相同的。實際上 Salah 這類頂尖射手長期轉化率高於模型預期,這就是為什麼有些數據公司開發了 xGOT(Expected Goals on Target,命中目標預期進球)等進階指標來補充。
② 不捕捉比賽戰術脈絡
xG 只看射門瞬間的快照,不考慮比賽更宏觀的戰術脈絡。例如,一支球隊故意放棄控球、壓縮防守空間、利用反擊製造高品質機會,他們的 xG 可能不高(射門次數少),但每次射門的效率可能非常高。反之,控球率 70% 的球隊可能累積大量低品質射門,xG 看起來很高但實際威脅有限。
③ 樣本量需求
這是最常被忽略的問題。單場比賽的 xG 波動非常大,具有極高的變異性。一支球隊一場比賽的 xG 可能是 0.8 也可能是 3.5,這不代表他們的攻擊力在兩場之間發生了本質變化。
經驗法則:至少需要 10 場以上的樣本,xG 數據才開始具有穩定的參考價值。20 場以上更理想。這意味著在賽季初期(前 5-6 輪),xG 數據的參考權重應該顯著降低。
④ 各家模型結果不同
不同數據供應商的 xG 模型使用不同的變數、訓練數據和演算法,結果可能存在顯著差異。同一場比賽:
- Opta xG:偏向保守,因為模型相對簡單,變數較少
- StatsBomb xG:通常更極端(高的更高、低的更低),因為納入了 freeze-frame 防守數據
- FBref xG:基於 StatsBomb 數據,但可能有不同的後處理方式
建議:選擇一個數據源並保持一致,不要混用不同供應商的 xG 數據進行比較。
7. 哪裡可以查 xG 數據(免費資源)
好消息是,優質的 xG 數據不需要付費訂閱就能取得。以下是最推薦的免費 xG 資源:
| 平台 | 數據來源 | 覆蓋範圍 | 特色 |
|---|---|---|---|
| FBref | StatsBomb | 歐洲主要聯賽 + 南美 | 最全面的免費足球統計資料庫,含球隊與球員 xG |
| Understat | 自研模型 | 五大聯賽 + 俄超 | 視覺化射門地圖、xG 趨勢圖,界面直覺 |
| FootyStats | 自研模型 | 100+ 聯賽 | 覆蓋面最廣,含小聯賽 xG 數據 |
| Sofascore | 自研模型 | 全球 | 手機 App 體驗佳,即時 xG 更新 |
| WhoScored | Opta | 主要聯賽 | 含球員評分和射門地圖 |
建議初學者從 FBref 開始,因為數據品質最高(基於 StatsBomb),且能下載完整的賽季數據。Understat 則適合快速查看單場 xG 分布和射門地圖。FBref 的 xG 模型解釋頁面也值得仔細閱讀,能幫你更深入理解模型背後的方法論。
8. AI 如何整合 xG 進預測模型
xG 作為單一指標雖然強大,但真正的預測力來自於將 xG 與其他信號進行融合分析。這正是 OddsForge 的核心方法論——多信號融合(Multi-Signal Fusion)。
xG 在多信號模型中的角色
在 OddsForge 的 AI 引擎中,xG 趨勢是核心信號之一,但它不是唯一信號。我們的預測模型整合以下數據維度:
- xG 趨勢:5 場和 10 場滾動平均的 xGF 和 xGA,以及它們的變化趨勢(上升、穩定、下降)
- 莊家賠率隱含概率:從 24 家莊家的開盤和即時賠率中提取市場共識概率,去除 margin 後得到公平賠率
- 排名動態:Elo 評分系統或聯賽排名的近期變化趨勢
- 交手記錄:近 5 次對戰的結果、進球分布和 xG 表現
- 情境因素:主客場、賽程密度、關鍵球員傷停等
為什麼融合優於單一指標?
單獨使用 xG 的預測準確率大約在 52–55% 之間(對比隨機的 33% 三路猜測)。但當 xG 趨勢與莊家賠率共識出現分歧時——例如 xG 數據顯示球隊 A 攻擊力明顯上升,但賠率尚未調整——這個分歧本身就是一個具有預測力的信號。
AI 模型的優勢在於能同時處理數十個這樣的信號,量化它們的交互效應,並在毫秒內完成複雜的概率計算——這是人類分析師無法手動完成的。
常見問題(FAQ)
xG 是什麼意思?
xG(Expected Goals,預期進球)是衡量每次射門進球概率的統計指標,數值介於 0 到 1 之間。xG 0.3 表示該次射門在歷史數據中有 30% 的機率進球。一場比賽所有射門的 xG 加總就是該隊的 xG 值。
xG 怎麼計算?用了哪些數據?
xG 模型使用 20+ 個變數,包括射門距離、角度、身體部位(頭/腳)、防守壓力、守門員位置、比賽狀態、是否為反擊、傳球類型(直塞/橫傳/角球)等。Stats Perform 的模型使用近 100 萬次歷史射門數據訓練。
哪裡可以免費查 xG 數據?
免費 xG 資源:FBref.com(最全面)、Understat.com(五大聯賽詳細 xG)、FootyStats.org(含 xG 的聯賽統計)、Sofascore 和 WhoScored(手機 App 可查)。
xG 高但進球少代表什麼?
代表球隊射門品質高但臨門一腳效率偏低,屬「表現不足」。統計上這類球隊傾向在後續比賽中回歸平均,進球數會回升——這是用 xG 找投注價值的核心邏輯。
xG 可以用來預測比賽結果嗎?
單場 xG 波動大,預測力有限。但 5-10 場的滾動平均 xG 是預測未來表現的有力指標。xG 趨勢可揭示莊家盤口尚未反映的實力變化,幫助找到價值投注機會。
xG 和 xA 有什麼不同?
xG 衡量射門進球概率,xA(Expected Assists)衡量傳球帶來進球的概率。xA 評估最後一腳傳球品質,非射門本身。兩者結合可更完整評估進攻產出。
延伸閱讀
讓 AI 幫你整合 xG 數據與賠率分析
OddsForge 多信號 AI 引擎 — xG 趨勢 × 賠率走勢 × 排名動態,30 秒出報告
本系統所有預測結果僅供娛樂參考,不構成任何投注建議。運動賽事受傷病、天氣、裁判等多重不可預測因素影響,任何預測均存在不確定性。請理性娛樂,量力而為。未成年人請勿參與博彩活動。