2010年6月29日 星期二

足球統計起革命

我不是足球迷,家中只有免費電視,又懶得上網找直播,世盃資訊只有靠電視和網上報道。對我來說,今屆最「引人入勝」之處,不是上屆冠、亞軍慘淡出局,不是那個新款皮球,亦不是場上球星一舉一動,而是賽後重溫「驚喜」頻頻。

登上 ESPN 足球網站,除了射門、犯規、角球、越位、控球比率等見慣的統計數字外,竟然見到一幅前所未見的圖像,顯示每位球員在該場比賽的平均位置(average position),腦際即時泛起一個疑問:如何追蹤球員的位置?場上 22 位球員,是否需要 22 人搜集資料?不用人手的話,背後又是什麼樣的科技?

免費電視重溫賽果,往往附帶一些詡詡如生的動畫分析入球過程,這又是什麼回事?沒有實時追蹤球員位置,如此逼真的畫面製作不了。還是,依靠錄影片段繪成動畫?

原來,這是世界盃首次對球場上的「物體」引入實時追蹤,科技由一間名為 Tracab 的瑞典公司提供,根據其網頁,此系統的誤差少於 10 厘米,不單只追蹤所有球員,還包括三位球證和一個皮球,對球場上 26 件「物體」的位置瞭如指掌。世界盃這個世人觸目的大舞台,當然不會使用一些未經考驗的科技,Tracab 系統首於 2005 年瑞典皇家聯賽(Swedish Royal League)面世,後獲俄羅斯、奧地利、匈牙利、土耳其的本土聯賽、2008 年歐洲國家盃和 2009 年洲際國家盃採用,去年 6 月累積追蹤了 1,500 場賽事,「實戰經驗」不容置疑。

這項科技改良自軍用的飛彈導航技術,系統包括兩組相隔不少於 15 米的攝錄機,每組八個鏡頭,即 16 個鏡頭俯瞰全場,球場每一部分至少兩個鏡頭覆蓋,較擠擁的區域(如禁區)或許更多,以提高解像度。原理不難明,要決定一件物體的三維座標,最少需從兩個角度觀之,就像我們單眼視物沒有深度,必須雙眼才可認清物件的正確位置。某程度上,這系統比人眼更先進,球場某些部分是被三隻「眼」覆蓋的。大部分時間,系統懂得自動追蹤場上 26 件「物體」,遇上一些球員異常密集的情況(如開角球或圍着球證申訴),才可能需要兩位真人操作員介入。

打個岔,談談體育數據市場的生態。Tracab 的位置數據只是眾多統計項目的其中一環,世界盃還有一間綜合數據供應商,整合所有統計及相關資訊,並配上適當的畫面供給電視台。自 2002 年至今三屆世界盃,其綜合數據供應商是一間名為 Deltatre 的意大利公司。換句話說,先有 Tracab 的實時追蹤,再經 Deltatre 包裝內容傳至本地電視台,我們才得享免費的三維球賽動畫。

追蹤技術不是 Tracab 獨有,美國的 STATS LLC 亦擁有類似技術。今年 4 月,STATS LLC 獲得歐洲聯賽冠軍盃的追蹤技術合約,相信來年歐聯的統計數據必會愈來愈豐富。

說來諷刺,最流行的隊際運動是足球,數據最貧乏的也是足球。對棒球和籃球有點認識的讀者,必會發現足球的所謂統計是如何的粗糙;由於缺乏數據,球員的優劣亦難以量化,判斷全靠觀感。足球比賽的性質是其缺乏數據的底因,入球稀少不在話下,其流暢節奏使「可數的」項目十分有限,球員的貢獻往往「隱沒」在複雜的組織之下。幸好,有了實時追蹤的位置數據,我們能對每場比賽作巨細無遺的分析。Castrol Index 就是這樣一個嘗試,今屆世盃和去季歐洲各大聯賽,Castrol Index 都有用來替球員排名。對進攻的球員來說,每次傳球和觸球給一個分數,愈近對方龍門愈具威脅,分數愈高;防守方面,成功攔截便得分,愈近己方龍門得分愈高;此外,博得十二碼和自由球也有分數。參考其官方網站,基本的計分原理不難明,可惜細節欠奉。Castrol 是潤滑油製造商,Castrol Index 很明顯是市場推廣策略,計分法如潤滑油秘方,同屬商業秘密,不難理解。

透明一點的計分法也不是沒有,最近連學者也「加入戰團」,把網絡理論應用於判別球員優劣。想像你把某隊所有球員的號碼寫於紙上,排列不拘,抽象一點看,每位球員都是一「點」。另外再加兩個特別「點」:一代表「射中龍門」,一代表「射斜」。球賽開始,2 號把皮球傳給 3 號,你在紙上記錄,由 2 號那點畫一條箭咀至 3 號那點;3 號再傳球給 7 號,你再畫箭咀由 3 號指向 7 號;若干傳球後,10 號門前勁射,越楣而去,你便畫箭咀由 10 號指向「射斜」。如此類推,球賽完畢後,這張紙便記載了一個學術上所謂的「網絡」-- 很多「點」,點與點之間有多條「路線」連接。網絡中那一點最「重要」呢?最「重要」的一點可說亦是球隊最「重要」的一員吧。

計算某點的「重要性」方法很多,網絡理論有個「betweenness centrality」的概念,簡單來說,從網絡隨意挑選兩點,兩點之間會有一條或多條最短路線,最短路線未必直接到達,可能經過一些「中途站」;挑選另外兩點,會有另外一組最短路線和「中途站」。「中途站」處於兩點之間(between),某點當「中途站」的次數愈多,它的「交通樞紐」地位(centrality)便愈形重要 -- 擁有愈多 betweenness,地位便愈是 central 了。

一班學者用以上方法分析了 2008 年歐洲國家盃的實時追蹤數據,發現西班牙的沙維和拉莫斯表現最優秀,符合一般人的觀感。其實他們「醉翁之意不在酒」,只想借足球來驗證他們的構想,看看 betweenness centrality 對衡量隊員的功效,他們更關心的,是把這概念推廣至其他「團隊」,例如一間公司或一隊科研人員的運作。

有了實時追蹤科技,很多從未想過的統計都有可能,例如某球員的最高跑速、長/中/短傳百分比、高/中/低活動時段、控球和非控球的跑動里數、皮球速度、傳球距離,有用的,沒用的,想得出就有可能,大家可到 FIFA 官方網站的統計分頁參觀一下,便會見到一個充滿統計數據的足球新世界。

(2010 年 6 月 29 日 信報副刊)

學術參考:
Jordi Duch, Joshua S. Waitzman, Luis A. Nunes Amaral (2010), “Quantifying the Performance of Individual Players in a Team Activity,” PLoS ONE 5, 6, e10937.

沒有留言:

張貼留言