【ZiDongHua 之創(chuàng)新自科文收錄關鍵詞:人工智能 智能博弈 中國科學院自動化研究所 智慧足球分析系統(tǒng) 】
 
 
  向綠茵場進發(fā)!自動化所團隊在足球比賽智能博弈研究方面取得系列進展
 
 
  近年來,人工智能技術在足球訓練領域的應用產生了重要的影響,尤其是博弈對抗技術使球隊和球員的行為策略有了理論技術基礎,而愈加受到體育專業(yè)領域的重視。同時,由于足球推演面臨大時空跨度、多個體合作與對抗、強不確定、稀疏獎勵等挑戰(zhàn),任務復雜度高于圍棋、一般即時策略類游戲等基礎問題,也被看作決策智能研究的典型場景和測試平臺。
 
  中國科學院自動化研究所蒲志強研究員團隊牽頭承擔了科技創(chuàng)新2030—“新一代人工智能”重大項目之課題“基于博弈對抗的足球推演系統(tǒng)”。課題組以人工智能博弈決策技術為基礎,致力于改變足球賽事分析相對滯后的、靜態(tài)的、以個體分析為主的傳統(tǒng)統(tǒng)計描述模式,構建實時的、動態(tài)的、以全局戰(zhàn)術分析為主的智慧推演評估方法、工具和系統(tǒng)。課題面向足球領域大規(guī)模知識庫構建、動態(tài)復雜不確定狀態(tài)感知與局勢理解、多時空尺度典型場景博弈對抗決策等方面開展系統(tǒng)研究,構建智慧足球分析系統(tǒng),服務于專業(yè)及青少年代表隊,為人工智能技術在足球領域的深度應用打開了新空間。
 
  自主構建大規(guī)模足球領域數(shù)據(jù)庫
 
  人工智能研究離不開數(shù)據(jù)支撐,但國內足球賽事及訓練缺乏可控數(shù)據(jù)與數(shù)據(jù)采集體系的問題一直存在。
 
  為此,研發(fā)團隊搭建了完整的足球數(shù)據(jù)采集系統(tǒng),開展了一系列足球比賽數(shù)據(jù)自主采集工作。同時,系統(tǒng)研究了國內外開源足球數(shù)據(jù)集,并面向英超聯(lián)賽開展了上千場賽事數(shù)據(jù)智能分析,構建了融合事件數(shù)據(jù)、追蹤數(shù)據(jù)等多種數(shù)據(jù)形式的數(shù)據(jù)集,形成了國內首個千萬級節(jié)點足球專業(yè)領域知識庫,覆蓋球員近萬名、賽事5000余場,并提出了近200項運動表現(xiàn)分析指標,為開展更加深入的賽事智能分析提供了堅實的數(shù)據(jù)支撐,為構建我國足球領域數(shù)據(jù)資產提供了有效的資源和工具。
 
  賽中實時研判,賽后反推復盤
 
  研發(fā)團隊綜合運用足球領域專家知識及大數(shù)據(jù)分析、深度學習等工具方法,面向宏觀戰(zhàn)術、全局視角開展賽事狀態(tài)感知與局勢理解研究,可以出色完成多項賽事研判任務。例如,通過構建多維度全局優(yōu)勢區(qū)域模型,將比賽畫面轉變?yōu)閼B(tài)勢地圖,實時動態(tài)捕捉球隊雙方全場優(yōu)勢分布與變化情況,輔助教練員“打開第三只眼”,為其提供更全面深入的態(tài)勢洞察和決策輔助,改變了相對滯后的賽后經(jīng)驗性戰(zhàn)術分析模式。如下圖所示,態(tài)勢地圖可針對場上球員每一次無球跑動或每一個有球動作做出價值評估。
 
  
 
  圖1. 對真實比賽的全局性優(yōu)勢區(qū)域評估
 
  又如,在賽后復盤階段,針對比賽重要片段構建反事實推演模型,可開展“如果當時xx做,比賽會xx不一樣”的模擬分析,并通過引入多輪策略博弈,實現(xiàn)“預判對手的預判”。
 
  
 
  圖2. 反事實推演:黃色為真實對手軌跡,藍色為真實阿森納軌跡,紫色為替換阿森納的AI模型軌跡
 
  虛實融合的綠茵場,足球博弈決策推演
 
  人工智能,特別是深度強化學習方法的興起,為智能體在虛擬空間不斷學習實現(xiàn)策略自主進化提供了重要手段?;谧闱蛱摂M推演平臺Google Research Football,團隊采用知識與數(shù)據(jù)協(xié)同、對手建模、種群博弈、認知驅動、知識遷移等AI算法手段,提出了一系列高效的足球博弈決策方法,支持在虛擬空間中訓練模型、演化更新戰(zhàn)術戰(zhàn)法。
 
  同時,相關研究將千萬級場次虛擬比賽數(shù)據(jù)與真實比賽數(shù)據(jù)結合,以虛實融合的方式打通了從現(xiàn)實到虛擬再反饋現(xiàn)實的分析路徑,構建足球智能決策輔助模型,可進行任意球員無球跑動的價值衡量、傳球序列分解與行為價值分配,從而輔助球員與教練員進行多維度的決策評估與模擬。
 
  
 
  圖3. 基于不同角色知識遷移的多智能體訓練框架
 
  
 
  圖4. 虛擬空間內的策略進化
 
  基于虛擬數(shù)據(jù)訓練的模型可支持真實比賽分析。以英超2021-2022賽季阿森納對戰(zhàn)托特納姆熱刺的一場比賽為例,如圖5,第6分02秒的畫面中,阿森納此時處于進攻關鍵時刻,邊后衛(wèi)3號蒂爾尼可將球傳給10號史密斯羅或14號奧巴梅揚,他該如何選擇呢?我們可對10號和14號球員無球跑動價值進行分析,來幫助3號球員進行決策。兩名球員的無球跑動價值如圖6所示,顏色越亮的區(qū)域價值越高,即若球員向明亮區(qū)域移動,其可占據(jù)更多的優(yōu)勢區(qū)域,并為所在球隊創(chuàng)造得分機會。最終,AI分析結果與真實比賽中球員的決策一致。
 
  圖5. 第6分02秒的轉播畫面與全景畫面
 
  基于以上成果,課題組自主研發(fā)了足球比賽智能分析系統(tǒng),將多個算法成果集成應用。通過該系統(tǒng),教練員在上傳比賽片段后,即可獲得球員的技戰(zhàn)術與全局性策略表現(xiàn)評估,且能夠對球員跑動能力、速度等個性化信息進行修改,實現(xiàn)反事實戰(zhàn)術推演。
 
  推動成果落地,釋放體育新活力
 
  研究成果已服務于部分職業(yè)聯(lián)賽和青訓代表隊的比賽分析、推演、復盤等實際應用,幫助“2023首屆京津冀大學生校際足球聯(lián)賽”多支參賽隊伍、浙江省青少年足球錦標賽臺州市女子參賽隊及北京靈動星空等球隊以更科學、可量化的方式提升球員技戰(zhàn)術水平,輔助教練完善比賽戰(zhàn)術布防。同時,與業(yè)內頂尖上下游企業(yè)開展技術合作,形成數(shù)據(jù)采集-智能分析整體解決方案,已服務于一批青少年足球課堂教學及賽事人才選拔。下一步,團隊將持續(xù)推動人工智能技術在足球領域的技術突破與深度應用,為以足球為代表的體育事業(yè)提供科技助力,注入智慧動能。
 
  部分代表性論文:
 
  [1] Pu Z, Wang H, Liu B, et al., Cognition-Driven Multi-Agent Policy Learning work for Promoting Cooperation. IEEE Transactions on Games, 2022.
 
  [2] Liu B, Pu Z, Zhang T, et al., Learning to Play Football from Sports Domain Perspective: A Knowledge- ded Deep Reinforcement Learning work. IEEE Transactions on Games, 2022.
 
  [3] Liu B, Pu Z, Pan Y, et al., Lazy Agents: A New Perspective on Solving Sparse Reward Problem in Multi-agent Reinforcement Learning. ICML 2023.
 
  [4] Wang S, Pan Y, Pu Z, et al., Deconfounded Opponent Intention Inference for Football Multi-P Policy Learning. IROS 2023.
 
  [5] Chen M, Pu Z, Pan Y, et al., Knowledge Transfer from Situation Evaluation to Multi-Agent Reinforcement Learning, ICONIP 2022.
 
  [6] Chen M, Pu Z, Pan Y, et al., All for Goals: A Stylized Automated Analysis work in Football Matches, IJCNN 2023.
 
  [7] Wang S, Pan Y, Pu Z, et al., Heterogeneous-Graph Attention Reinforcement Learning for Football Matches, IJCNN 2023.
 
  [8] Pu Z, Pan Y, Wang S, et al., Orientation and Decision-Making for Soccer d on Sports Analytics and AI: A Systematic Review, IEEE/CAA Journal of Automatica Sinica, to be published.