【ZiDongHua 之“自動化學院派”收錄關鍵詞:中科視語   人工智能  福布斯中國  大模型  中科院自動化所  】

 

中科視語董事長王金橋榮膺 2025 福布斯中國人工智能影響力人物

 

近日,2025 福布斯中國人工智能影響力人物評選榜單重磅揭曉,中國科學院自動化研究所紫東太初大模型中心常務副主任、武漢人工智能研究院院長、中科視語董事長王金橋憑借其在人工智能領域的杰出貢獻與深遠影響力,成功入選。

 

王金橋始終聚焦多模態(tài)感認知難題,從自監(jiān)督學習、多模態(tài)預訓練與高效推理優(yōu)化等維度展開深入研究。

在大模型研究前沿陣地,王金橋率領團隊精心圍繞圖文音通用基礎模型構建任務布局。在預訓練、微調(diào)與高效部署全鏈條上,他們構建大規(guī)模、高質(zhì)量圖文數(shù)據(jù),對多模態(tài)推理大模型進行深度優(yōu)化。不僅打造出國際首個千億參數(shù)多模態(tài)大模型 “紫東太初”,一舉斬獲 2022 年世界人工智能大會最高獎項 SAIL 獎,更相繼推出紫東太初 2.0 全模態(tài)大模型和紫東太初 3.0 多模態(tài)智能體大模型,支持 5 種模態(tài)理解與生成,且視覺對話能力比 GPT - 4o 高出 2% 。

同時,王金橋團隊在垂直領域大模型也持續(xù)創(chuàng)新。推出視語坤川通用視覺大模型,具備精細識別、萬物分割、多任務統(tǒng)一處理等領先特性?;谧灾餮邪l(fā)的 FastSAM 系列、AnomalyMoE 系列以及 Griffon 系列,展現(xiàn)出強大應用實力。FastSAM 系列實現(xiàn)應用級萬物感知;AnomalyMoE 系列賦能人機交互下的視覺理解,在工業(yè)場景落地開花;Griffon 系列則在視覺理解基礎上,拓展專家級視覺推理能力,廣泛賦能智慧交通、智慧工業(yè)等諸多領域,推動行業(yè)智能化變革。

 

在技術攻堅道路上,王金橋團隊披荊斬棘,突破多項關鍵技術瓶頸。深度學習模型訓練實現(xiàn)質(zhì)的飛躍,首次將 MS COCO 訓練時長縮短至 12 分鐘,實例分割訓練時長壓縮至 17 分鐘,實現(xiàn)模型分鐘級迭代;提出基于自洽高效掩碼自監(jiān)督學習方法,使經(jīng)典 MAE 算法訓練速度飆升 6 倍(T - PAMI2024);構建多粒度視覺自監(jiān)督預訓練統(tǒng)一框架,攻克現(xiàn)有自監(jiān)督學習通用性差、無法充分利用多源多目標圖像學習的難題;創(chuàng)新設計視覺掩碼機制和數(shù)據(jù)魯棒的無監(jiān)督目標提取方式,打破現(xiàn)有學習算法通用性差、表征單一化的桎梏,首次達成視覺掩碼模型超越有監(jiān)督模型,收斂效率比其他主流方法高出 2 - 8 倍,在下游圖像分類、目標檢測等任務中表現(xiàn)卓越,獲視覺最高獎 - 馬爾獎等認可。

此外,突破空間通道聯(lián)合稀疏化優(yōu)化、波動性剪枝等大模型優(yōu)化技術,實現(xiàn)參數(shù)量銳減 50% ,推理效率提升 66% ,其中 FastSAM 比 Meta 公司 SAM 快 50 倍,在 Github 攬獲 7.7k 星。

此次入選,不僅是對王金橋個人專業(yè)成就的高度認可,也彰顯了中科視語在人工智能領域的深厚科研實力與創(chuàng)新活力。未來,期待王金橋繼續(xù)引領創(chuàng)新,為人工智能產(chǎn)業(yè)發(fā)展書寫新篇章。