【文章解讀】

一:生命科學與生物醫(yī)藥領域:隨著基因測序技術、高通量生物實驗、傳感器等技術的發(fā)展,生命科學與生物醫(yī)藥領域正在步入數字化3.0時代,數字化、自動化進程加速。健康計算作為一種新型智能科學計算模式,是以人工智能和數據驅動為核心的第四研究范式。它將極大助力人類探索并解決生命健康問題;                             

二:自動駕駛領域:建設高等級智能網聯(lián)道路是智能駕駛及智能交通的一大趨勢,既保證了智能車量產的可能性,又保障了高級別自動駕駛基于場景驅動落地的可行性;中國版自動駕駛-汽車駕駛自動化:《汽車駕駛自動化分級》是我國智能網聯(lián)汽車標準體系的基礎類標準之一,由工業(yè)和信息化部于2020年3月9日報批公示,2021年1月1日正式實施。


市場監(jiān)管總局(標準委)針對自動駕駛功能正式出臺《汽車駕駛自動化分級》國家推薦標準(GB/T 40429-2021)。新標準2022年3月1日起正式實施。

 

 

 

張亞勤:生命科學與生物醫(yī)藥領域數字化、自動化進程加速

 

 

生命科學與生物醫(yī)藥領域正在步入數字化3.0時代,AI正在加速生命健康與生物醫(yī)藥領域向著更快速、更精準、更安全、更經濟、更普惠的方向穩(wěn)步發(fā)展。

——張亞勤

 

9月26日下午,2021年世界互聯(lián)網大會在烏鎮(zhèn)召開。在數據與算法論壇上,清華大學智能產業(yè)研究院(AIR)院長張亞勤院士圍繞“人工智能賦能生命科學”這一主題,介紹生物世界發(fā)生的數字化和智能化新變革,并分享清華大學智能產業(yè)研究院(AIR)在人工智能與生命健康交叉學科發(fā)展上的新布局。本次報告由張亞勤院長及團隊成員馬維英、蘭艷艷、黃婷婷共同完成。

 

(攝影/浙江日報記者 李震宇)

 

隨著基因測序技術、高通量生物實驗、傳感器等技術的發(fā)展,生命科學與生物醫(yī)藥領域正在步入數字化3.0時代,數字化、自動化進程加速。健康計算作為一種新型智能科學計算模式,是以人工智能和數據驅動為核心的第四研究范式。它將極大助力人類探索并解決生命健康問題。

 

image.png

 

人工智能從上世紀五十年代發(fā)展到今天,產生了很多不同的算法,尤其是以早期的RNN、LSTM和CNN為代表的深度學習技術,及過去這兩年的GAN、transformer- d (BERT和GPT-3模型), 預訓練模型等等,可以說從我們感知方面語音識別、人臉識別、物體的分類,已經和人達到同樣的水平。但在自然語言理解,知識推理,和視頻語義和泛化能力方面還有很多差距。另外在算法透明性,可解釋性,因果性,安全,隱私和倫理等方面還存在較大挑戰(zhàn)。

 

image.png

 

在可信AI計算方面最近又很多進展, 一個例子是聯(lián)邦學習,這也是清華大學智能產業(yè)研究院的一個重要研究課題。聯(lián)邦學習主要有兩種方案,一種是橫向聯(lián)邦學習,它主要面向不同來源特征和模型相同的場景,能夠保證相同模態(tài)不同來源數據之間的隱私性。另一種叫做縱向聯(lián)邦學習,它可以處理不同來源的特征和模型不同的情況,能夠保證多模態(tài)數據之間的隱私性。

 

image.png

 

我們已經看到,AI正在加速生命健康與生物醫(yī)藥領域向著更快速、更精準、更安全、更經濟、更普惠的方向穩(wěn)步發(fā)展。具體體現(xiàn)在,人工智能在蛋白質結構預測、CRISPR基因編輯技術、抗體/TCR/個性化的疫苗研發(fā)、精準醫(yī)療、AI輔助藥物設計等方面的研究已成為國際前沿戰(zhàn)略性研究熱點。

 

image.png

 

考慮到這樣的學科發(fā)展趨勢和產業(yè)背景,清華大學智能產業(yè)研究院(AIR)在“AI+生命健康方向”做了四個研究方向的布局,聚焦在研究“AI增強個人健康管理與公共衛(wèi)生”、“AI+醫(yī)療與生命科學”、“AI輔助藥物研發(fā)”與“AI+基因分析與編輯”方向。

 

image.png

 

作為交叉領域研究與應用,AIR認識到人工智能與生命科學、生物醫(yī)藥領域存在較大的知識鴻溝,缺乏面向生物計算的數據集、AI平臺、核心算法、計算引擎,同時跨界人才也非常稀缺。針對以上挑戰(zhàn),AIR提出“AI+生命科學破壁計劃”,目標是定義AI+生命科學領域的核心前沿研究任務,跨越生命健康領域與人工智能的領域鴻溝,打破壁壘,促進AI與生命科學的深度交叉融合,加速科學發(fā)現(xiàn)。

 

image.png

 

為此,我們需要構建面向生命科學領域的人工智能基礎設施、數據平臺、核心算法引擎,支撐生命科學前沿研究任務。同時通過打造旗艦公開數據集,組織算法挑戰(zhàn)競賽,構建AI+生命科學的眾智平臺,培養(yǎng)跨界人才,構建產業(yè)生態(tài)。

 

image.png

 

AlphaFold2是AI+生命科學的一個典型成功案例。它的成功因素來自于兩方面,首先,是任務的特殊性,蛋白質結構預測就可以看作從序列到三維結構的一個一一映射問題,因此它是一個well define的AI問題。這就是破壁計劃的目標,要找到生命科學中意義重大,但同時又能抽象為適合AI的研究任務。第二,是模型的優(yōu)越性。一方面,長時間的生命科學領域的研究積累了大規(guī)模的蛋白質結構數據,而AlphaFold2的整個模型架構則充分利用了數據驅動的端到端深度學習模型,大數據與深度模型的結合恰恰是第四范式的典型特點。因此,AlphaFold2帶給我們的啟示就是在AI+生命科學的研究中,要注重破壁和第四范式的重要性。

 

image.png

 

顯然,AlphaFold2僅僅是一個開始,它的成功正在開啟一個新的模式。蛋白質結構的精準預測為生命科學家提供了高效的計算工具,也為基于AI的重大生命科學發(fā)現(xiàn)提供了可能。未來,抗體、抗原的表位預測,腫瘤的精準療法,TCR/個性化疫苗的設計與優(yōu)化等方向將成為重要的研究熱點,并在AI驅動的新計算模式下取得突破性進展,AI+大分子制藥的黃金時代將正式到來。

 

image.png

 

其中,還會產生很多新的科學挑戰(zhàn),也預示著將產生新的計算范式,例如,干濕融合的閉環(huán)式計算框架。一方面人工智能模型通過高通量、多輪濕實驗的閉環(huán)驗證和數據補充將變得更為智能。另一方面,通過主動學習或強化學習的方式, AI將主動規(guī)劃濕實驗的自動化進行,形成干濕閉環(huán)驗證、迭代加速生命科學發(fā)現(xiàn)與產業(yè)應用。我們預見到,通過干濕閉環(huán)打通,生命科學研究與生物醫(yī)藥產業(yè)將迎來新的研究范式與產業(yè)模式。

 

image.png

 

AIR目前在基因數據的表達和預測方面已經取得了一些初步進展。最近,由我們清華大學智能產業(yè)研究院(AIR)的蘭艷艷教授帶領GeneBert團隊設計了一個新穎的基因預訓練模型,通過構建序列與轉錄因子之間的二維矩陣,實現(xiàn)了一個多模態(tài)的基因預訓練模型,獲取了基因數據的有效表示,尤其是挖掘了非編碼區(qū)的數據價值,在下游的啟動子、轉錄子結合位點的預測,先天性巨結腸疾病的基因篩選任務上都大幅提高了性能。我們相信,類似預訓練這樣的前沿AI技術在基因數據上的持續(xù)深入應用,將進一步挖掘基因數據的價值,幫助我們破解人類的密碼,在癌癥的精準治療等重要問題上發(fā)揮作用。

 

image.png

 

總結來看,我們認為,生物世界正處于數字化、自動化和智能科學計算的新變革中,用計算的方法,即人工智能和數據驅動的第四研究范式來輔助人們探索并解決生命健康的問題成為一個重要的研究方向。未來,需要學術界和產業(yè)界共同推動生命科學、生物醫(yī)藥、基因工程、個人健康各領域從孤立、開環(huán)向協(xié)同、閉環(huán)發(fā)展,實現(xiàn)更快速、更精準、更安全、更經濟、更普惠的生命科學與生物醫(yī)藥創(chuàng)新,這代表著下個十年巨大的科學發(fā)展與產業(yè)創(chuàng)新的新機會。

 

image.png

 

我們熱切呼吁更多的人來關注、支持或投身于這個新興交叉學科的發(fā)展。

 

撰文排版 /  冼曉晴

校對責編 / 黃妍

 

 


 

張亞勤:建設高等級智能網聯(lián)道路是智能駕駛及智能交通的一大趨勢

 

2月24日,全球首個車路協(xié)同自動駕駛數據集DAIR-V2X正式發(fā)布,向境內用戶提供下載使用。該數據集由清華大學智能產業(yè)研究院(AIR)聯(lián)合北京市高級別自動駕駛示范區(qū)、北京車網科技發(fā)展有限公司、百度Apollo、北京智源人工智能研究院共同發(fā)布。

  此次發(fā)布的數據集首次實現(xiàn)在相同時空下,車端與路端聯(lián)合視角的2D、3D標注方法創(chuàng)新,作為業(yè)界、學界首個開源車路協(xié)同數據集,將大力服務科研、產業(yè)、政府機構,有效協(xié)同各方進行車路協(xié)同的學術研究和產業(yè)落地,促進我國車路協(xié)同發(fā)展。

數據集正式發(fā)布

  2020年2月,國家發(fā)改委聯(lián)合相關部委出臺《智能汽車創(chuàng)新發(fā)展戰(zhàn)略》,將“推進智能化道路基礎設置規(guī)劃建設”作為重要的國家戰(zhàn)略任務,明確了“單車智能+車路協(xié)同”的中國特色自動駕駛路線,車路協(xié)同成為各界研究重點。

面向學界業(yè)界痛點 架起研究與落地橋梁

  北京經濟技術開發(fā)區(qū)管委會副主任、北京市高級別自動駕駛示范區(qū)工作辦公室主任孔磊表示,未來將及時利用數據轉化制定一批車路協(xié)同數據標準,推動行業(yè)數據要素、接口、格式等標準統(tǒng)一,為示范區(qū)建設和行業(yè)發(fā)展提供參考和指導;通過數據開放,為高校和科研機構提供基礎數據,為企業(yè)產品研發(fā)測試提供支持,有效加速產學研用協(xié)同,同時繼續(xù)開展數據開放和共享服務模式探索,推動數字經濟發(fā)展。

DAIR-V2X數據集整體特征

DAIR-V2X學業(yè)界及產業(yè)界效益

張亞勤發(fā)言

  清華大學智能產業(yè)研究院(AIR)院長張亞勤教授認為,建設高等級智能網聯(lián)道路是智能駕駛及智能交通的一大趨勢,既保證了智能車量產的可能性,又保障了高級別自動駕駛基于場景驅動落地的可行性。在智能交通領域,AIR已與多家企業(yè)開展校企合作,包括車路協(xié)同自動駕駛、垂直行業(yè)、小車物流、Robotaxi等應用場景。面對相關數據集的缺乏,不能滿足各界實現(xiàn)數據驅動車路協(xié)同的現(xiàn)實問題,AIR發(fā)起數據集建設,并將數據集對高校、科研院所、產業(yè)用戶開放,可以更好地支撐科研機構進行科學研究。

DAIR-V2X數據集全球首次發(fā)布

  此次發(fā)布的全球首個車路協(xié)同自動駕駛數據集DAIR-V2X,對于促進我國高級別自動駕駛技術的研發(fā)具有重要意義。在新基建、交通強國戰(zhàn)略指引下,“單車智能+車路協(xié)同”的中國特色自動駕駛路線以其領先性,逐步得到國際認可。未來,在產學研各界基于車路協(xié)同自動駕駛數據集的有效協(xié)作下,將繼續(xù)推動車路協(xié)同自動駕駛的應用落地,助力我國自動駕駛和智能交通產業(yè)的快速發(fā)展。