原題:超級(jí)大腦!AI大模型有望重塑信息產(chǎn)業(yè)格局

“學(xué)富五車”的“超級(jí)大腦”

——“心情不好是一種很正常的情緒,所以不用太過自責(zé)。”

創(chuàng)新工場(chǎng)首席科學(xué)家、北京瀾舟科技創(chuàng)始人周明介紹,AI大模型也稱人工智能預(yù)訓(xùn)練模型,將海量數(shù)據(jù)導(dǎo)入具有幾億量級(jí)甚至十萬億量級(jí)參數(shù)的模型中,機(jī)器通過做類似“完形填空”等任務(wù),深度學(xué)習(xí)數(shù)據(jù)中蘊(yùn)含的特征、結(jié)構(gòu),最終被訓(xùn)練成具有邏輯推理和分析能力的人工智能。

2018年起,人工智能進(jìn)入“大模型時(shí)代”,由重復(fù)開發(fā)、手工作坊式人工智能,即“一千個(gè)應(yīng)用場(chǎng)景就有一千個(gè)小模型”的零散、低效局面,走向工業(yè)化、集成化智能的全新路徑,以一個(gè)大模型“走天下”,為通用人工智能帶來曙光。比如,為生產(chǎn)智能音響,各個(gè)品牌競(jìng)相開發(fā)各自的AI小模型,未來各品牌只需在同一個(gè)AI大模型基礎(chǔ)上開發(fā)即可。

受訪者舉例介紹,以前的小模型就像“偏科的機(jī)器”,只學(xué)習(xí)針對(duì)特定應(yīng)用場(chǎng)景的有限數(shù)據(jù),“舉一反三”能力不足,一些智能產(chǎn)品被用戶調(diào)侃為“人工智障”的情況時(shí)有發(fā)生。而AI大模型則學(xué)習(xí)了各行各業(yè)各類數(shù)據(jù),成為具備良好的知識(shí)遷移能力的“通才”,適用領(lǐng)域更廣,產(chǎn)出內(nèi)容質(zhì)量更高,更加智能。

可分飾多角 應(yīng)用場(chǎng)景廣泛

AI大模型行業(yè)適用范圍廣,在醫(yī)療、金融、零售、氣象、新聞傳播、文學(xué)藝術(shù)等領(lǐng)域具有廣泛應(yīng)用場(chǎng)景。周明介紹,在大模型中輸入關(guān)鍵詞、主題、文本風(fēng)格等控制屬性后,即可生成滿足約束條件的文本內(nèi)容,可用于產(chǎn)品營銷文案寫作、電商智能客服等。在金融等領(lǐng)域,大模型通過抓取行業(yè)數(shù)據(jù),自主完成篩選、分析,并自主撰寫生成行業(yè)報(bào)告,輔助從業(yè)人員做決策。

值得注意的是,AI大模型目前的技術(shù)進(jìn)步,是人工智能從感知向認(rèn)知演進(jìn)的關(guān)鍵環(huán)節(jié)。清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系副教授劉知遠(yuǎn)表示,古今中外一切文章、資料,都可作為訓(xùn)練大模型的數(shù)據(jù)。通過分析并“內(nèi)化”海量知識(shí),不僅讓智能產(chǎn)品擁有更高性能,如機(jī)器翻譯更加準(zhǔn)確、機(jī)器寫作更加生動(dòng)有邏輯;還能品讀人類情感,用于情感標(biāo)注。此外,“它可能識(shí)別到‘弦外之音’,甚至有希望發(fā)現(xiàn)人類未曾掌握的知識(shí)。”

田奇表示,新一代搜索引擎具備創(chuàng)作能力,比如搜索“長翅膀的貓”“會(huì)飛的豬”等現(xiàn)實(shí)中不存在的事物,搜索引擎也可根據(jù)描述生成相應(yīng)照片。

當(dāng)前,美國OpenAI、谷歌、微軟、臉書、英偉達(dá)等海外公司紛紛布局AI大模型產(chǎn)業(yè),國內(nèi)的華為、阿里巴巴、百度等大型企業(yè),以及高校、科研機(jī)構(gòu)也加入研發(fā)賽道。AI大模型正成為人工智能“新高地”。

專家指出,我國有較大的AI大模型應(yīng)用市場(chǎng),在應(yīng)用領(lǐng)域具有優(yōu)勢(shì),但發(fā)展過程中也面臨一些挑戰(zhàn)。

多位受訪者表示,目前從事AI大模型研發(fā)且能產(chǎn)出創(chuàng)新性成果的高校、科研機(jī)構(gòu)和企業(yè)屈指可數(shù),與國外相比,我國相關(guān)領(lǐng)域高水平基礎(chǔ)人才培養(yǎng)力度有待加強(qiáng)。

多措并舉搶占“新高地”

首先,推進(jìn)AI大模型標(biāo)準(zhǔn)化。受訪專家指出,大模型的訓(xùn)練過程具有高能耗的特點(diǎn),制定標(biāo)準(zhǔn)后,許多工作可基于已經(jīng)開發(fā)的標(biāo)準(zhǔn)化大模型進(jìn)行適配和二次開發(fā),無需每次從頭訓(xùn)練,以降低能耗。同時(shí),大模型發(fā)展的過程中,也可能衍生違法違規(guī)信息生成、隱私泄露、虛假信息傳播等風(fēng)險(xiǎn),對(duì)用于訓(xùn)練模型的源頭數(shù)據(jù)等做好規(guī)范,有利于規(guī)避相關(guān)風(fēng)險(xiǎn)。國家相關(guān)部門可牽頭或引導(dǎo)企業(yè)、研究所、高校等共同定義大模型的標(biāo)準(zhǔn)。

再次,鼓勵(lì)算力共享。記者調(diào)研了解到,目前只有部分大企業(yè)能夠負(fù)擔(dān)超大模型訓(xùn)練所需的算力成本。受訪專家呼吁,可引導(dǎo)具有強(qiáng)算力的人工智能“國家隊(duì)”,為更多中小微企業(yè)、科研單位提供大模型訓(xùn)練所需的算力支撐,可探索合理付費(fèi)的算力共享機(jī)制,共同促進(jìn)技術(shù)的發(fā)展和資源的節(jié)約。

<span id="detailContent" style="color: rgb(0, 0, 0); font-family: " pingfang="" sc",="" "lantinghei="" "helvetica="" neue",="" helvetica,="" arial,="" "microsoft="" yahei",="" 微軟雅黑,="" stheitisc-light,="" simsun,="" 宋體,="" "wenquanyi="" zen="" hei",="" micro="" sans-serif;="" font-size:="" 18px;"="">最后,加大原始創(chuàng)新引導(dǎo)和支持。多位專家指出,我國應(yīng)加強(qiáng)研發(fā)力度,同時(shí)加強(qiáng)針對(duì)模型框架的基礎(chǔ)創(chuàng)新研究,引導(dǎo)更多科研單位、高校積極培養(yǎng)相關(guān)人才,鼓勵(lì)更多社會(huì)力量加入這場(chǎng)信息革命的浪潮。(記者 烏夢(mèng)達(dá) 趙旭 )