科大訊飛 劉慶峰:解放生產(chǎn)力 釋放想象力
劉慶峰:解放生產(chǎn)力 釋放想象力
劉慶峰|科大訊飛創(chuàng)始人,董事長(zhǎng)

8月25日,亞布力論壇2023年夏季高峰會(huì)在深圳正式開(kāi)幕??拼笥嶏w創(chuàng)始人,董事長(zhǎng)劉慶峰應(yīng)邀作開(kāi)幕演講。他表示,特別希望借助亞布力論壇這個(gè)平臺(tái),讓中國(guó)企業(yè)在各個(gè)領(lǐng)域,將數(shù)據(jù)、算力、算法聯(lián)通起來(lái),形成自己的生態(tài)優(yōu)勢(shì),共同打贏這場(chǎng)通用人工智能時(shí)代的產(chǎn)業(yè)升級(jí)之戰(zhàn),共同解放生產(chǎn)力、釋放想象力。
以下為劉慶峰演講全文:
最近大家普遍關(guān)注兩件事。
一是這一次通用人工智能包含哪些內(nèi)容?ChatGPT于去年11月30日發(fā)布,用了短短兩個(gè)月的時(shí)間積累1億用戶。那么,它到底是一個(gè)以對(duì)話為主的好玩的工具?還是一個(gè)能夠賦能千行百業(yè),能夠給以“人力”和“時(shí)長(zhǎng)”為代表的商業(yè)模式帶來(lái)根本性變革的工具?
二是當(dāng)2017年《新一代人工智能規(guī)劃》出臺(tái)時(shí),大家都很有信心中國(guó)在人工智能領(lǐng)域可以跟美國(guó)比肩天下,而在今年一季度很多業(yè)界伙伴開(kāi)始擔(dān)憂,認(rèn)為我們無(wú)論從算力、算法,還是應(yīng)用效果上,是不是又有了代差級(jí)的差距?現(xiàn)在人工智能到底發(fā)展如何?
我想分享下科大訊飛最新的實(shí)踐,并就這些問(wèn)題做一個(gè)簡(jiǎn)單的分享。
首先是通用人工智能為什么叫通用人工智能?
科大訊飛創(chuàng)立于1999年,一直圍繞語(yǔ)音技術(shù)和人工智能技術(shù)進(jìn)行研究,希望機(jī)器可以像人一樣能聽(tīng)會(huì)說(shuō),能理解會(huì)思考,用人工智能建設(shè)美好世界??拼笥嶏w承建中國(guó)唯一的認(rèn)知智能全國(guó)重點(diǎn)實(shí)驗(yàn)室,核心任務(wù)就是要讓機(jī)器人具備學(xué)習(xí)、推理和決策能力。

在多年探索中,我們已經(jīng)讓機(jī)器人在一個(gè)又一個(gè)專業(yè)賽道上超越了人。例如語(yǔ)音合成,如果播音員播報(bào)水平是5分,那么機(jī)器人已達(dá)到4.8分了。這意味著,稍微優(yōu)化一下,這個(gè)機(jī)器人就可以給中央電視臺(tái)《創(chuàng)新中國(guó)》欄目來(lái)配音;在語(yǔ)音識(shí)別上,機(jī)器人已經(jīng)超過(guò)了最好的專業(yè)速記員。今年全國(guó)兩會(huì)上,2900多個(gè)全國(guó)人大代表使用科大訊飛產(chǎn)品,準(zhǔn)確率為96%;在翻譯上,機(jī)器人在大學(xué)6級(jí)考試中超過(guò)了99%的大學(xué)生,順利通過(guò)國(guó)家翻譯師資格考試;在醫(yī)療中,我們讓“智醫(yī)助理”參加國(guó)家執(zhí)業(yè)醫(yī)師資格考試,成績(jī)?yōu)?56分(滿分600分),超過(guò)96.3%的考生……
三年前,科大訊飛對(duì)GPT所有算法做了深度解讀,我們發(fā)現(xiàn),即便是1000多億的模型還沒(méi)有60多億的模型做得好,所以沒(méi)有花大代價(jià)去建服務(wù)器集群和數(shù)據(jù)。但去年ChatGPT一經(jīng)推出就帶來(lái)了巨大驚喜,我們迅速在15天內(nèi)進(jìn)行閃電驗(yàn)證,隨后開(kāi)始啟動(dòng)科大訊飛“1+N”認(rèn)知大模型專項(xiàng)攻關(guān)。其中,“1”是對(duì)標(biāo)ChatGPT的通用認(rèn)知大模型,“N”是教育、醫(yī)療、司法、辦公等領(lǐng)域的落地。
這次為什么叫通用人工智能?因?yàn)樗押A康亩嘣炊嗄B(tài)數(shù)據(jù)(多源就是多種來(lái)源,多模態(tài)可以是語(yǔ)音、圖像、文本、視頻等)送到一個(gè)統(tǒng)一的神經(jīng)網(wǎng)絡(luò)大模型,這個(gè)模型大概是1750億的浮點(diǎn)參數(shù)。原來(lái)我們只做60億的模型就可以把醫(yī)療領(lǐng)域的翻譯工作做得很好,那么這次用1000多億的模型能帶來(lái)什么好處?我們稱為通用領(lǐng)域的智慧涌現(xiàn)。這個(gè)大模型可以對(duì)海量數(shù)據(jù)進(jìn)行記憶、學(xué)習(xí)和訓(xùn)練,然后具備推理和決策的能力,很多東西即便沒(méi)有教給它,它也可以自己學(xué)會(huì)。今年4月28日,中央政治局專門提出要高度重視通用人工智能發(fā)展,7月10號(hào),七部門聯(lián)合發(fā)布《生成式人工智能服務(wù)管理暫行辦法》,定于8月15號(hào)執(zhí)行。大家都在等著首批廠商什么時(shí)候能夠給用戶提供海量服務(wù)。
認(rèn)知大模型的“智能涌現(xiàn)”將帶來(lái)解決人類剛需的全新機(jī)遇。我們根據(jù)ChatGPT解讀出的48個(gè)主要任務(wù),以及科大訊飛500多萬(wàn)開(kāi)發(fā)者需求分析,得出當(dāng)前階段通用人工智能的七大維度能力,即文本生成、語(yǔ)言理解、知識(shí)問(wèn)答、邏輯推理、數(shù)學(xué)能力、代碼能力和多模態(tài)能力。
5月6日,科大訊飛正式發(fā)布“星火認(rèn)知大模型”。我們和長(zhǎng)三角人工智能產(chǎn)業(yè)鏈聯(lián)盟以及中國(guó)科學(xué)院人工智能產(chǎn)學(xué)研創(chuàng)新聯(lián)盟,把七大維度能力分解成481個(gè)子任務(wù)。為什么是481個(gè)?因?yàn)楣庖粋€(gè)文本生成,就涉及到政府公文、廣告文案等100多項(xiàng)任務(wù)。雖然我們?cè)趪?guó)內(nèi)可測(cè)系統(tǒng)中已處于領(lǐng)先位置,但跟ChatGPT相比還有不少差距。
6月9日、8月15日,我們對(duì)星火認(rèn)知大模型進(jìn)行兩次升級(jí),接下來(lái),我簡(jiǎn)單說(shuō)下七大維度的能力。

多風(fēng)格多任務(wù)長(zhǎng)文本生成。公文協(xié)作、故事創(chuàng)作、廣宣文案、書(shū)寫(xiě)郵件等功能對(duì)工作其實(shí)非常有幫助。科大訊飛在做大模型的第一天就堅(jiān)持中英文同步,在英文文本上,我們與ChatGPT已經(jīng)非常接近了。再分享一個(gè)令我都很驚訝的例子。星火大模型中的講故事助手為一個(gè)小孩講了72集故事,共計(jì)24000多萬(wàn)字,極大激發(fā)了孩子的想象力,最后小孩自己創(chuàng)作出了《小豬的故事》。
多層次跨語(yǔ)種語(yǔ)言理解。例如,以前科大訊飛可以把大家開(kāi)會(huì)的速記由聲音轉(zhuǎn)為文字,而現(xiàn)在,這個(gè)大模型可以把開(kāi)會(huì)的錄音直接變成500字、1000字的摘要,如果需要寫(xiě)一個(gè)新聞通稿,它也可以一鍵生成。語(yǔ)音理解能力會(huì)讓認(rèn)知大模型成為我們每個(gè)人在生活和工作中的助手。它可以像人一樣的來(lái)調(diào)用工具,這是通用大模型最了不起的地方。
知識(shí)問(wèn)答。知識(shí)問(wèn)答并不是原來(lái)簡(jiǎn)單的搜索類問(wèn)答。星火大模型或認(rèn)知大模型能學(xué)習(xí)全世界的知識(shí),它似乎都懂,但它的存在的問(wèn)題是專業(yè)知識(shí)精準(zhǔn)度不夠。所以,可以讓其對(duì)接行業(yè)知識(shí)庫(kù)和企業(yè)內(nèi)部知識(shí)庫(kù),這樣,它就可以在學(xué)好后用邏輯進(jìn)行分析和解答。這就是知識(shí)問(wèn)答的核心邏輯。有了它以后,所有企業(yè)的客戶服務(wù)系統(tǒng)都會(huì)發(fā)生重大革命。

代碼能力。幾乎每個(gè)企業(yè)都需要代碼能力,如果沒(méi)有代碼工程師,那么企業(yè)內(nèi)部任何組織流程的變化都需要找專業(yè)團(tuán)隊(duì)來(lái)修改。10月24日,訊飛星火將在代碼的各維度能力上超越ChatGPT,明年上半年對(duì)標(biāo)GPT-4。根據(jù)OpenAI構(gòu)建的代碼能力公開(kāi)測(cè)試集HumanEval顯示,星火V2.0的Python語(yǔ)言效果已接近ChatGPT。之所以進(jìn)步這么大,是因?yàn)榉椒ㄒ讶空业剑覀內(nèi)钡氖菚r(shí)間和算力。
我們的編程助手提高代碼生產(chǎn)效率,成效顯著??拼笥嶏w2000多名工程師的工具類代碼申請(qǐng)接受率在60%,代碼注釋甚至到了90%。目前綜合效率已提升15%。每天都在進(jìn)步,今年的提效會(huì)到百分之二三十以上。我認(rèn)為,如果中國(guó)軟件行業(yè)不趕快用上這樣的認(rèn)知大模型,整個(gè)行業(yè)會(huì)跟美國(guó)形成代差級(jí)的差距。
多模態(tài)能力。當(dāng)機(jī)器具備了圖像、視頻、語(yǔ)音、文字等能力,它會(huì)帶來(lái)很多幫助。一是在教育、醫(yī)療、司法這些領(lǐng)域可以識(shí)別圖像、文字、看影像結(jié)構(gòu);二是在工業(yè)領(lǐng)域可以自動(dòng)看懂工業(yè)場(chǎng)景,比如在什么地方擺放螺絲釘、如何快速布局和找到庫(kù)房資源,等等;三是在家庭領(lǐng)域,人口老齡化之后,如果沒(méi)有陪伴機(jī)器人進(jìn)入家庭,社會(huì)幸福是沒(méi)法保障的。陪伴機(jī)器人進(jìn)入家庭必須要充分了解家庭的各種設(shè)施,這需要通過(guò)多模態(tài)能力來(lái)實(shí)現(xiàn)和提升。我們本次升級(jí)的認(rèn)知大模型極大地提升了多模態(tài)能力,對(duì)整個(gè)工業(yè)自動(dòng)化生產(chǎn)及家庭陪伴機(jī)器人而言,將開(kāi)辟全新時(shí)代。

如果大家用訊飛星火發(fā)朋友圈會(huì)感到很幸福,因?yàn)樗梢越o隨便一張照片配出有意思文案。如果企業(yè)想要寫(xiě)一個(gè)海外文案,訊飛星火也可以用幾分鐘的時(shí)間做出來(lái),并且還會(huì)生成一個(gè)虛擬形象進(jìn)行播報(bào)。如果畫(huà)面不夠,機(jī)器還能自動(dòng)補(bǔ)齊需要的畫(huà)面。這只是制作方面的例子,我認(rèn)為多模態(tài)能力更重要是,在理解上對(duì)工業(yè)和家庭等場(chǎng)景進(jìn)行賦能。比如我們的“星火語(yǔ)伴2.0”,能夠進(jìn)行主題對(duì)話、虛擬人對(duì)話,重點(diǎn)升級(jí)虛擬人模考能力和基于多模態(tài)技術(shù)的自定義情景對(duì)話能力,可用AI實(shí)現(xiàn)真人式陪練。
最后,我講一下認(rèn)知大模型如何在行業(yè)內(nèi)落地應(yīng)用。第一要安全可控,確保內(nèi)容安全、算力安全;第二要場(chǎng)景驅(qū)動(dòng),真正產(chǎn)生價(jià)值;第三,形成自己的專屬模型。
其中,大模型的“內(nèi)容安全”涉及兩個(gè)問(wèn)題。一是污語(yǔ)料問(wèn)題。如果大模型學(xué)習(xí)的語(yǔ)料中有不良信息,那么如何防止它對(duì)外傳輸,如何濾掉不良信息?這是一個(gè)很大的挑戰(zhàn),如果只學(xué)中國(guó)知識(shí),那么這個(gè)大模型就無(wú)法代表國(guó)家參與全球競(jìng)爭(zhēng),要想把它變聰明,必須要學(xué)習(xí)全世界的知識(shí),而國(guó)外的價(jià)值觀和我們有差異,一旦觸碰到,就會(huì)面臨服務(wù)器被關(guān)掉的風(fēng)險(xiǎn)。所以,一定要有很強(qiáng)的“清洗”能力。我認(rèn)為,科大訊飛的語(yǔ)音及語(yǔ)言國(guó)家工程技術(shù)中心就能很好解決這個(gè)問(wèn)題。
二是幻覺(jué)。大模型最大的特點(diǎn)在于它什么都懂,但有些時(shí)候也會(huì)一本正經(jīng)地胡說(shuō)八道。怎么解決大模型的幻覺(jué)?就是要用通用知識(shí)庫(kù)結(jié)合行業(yè)知識(shí)庫(kù),以及人民日?qǐng)?bào)等語(yǔ)料,針對(duì)各類型任務(wù)構(gòu)建專業(yè)知識(shí)庫(kù),以類搜索插件技術(shù)實(shí)現(xiàn)知識(shí)獲取,基于大模型的理解和概括摘要能力給出答案。
除了內(nèi)容安全,還有算力問(wèn)題。很多人疑問(wèn),中國(guó)的人工智能是不是被“卡脖子”了?我特別自豪地告訴大家,現(xiàn)在華為的GPU能力已經(jīng)對(duì)標(biāo)英偉達(dá)A100了。要知道,2022年10月7日,美國(guó)對(duì)中國(guó)極限施壓,當(dāng)時(shí)中國(guó)無(wú)法購(gòu)買A100,只能買英格或者A800。過(guò)去一段時(shí)間,就是因?yàn)樗阕訋?kù)不全,所以綜合效率還有一定提升空間和差距,但我們現(xiàn)在基本解決了這個(gè)問(wèn)題。
8月15日,科大訊飛和華為聯(lián)合發(fā)布了星火一體機(jī)。這意味著,任何企業(yè)都可以在我們的平臺(tái)上做訓(xùn)練、做推理,這非常了不起。以前的“百模大戰(zhàn)”基本只能在內(nèi)部做微小的調(diào)優(yōu)和訓(xùn)練,現(xiàn)在,我們基本解決了這個(gè)壁壘。今年,科大訊飛定了一個(gè)目標(biāo),即10月24日實(shí)現(xiàn)對(duì)標(biāo)ChatGPT,中文全面超越,英文與它相當(dāng)。坦白講,現(xiàn)在距離這個(gè)目標(biāo)還有差距,但我們相信10月份就能趕上。明年上半年科大訊飛將對(duì)標(biāo)GPT4,在算法上我們有信心,在算力上,有華為這樣的公司去突破和努力。我們正在跟華為聯(lián)合打造面向超大模型訓(xùn)練的集群優(yōu)勢(shì),我們有信心在算力領(lǐng)域不被“卡脖子”,通用人工智能的應(yīng)用成效上也可以跟OpenAI直接對(duì)標(biāo)。
在這個(gè)過(guò)程中,我們還做了場(chǎng)景驅(qū)動(dòng)。為了讓大家立足于自己的內(nèi)部應(yīng)用場(chǎng)景,我們提供了豐富的開(kāi)發(fā)平臺(tái)和各種典型場(chǎng)景包,從客服、辦公、運(yùn)營(yíng)到研發(fā),等等。
那么,行業(yè)龍頭企業(yè)應(yīng)該如何運(yùn)用大模型?底層大模型其實(shí)是由我們來(lái)完成,我認(rèn)為到明年,中國(guó)的大模型最多剩下幾家,但一定要有人能對(duì)標(biāo)OpenAI。龍頭企業(yè)一定保證每一行代碼和算法都是自己構(gòu)建出來(lái)的,因?yàn)槟愀静磺宄_(kāi)源模型原來(lái)的語(yǔ)料是從哪里訓(xùn)練出來(lái)的,而且它不利于企業(yè)進(jìn)步。
在數(shù)字經(jīng)濟(jì)時(shí)代,數(shù)字化轉(zhuǎn)型是每個(gè)企業(yè)必須做的事。以前,企業(yè)通過(guò)人工智能中臺(tái)、數(shù)據(jù)中臺(tái)和企業(yè)級(jí)知識(shí)庫(kù)構(gòu)建企業(yè)大腦,下一步,如果不用通用人工智能構(gòu)建企業(yè)大腦,絕對(duì)會(huì)落后一個(gè)檔次。所以,我認(rèn)為大家應(yīng)提前布局,在安全可控的前提下構(gòu)建企業(yè)自主可進(jìn)化的企業(yè)大腦。
這種布局還需要?jiǎng)佑煤蒙鷳B(tài)的力量。5月6日以來(lái),科大訊飛人工智能開(kāi)放平臺(tái)新增了96萬(wàn)名實(shí)名認(rèn)證的開(kāi)發(fā)者,6月9日以來(lái),星火小助手用戶創(chuàng)建數(shù)超1萬(wàn)。我們還跟行業(yè)龍頭進(jìn)行合作,給行業(yè)龍頭賦能后按照合作共贏的模式產(chǎn)生新增加值。
我特別希望借助亞布力論壇這個(gè)平臺(tái),讓中國(guó)企業(yè)在各個(gè)領(lǐng)域,將數(shù)據(jù)、算力、算法聯(lián)通起來(lái),形成我們自己的生態(tài)優(yōu)勢(shì),共同打贏這場(chǎng)通用人工智能時(shí)代的產(chǎn)業(yè)升級(jí)之戰(zhàn),共同解放生產(chǎn)力、釋放想象力。
我要收藏
點(diǎn)個(gè)贊吧
轉(zhuǎn)發(fā)分享
咨詢?cè)斍椋?/strong>如需咨詢文中涉及的相關(guān)產(chǎn)品或解決方案詳情,請(qǐng)加微信:ZiDongHuaX 。
微信聯(lián)盟:劉慶峰微信群、亞布力論壇微信群、人工智能微信群、機(jī)器人微信群,各細(xì)分行業(yè)微信群:點(diǎn)擊這里進(jìn)入。
鴻達(dá)安視:水文水利在線監(jiān)測(cè)儀器、智慧農(nóng)業(yè)在線監(jiān)測(cè)儀器 查看各品牌在細(xì)分領(lǐng)域的定位宣傳語(yǔ)
微信聯(lián)盟:劉慶峰微信群、亞布力論壇微信群、人工智能微信群、機(jī)器人微信群,各細(xì)分行業(yè)微信群:點(diǎn)擊這里進(jìn)入。
鴻達(dá)安視:水文水利在線監(jiān)測(cè)儀器、智慧農(nóng)業(yè)在線監(jiān)測(cè)儀器 查看各品牌在細(xì)分領(lǐng)域的定位宣傳語(yǔ)


評(píng)論排行