【ZiDongHua 之人文化天下收錄關(guān)鍵詞: 漢王科技 人工智能 高質(zhì)量發(fā)展
  
  數(shù)字力量護(hù)文化 人工智能守遺風(fēng)|漢王科技龐素蕾入選“北京榜樣·最美互聯(lián)網(wǎng)從業(yè)者”提名
  
  近日,北京市委互聯(lián)網(wǎng)企業(yè)工委啟動“北京榜樣·最美互聯(lián)網(wǎng)從業(yè)者”評選活動,經(jīng)過推薦、考察、專家評審等環(huán)節(jié)嚴(yán)格甄選,漢王科技數(shù)據(jù)產(chǎn)品經(jīng)理龐素蕾、小米集團黨委常務(wù)副書記、工會主席、婦工委主任施艷、快手科技黨委副書記、副總裁徐靜蕓和360數(shù)字安全集團總裁胡振泉、58同城(集團)副總裁、黨委書記胡迪等30名互聯(lián)網(wǎng)優(yōu)秀工作者獲得 “北京榜樣·最美互聯(lián)網(wǎng)從業(yè)者”提名。
  
  以下內(nèi)容是《北京日報》對漢王科技數(shù)據(jù)產(chǎn)品經(jīng)理龐素蕾的介紹:  片
  
  龐素蕾在2006年大學(xué)畢業(yè)后進(jìn)入漢王科技股份有限公司工作至今,先后負(fù)責(zé)手寫識別、OCR和人臉等數(shù)據(jù)建設(shè)與產(chǎn)品研發(fā),目前擔(dān)任大模型數(shù)據(jù)產(chǎn)品經(jīng)理,負(fù)責(zé)大模型數(shù)據(jù)與安全工作。龐素蕾深耕人工智能領(lǐng)域近二十年,為公司和社會創(chuàng)造了大量經(jīng)濟效益,為保護(hù)與傳承中華傳統(tǒng)文化做出重要貢獻(xiàn)。她曾獲漢王科技優(yōu)秀共產(chǎn)黨員、十佳員工等榮譽,獲得系統(tǒng)集成項目經(jīng)理、NPDP、ACP等資質(zhì)。
  
  一、保護(hù)語言,少數(shù)民族文字走向互聯(lián)網(wǎng)
  
  龐素蕾入職時,漢王科技的手寫識別和OCR技術(shù)獲得了國家科技進(jìn)步一等獎和二等獎。但當(dāng)時少數(shù)民族文字的手寫識別還是空白,少數(shù)民族同胞只能通過紙筆進(jìn)行傳承。怎么能讓這些資料電子化、用于互聯(lián)網(wǎng),是她面對的第一個難題。龐素蕾在新疆時就體會到維吾爾族語言的美麗與寶貴。她接到任務(wù),第一個想到的就是回到家鄉(xiāng)收集維語文字手寫數(shù)據(jù),幫助鄉(xiāng)親們用上維語手寫輸入法。她立刻聯(lián)系了幾所學(xué)校的老師開展維語手寫數(shù)據(jù)收集工作。當(dāng)她回到家鄉(xiāng),一位老師熱情地握住她的手說:“我們一直想讓維語文字資料電子化,可是輸入實在太困難了!”龐素蕾體會到鄉(xiāng)親們迫切的心情,收集完數(shù)據(jù)后就立馬趕回北京。經(jīng)過不懈努力,她和同事們終于一起研發(fā)出維語手寫識別輸入法,解決了維吾爾族同胞輸入難的問題。她接著收集了新疆地區(qū)多種語言文本數(shù)據(jù)用于OCR研發(fā),這些珍貴數(shù)據(jù)也促成了“維哈柯語言文字軟件開發(fā)及產(chǎn)業(yè)化”項目立項,為少數(shù)民族發(fā)展做出重要貢獻(xiàn)。
  
 
  
  后續(xù),龐素蕾又開始收集其他少數(shù)民族文字?jǐn)?shù)據(jù)。少數(shù)民族文字結(jié)構(gòu)復(fù)雜、使用人數(shù)少、資料匱乏,為解決數(shù)據(jù)不足的棘手問題,龐素蕾親自深入甘肅、吉林、四川等地收集數(shù)據(jù)。路途遙遠(yuǎn),過程艱辛,但她不畏艱苦,一心只想把工作做好。采集朝鮮語時正值冬季,她到吉林的第二天就被寒冷的天氣凍感冒了,一度發(fā)燒到39℃。但為了盡快完成任務(wù),她依然堅持在第一線,帶病完成數(shù)據(jù)采集。后續(xù)她帶領(lǐng)團隊收集了彝族、藏族等少數(shù)民族的手寫樣本和文字資料,總數(shù)達(dá)上百萬字。這些寶貴的數(shù)據(jù)用于“中華字庫項目”中“漢字和少數(shù)民族文字的手寫輸入法”研發(fā)。研發(fā)工作取得了巨大突破,研究成果打破了少數(shù)民族文字與互聯(lián)網(wǎng)之間的壁壘,讓中華各民族使用文字更加便捷高效,讓中華文明的傳播更加廣泛深遠(yuǎn)。
  
  二、發(fā)揚文化,小語種文字建立傳播渠道
  
  中華文化既要傳下來,也要走出去。2008年北京舉辦奧運會開始,中國和世界有了更加緊密的交流。龐素蕾也開始了讓傳統(tǒng)文化“走出去”的工作。
  
  她帶領(lǐng)團隊陸續(xù)收集了德語、俄語、印地語等十幾種小語種文字?jǐn)?shù)據(jù),數(shù)據(jù)量超過千萬字。很多外國人喜歡左手寫字,與右手書寫的筆跡有所差別,為提升手寫算法在海外產(chǎn)品中的識別率,她利用周末到名勝古跡找外國人采集數(shù)據(jù)。這些數(shù)據(jù)幫助漢王科技的手寫識別與OCR擴展至數(shù)十種文字。在這些數(shù)據(jù)的基礎(chǔ)上,漢王科技成功立項兩項國家級新一代人工智能重大項目,在國家安全、文化傳播領(lǐng)域做出了卓越貢獻(xiàn)。
  
  工作之外,龐素蕾也致力于中國文化的保護(hù)與宣傳。她在采集時認(rèn)識了不少外國朋友,閑暇時她會帶著外國朋友到北京文化景點,為他們講解中國的傳統(tǒng)文化。“采集小語種數(shù)據(jù)能讓我們與其他國家建立更順暢的交流,我也希望中國的文化可以通過這些語言傳遞到世界上許多不同的國家。”
  
  三、傳承歷史,歷史古籍重獲數(shù)智化生命
  
  2022年,ChatGPT掀起人工智能新浪潮,漢王科技選擇將大模型技術(shù)與我國傳統(tǒng)文化相結(jié)合。龐素蕾勇于擔(dān)當(dāng),投入到漢王天地大模型的研發(fā)工作,迅速組建大模型專項數(shù)據(jù)組,快速開發(fā)高效的數(shù)據(jù)標(biāo)注平臺,制定嚴(yán)謹(jǐn)?shù)墓芾砹鞒?,向算法團隊提供高質(zhì)量的訓(xùn)練數(shù)據(jù),包括歷史、古文、水墨畫等。
  
 
  
  開始時,模型對歷史人物關(guān)系的理解存在錯誤,這是因為模型中的歷史數(shù)據(jù)混雜在大量的自然數(shù)據(jù)中,信息被稀釋,模型不能精準(zhǔn)提取與問題相關(guān)的數(shù)據(jù)。為解決該問題,龐素蕾帶領(lǐng)團隊構(gòu)建了完善的知識圖譜,矯正了數(shù)萬條歷史人物數(shù)據(jù)。不斷地優(yōu)化迭代,讓漢王天地大模型成為了“歷史百事通”,讓中國青少年可以用嶄新的方式了解、喜歡與傳播中國歷史。
  
  在龐素蕾和同事的努力下,漢王天地大模型通過了互聯(lián)網(wǎng)信息服務(wù)算法備案、生成式人工智能服務(wù)備案。龐素蕾團隊的工作促成了漢王科技成功立項國家檔案局科技項目,將大模型應(yīng)用于檔案電子化,攻關(guān)檔案高質(zhì)量發(fā)展核心問題,服務(wù)國家重大發(fā)展戰(zhàn)略;輔助漢王科技與國家圖書館達(dá)成合作,用AI技術(shù)賦予中華古籍?dāng)?shù)智化生命。在未來,龐素蕾還會和團隊一起用大模型賦能文化與歷史傳承,讓傳統(tǒng)文化在互聯(lián)網(wǎng)時代煥發(fā)新生。
  
  面對互聯(lián)網(wǎng)行業(yè)快速更新迭代,龐素蕾作為一名擁有18年黨齡的中共黨員、一名熱愛AI行業(yè)的互聯(lián)網(wǎng)從業(yè)者,勇于擔(dān)當(dāng)、默默奉獻(xiàn)、磨礪技術(shù),從少數(shù)民族文字到小語種,再到大模型,龐素蕾為公司打造了堅實的數(shù)據(jù)基礎(chǔ),為國家文化保護(hù)、傳承與發(fā)展貢獻(xiàn)了自己的力量。她在互聯(lián)網(wǎng)行業(yè)、人工智能領(lǐng)域真正做到科技報國,產(chǎn)業(yè)興邦。
  
 ?。▋?nèi)容來源:北京日報)