平安科技自動化機器學習奧卡姆平臺研究成果正式亮相國際ICONIP會議
近日,第二十六屆ICONIP國際神經信息處理學術會議(The 26th International Conference on Neural Information Processing, ICONIP)在澳大利亞悉尼召開,平安科技自動化機器學習平臺(AutoML)——奧卡姆Occam平臺研究成果《On Probability Calibration of Recurrent Text Recognition Network》正式亮相,并受邀在大會上進行主題演講。這是繼在斯坦福大學深度學習推理DAWNBench競賽獲得冠軍、獲得2019年CCF科學技術獎科技進步杰出獎后,平安科技奧卡姆平臺的又一項重大突破。

ICONIP會議是由亞太神經網絡協(xié)會APNNS(Asia-Pacific Neural Network Society)主辦的人工智能神經網絡領域最重要的會議之一。本次會議特別邀請到了神經網絡領域權威專家David Powers 和 Bao-Liang Lu等嘉賓出席并進行主題分享,并匯聚了來自世界各地從事人工智能理論和應用研究的頂尖研究人員,共同分享國際人工智能研究領域的最新理論和技術成果。會議共收到1200+篇來自世界頂尖學府和科研機構的論文投稿,最終錄用337篇,會議錄用率僅為27.4%,而受到邀請進行主題演講的文章更是屈指可數(shù)。
平安科技奧卡姆平臺研究成果《On Probability Calibration of Recurrent Text Recognition Network》是由平安集團首席科學家肖京博士指導,平安科技副總工程師王健宗博士作為論文的通訊作者,在會議錄用的337篇論文中脫穎而出,并受邀成為口頭報告論文。
奧卡姆平臺這篇論文針對OCR識別中未分段文本識別模型中的校準異常問題,創(chuàng)新性地將順序文字識別網絡(SRN)與校準卷積神經網絡(Calibration CNN)相結合,提出了一種將未分段文本轉化為單個字符并進行識別校準的新型算法。不同于傳統(tǒng)算法針對一段文字中所有樣本均采用相同的模型參數(shù)的方式,奧卡姆采用的算法將未分段文本中的每個文字提取出來,雖然仍采用相同的識別模型,但是憑借奧卡姆平臺計算能力極強的優(yōu)勢,可以并對不同的個體文字自適應地選擇不同的校正參數(shù),調整每個文字識別結果的置信度輸出,從而降低置信度的誤差。而在此論文成果的真實應用中,通過使用奧卡姆平臺,高效、快速地在三個樣本集中試驗了五種不同的CNN參數(shù)校準方式,并得出了以DenseNet結構的為基礎的最佳識別校準算法。
本論文的研究成果可利用在金融、保險、醫(yī)療等領域對卡證、財務票據(jù)等信息進行智能識別錄入。以智能投保場景為例,用戶可利用論文中的技術,對駕駛證、行駛證等證件上的未分段信息進行識別,實現(xiàn)車主信息的自動識別和錄入。在手機移動投保、信息核實等過程中有效提升運營效率,優(yōu)化用戶體驗。定義全新的AI開發(fā)模式,Occam平臺屢獲殊榮
Occam平臺是平安集團研發(fā)的搭建在大規(guī)模GPU集群上的一站式AI開發(fā)平臺,為用戶提供了從數(shù)據(jù)處理、算法開發(fā)、模型訓練、模型優(yōu)化到模型推理的全周期AI工作流,并且包含數(shù)據(jù)標注、數(shù)據(jù)增強、多元模型自動搜索、超參優(yōu)化、模型自動壓縮、圖神經網絡、聯(lián)邦學習、難例自動發(fā)現(xiàn)等多種特色工具和服務。
2019年,Occam平臺的多項優(yōu)秀成果得到國內計算機領域權威學術團體的肯定。不僅首次榮獲“2019年CCF科學技術獎科技進步杰出獎”,還在斯坦福大學深度學習推理DAWNBench競賽中,力壓由康奈爾大學和谷歌組成的豪華聯(lián)隊,以7.579毫秒的驚人成績勇奪冠軍。
當前Occam平臺已落地平安產險,并為平安聲紋、AI音樂、智能視覺等多個AI團隊項目提供平臺支持。例如:Occam平臺實現(xiàn)了首個基于神經架構搜索的聲紋識別模型Auto-Vector,只需要30GPUh就可以在VCTK數(shù)據(jù)集搜索一個高精度聲紋識別模型,其效果遠超過如Xvector、LSTM-GE2E等最先進的頂級專家設計的聲紋模型,并且聲紋模型訓練最高可達到90%的訓練提速。

ICONIP會議是由亞太神經網絡協(xié)會APNNS(Asia-Pacific Neural Network Society)主辦的人工智能神經網絡領域最重要的會議之一。本次會議特別邀請到了神經網絡領域權威專家David Powers 和 Bao-Liang Lu等嘉賓出席并進行主題分享,并匯聚了來自世界各地從事人工智能理論和應用研究的頂尖研究人員,共同分享國際人工智能研究領域的最新理論和技術成果。會議共收到1200+篇來自世界頂尖學府和科研機構的論文投稿,最終錄用337篇,會議錄用率僅為27.4%,而受到邀請進行主題演講的文章更是屈指可數(shù)。
平安科技奧卡姆平臺研究成果《On Probability Calibration of Recurrent Text Recognition Network》是由平安集團首席科學家肖京博士指導,平安科技副總工程師王健宗博士作為論文的通訊作者,在會議錄用的337篇論文中脫穎而出,并受邀成為口頭報告論文。
奧卡姆平臺這篇論文針對OCR識別中未分段文本識別模型中的校準異常問題,創(chuàng)新性地將順序文字識別網絡(SRN)與校準卷積神經網絡(Calibration CNN)相結合,提出了一種將未分段文本轉化為單個字符并進行識別校準的新型算法。不同于傳統(tǒng)算法針對一段文字中所有樣本均采用相同的模型參數(shù)的方式,奧卡姆采用的算法將未分段文本中的每個文字提取出來,雖然仍采用相同的識別模型,但是憑借奧卡姆平臺計算能力極強的優(yōu)勢,可以并對不同的個體文字自適應地選擇不同的校正參數(shù),調整每個文字識別結果的置信度輸出,從而降低置信度的誤差。而在此論文成果的真實應用中,通過使用奧卡姆平臺,高效、快速地在三個樣本集中試驗了五種不同的CNN參數(shù)校準方式,并得出了以DenseNet結構的為基礎的最佳識別校準算法。
本論文的研究成果可利用在金融、保險、醫(yī)療等領域對卡證、財務票據(jù)等信息進行智能識別錄入。以智能投保場景為例,用戶可利用論文中的技術,對駕駛證、行駛證等證件上的未分段信息進行識別,實現(xiàn)車主信息的自動識別和錄入。在手機移動投保、信息核實等過程中有效提升運營效率,優(yōu)化用戶體驗。定義全新的AI開發(fā)模式,Occam平臺屢獲殊榮
Occam平臺是平安集團研發(fā)的搭建在大規(guī)模GPU集群上的一站式AI開發(fā)平臺,為用戶提供了從數(shù)據(jù)處理、算法開發(fā)、模型訓練、模型優(yōu)化到模型推理的全周期AI工作流,并且包含數(shù)據(jù)標注、數(shù)據(jù)增強、多元模型自動搜索、超參優(yōu)化、模型自動壓縮、圖神經網絡、聯(lián)邦學習、難例自動發(fā)現(xiàn)等多種特色工具和服務。
2019年,Occam平臺的多項優(yōu)秀成果得到國內計算機領域權威學術團體的肯定。不僅首次榮獲“2019年CCF科學技術獎科技進步杰出獎”,還在斯坦福大學深度學習推理DAWNBench競賽中,力壓由康奈爾大學和谷歌組成的豪華聯(lián)隊,以7.579毫秒的驚人成績勇奪冠軍。
當前Occam平臺已落地平安產險,并為平安聲紋、AI音樂、智能視覺等多個AI團隊項目提供平臺支持。例如:Occam平臺實現(xiàn)了首個基于神經架構搜索的聲紋識別模型Auto-Vector,只需要30GPUh就可以在VCTK數(shù)據(jù)集搜索一個高精度聲紋識別模型,其效果遠超過如Xvector、LSTM-GE2E等最先進的頂級專家設計的聲紋模型,并且聲紋模型訓練最高可達到90%的訓練提速。
我要收藏
點個贊吧
轉發(fā)分享
評論排行