【ZiDongHua 之“創(chuàng)新自化成”收錄關(guān)鍵詞: 相芯 FaceUnity 人工智能 數(shù)字人】
  
  相芯受邀參展2025人工智能創(chuàng)新創(chuàng)業(yè)大會,展示AI數(shù)字人創(chuàng)新成果
  
  7月11日至12日,由中國人工智能學(xué)會、杭州市拱墅區(qū)人民政府、中歐人才交流與創(chuàng)新合作中心聯(lián)合主辦的“智匯運河·智算未來”人工智能創(chuàng)新創(chuàng)業(yè)大賽總決賽暨2025人工智能創(chuàng)新創(chuàng)業(yè)大會成功舉辦。相芯科技作為數(shù)字人行業(yè)的領(lǐng)先企業(yè)受邀參展,集中展示了AI數(shù)字人創(chuàng)新成果,為智能時代的新質(zhì)生產(chǎn)力培育賦能助力。
  
  在展區(qū)現(xiàn)場,相芯通過“實時演示+互動體驗”形式,重點呈現(xiàn)了AI卡通數(shù)字人的核心能力。該數(shù)字人基于自研平臺Avatar X構(gòu)建,依托弱輸入智能建模及多模態(tài)自然交互技術(shù),可一鍵生成高度個性化、可實時交互的3D卡通數(shù)字化身。
  
  其具體優(yōu)勢在于創(chuàng)建迅速,僅需上傳或拍攝一張肖像照片,3秒即可生成數(shù)字形象,并支持捏臉、換裝等二次創(chuàng)作,還能借助文本、語音、單目攝像頭等多模態(tài)方式實現(xiàn)流暢自然的交互。同時,其具備出色的跨設(shè)備適配性,可在手機、大屏、智能眼鏡、VR/AR頭盔等多種終端流暢運行,目前已廣泛應(yīng)用于社交、直播、短視頻創(chuàng)作等多元場景。
 
  
  全棧自研技術(shù)
  
  推動數(shù)字人智能化升級
  
  作為數(shù)字人領(lǐng)域的領(lǐng)先企業(yè),相芯以“元宇宙搭建者”為愿景,專注元宇宙數(shù)字基建,通過AI+圖形學(xué)技術(shù)打造高擬真數(shù)字人,推動千行百業(yè)的數(shù)字化轉(zhuǎn)型升級進程。
  
  完整的全棧自研技術(shù)體系是相芯AI數(shù)字人產(chǎn)品體系的底層支撐。基于自研的Avatar X數(shù)字人平臺,相芯掌握了數(shù)字人建模、驅(qū)動、交互、渲染全鏈路技術(shù),涵蓋弱輸入智能建模、全要素角色動畫、多模態(tài)自然交互和輕量化實時渲染,實現(xiàn)了“算法-引擎-硬件”全棧自研。
  
  在此基礎(chǔ)上,面對人工智能技術(shù)快速迭代的大背景,相芯緊跟前沿趨勢,深度融合數(shù)字人與大模型、多模態(tài)等領(lǐng)域的創(chuàng)新技術(shù),持續(xù)提升數(shù)字人的智能交互、自主決策、高效協(xié)同等能力。
  
  一方面,相芯AI數(shù)字人具備卓越的交互靈活性與表現(xiàn)力。如大會現(xiàn)場展示的卡通數(shù)字人,動作、表情與聲音表現(xiàn)靈動,交互效果流暢自然。這得益于多模態(tài)技術(shù)的支持,使數(shù)字人能夠在語音、文字交互的同時,結(jié)合攝像頭對用戶的表情、動作進行識別,實現(xiàn)更擬人化、智能化和個性化的交互體驗。
  
  其可以應(yīng)用在車機場景,通過微笑、閑聊、唱歌等擬人化交互方式,打造可視化、有溫度的用戶體驗,并支持用戶自由調(diào)整形象、配飾,創(chuàng)作專屬的個性化助手,目前已為多家新能源車企提供數(shù)字化賦能,全面提升智能座艙交互性能。
 
  
  另一方面,相芯AI數(shù)字人具備真人級的感知思考與實時應(yīng)變能力。以視頻數(shù)字人為例,依托深度強化學(xué)習(xí)和大模型技術(shù),其不僅能夠1:1復(fù)刻真人的形象、表情和聲音,還突破了傳統(tǒng)數(shù)字人僅能執(zhí)行預(yù)設(shè)任務(wù)的局限,能夠像真人一樣理解、規(guī)劃和行動。
  
  例如,相芯的客服數(shù)字人可學(xué)習(xí)用戶歷史咨詢記錄和反饋信息,從而提供更準確、及時的個性化服務(wù);主播數(shù)字人可自主分析提問頻率、商品點擊熱度等數(shù)據(jù),靈活進行播中調(diào)度和智能互動問答。目前已經(jīng)廣泛應(yīng)用在5G新通話、電商直播等領(lǐng)域,顯著提升服務(wù)效率與用戶滿意度。
  
  破局行業(yè)痛點
  
  推進數(shù)字人規(guī)?;瘧?yīng)用
  
  在推進數(shù)字人技術(shù)落地過程中,相芯發(fā)現(xiàn)不同行業(yè)對數(shù)字人的功能、形象、交互邏輯需求差異顯著。對于互娛行業(yè),需要高辨識度、強表現(xiàn)力的卡通或超寫實數(shù)字人進行用戶互動;電商直播則需具備真人級表現(xiàn)力,且成本低、制作周期短的視頻數(shù)字人以實現(xiàn)降本增效。
  
  如何用數(shù)字人解決實際難題,真正賦能千行百業(yè)?
  
  在橫向布局上,相芯基于完整閉環(huán)的技術(shù)體系,針對不同行業(yè)場景打造了業(yè)內(nèi)最全的AI數(shù)字人產(chǎn)品矩陣,包括卡通數(shù)字人、視頻數(shù)字人、超寫實數(shù)字人、仿真數(shù)字人、全真數(shù)字人五大品類,精準匹配各行業(yè)的跨場景需求,推進數(shù)字人規(guī)?;瘧?yīng)用。
  
  不僅如此,相芯進一步縱向深挖,聚焦生產(chǎn)力場景中的人力成本高企與重復(fù)勞動負擔(dān),以及生活場景中的情感陪伴缺失與互動娛樂需求缺口兩大痛點,形成標準化、智能化的數(shù)字人解決方案,實現(xiàn)生產(chǎn)力的效率革新與生活體驗的全面躍升。
 
  
  從生產(chǎn)力場景來看,針對電商行業(yè)主播成本高、直播時長受限的痛點,相芯推出AI直播數(shù)字人解決方案,以真人主播1/20的成本,覆蓋主播、場景、內(nèi)容、互動全鏈路,助力商家打造7×24小時智能直播間。雙11期間,某3C品牌客戶單場直播即超千萬GMV。此外,作為淘寶官方認證的頭部服務(wù)商,相芯持續(xù)領(lǐng)跑直播場次與GMV雙指標。
  
  而針對生活場景,為滿足Z世代用戶對智能設(shè)備情感化、娛樂化的升級需求,相芯為手機廠商打造了用于社交互動和個性表達的個人數(shù)字化身,以及用于深度對話陪伴與場景化生活建議的智能手機助手,增強交互性與玩法多樣性。該方案已應(yīng)用于多家國產(chǎn)手機品牌的眾多機型,顯著提升用戶黏性與品牌差異度,累計裝機量近10億臺,成為終端廠商搶占年輕市場的核心利器。
  
  目前,相芯AI數(shù)字人已在手機、汽車、金融、電商、互娛等20余個垂直領(lǐng)域成功落地,服務(wù)全球2000余家客戶,覆蓋200多個國家和地區(qū)。
  
  此次亮相2025人工智能創(chuàng)新創(chuàng)業(yè)大會,是相芯在AI數(shù)字人領(lǐng)域探索的重要成果展示,充分彰顯了公司在技術(shù)創(chuàng)新與實踐應(yīng)用方面的領(lǐng)先優(yōu)勢。未來,相芯將持續(xù)深化數(shù)字人與人工智能技術(shù)的融合創(chuàng)新,與行業(yè)伙伴共同開啟“便捷化、精細化、智能化”的數(shù)字人新時代。