【自動對焦:語音識別  邊緣計算】

1:語音識別是一門交叉學(xué)科。近二十年來,語音識別技術(shù)取得顯著進(jìn)步,開始從實驗室走向市場。人們預(yù)計,未來10年內(nèi),語音識別技術(shù)將進(jìn)入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務(wù)、消費電子產(chǎn)品等各個領(lǐng)域。 語音識別聽寫機(jī)在一些領(lǐng)域的應(yīng)用被美國新聞界評為1997年計算機(jī)發(fā)展十件大事之一。很多專家都認(rèn)為語音識別技術(shù)是2000年至2010年間信息技術(shù)領(lǐng)域十大重要的科技發(fā)展技術(shù)之一。 語音識別技術(shù)所涉及的領(lǐng)域包括:信號處理、模式識別、概率論和信息論、發(fā)聲機(jī)理和聽覺機(jī)理、人工智能等等。

2:邊緣計算,是指在靠近物或數(shù)據(jù)源頭的一側(cè),采用網(wǎng)絡(luò)、計算、存儲、應(yīng)用核心能力為一體的開放平臺,就近提供最近端服務(wù)。其應(yīng)用程序在邊緣側(cè)發(fā)起,產(chǎn)生更快的網(wǎng)絡(luò)服務(wù)響應(yīng),滿足行業(yè)在實時業(yè)務(wù)、應(yīng)用智能、安全與隱私保護(hù)等方面的基本需求。邊緣計算處于物理實體和工業(yè)連接之間,或處于物理實體的頂端。而云端計算,仍然可以訪問邊緣計算的歷史數(shù)據(jù)。

3:聯(lián)大品佳推出了基于MediaTek Filogic 130A(MT7933)的Wi-Fi 6 AIoT邊緣計算語音識別方案。該方案將先進(jìn)的Wi-Fi和藍(lán)牙功能與最新的語音處理和電源管理技術(shù)相結(jié)合,可為智能音箱、智能家居、家庭娛樂和汽車多媒體娛樂提供新的設(shè)計思路。

 

 

2022年3月16日,致力于亞太地區(qū)市場的領(lǐng)先半導(dǎo)體元器件分銷商---大聯(lián)大控股宣布,其旗下品佳推出基于聯(lián)發(fā)科(MediaTek)Filogic 130A(MT7933)的Wi-Fi 6 AIoT邊緣計算語音識別方案。

 

 

圖示1-大聯(lián)大品佳基于MediaTek產(chǎn)品的Wi-Fi 6 AIoT邊緣計算語音識別方案的展示板圖

全球疫情的爆發(fā)加速了數(shù)字轉(zhuǎn)型、智能物聯(lián)網(wǎng)的發(fā)展進(jìn)程。為有效對抗疫情,減少人們在日常生活中的直接觸碰,非接觸式技術(shù)被廣泛使用在各大場景中。其中,語音識別技術(shù)作為非接觸式技術(shù)的一種,其通過語音或語音命令與裝置設(shè)備進(jìn)行互動,在后疫情時代備受關(guān)注?;诖吮尘?,大聯(lián)大品佳推出了基于MediaTek Filogic 130A(MT7933)的Wi-Fi 6 AIoT邊緣計算語音識別方案。該方案將先進(jìn)的Wi-Fi和藍(lán)牙功能與最新的語音處理和電源管理技術(shù)相結(jié)合,可為智能音箱、智能家居、家庭娛樂和汽車多媒體娛樂提供新的設(shè)計思路。

 

圖示2-大聯(lián)大品佳基于MediaTek產(chǎn)品的Wi-Fi 6 AIoT邊緣計算語音識別方案的場景應(yīng)用圖

MediaTek全新無線連網(wǎng)系統(tǒng)單芯片F(xiàn)ilogic 130A(MT7933)整合了微控制器、AI引擎、Wi-Fi 6和藍(lán)牙5.2及電源管理單元(PMU)、獨立音頻數(shù)字信號處理器(DSP)等單元。其中,音頻數(shù)字信號處理器(DSP)能夠使設(shè)備制造商輕松地在其產(chǎn)品中添加語音助手和其他服務(wù)。憑借先進(jìn)的功能與高集成度,本方案可為小尺寸裝置提供節(jié)能、可靠及高效的網(wǎng)絡(luò)連接,是各類物聯(lián)網(wǎng)(IoT)裝置的極佳選擇。

不僅如此,F(xiàn)ilogic 130A所具備的語音活動檢測(VAD)技術(shù)也極具智能化。當(dāng)其在檢測到人類語音時,會自動忽略音頻中的靜音片段,從聽到人類語音后才會進(jìn)行音頻處理以達(dá)到低功耗目的。且無論是設(shè)計簡化的單一麥克風(fēng),或是多個矩陣麥克風(fēng),F(xiàn)ilogic 130A皆能進(jìn)行回音消除AEC(Acoustic Echo Cancelling)、遠(yuǎn)場處理(Far-Field Process)等功能來增強(qiáng)語音識別。

 

圖示3-大聯(lián)大品佳基于MediaTek產(chǎn)品的Wi-Fi 6 AIoT邊緣計算語音識別方案的方塊圖

除此之外,F(xiàn)ilogic 130A也支持本機(jī)語音命令,通過預(yù)先定義的語音指令,即使在無網(wǎng)絡(luò)連線、網(wǎng)絡(luò)延遲情形下,一樣能輕松通過語音命令來控制設(shè)備。如:控制燈光、音量以及播放、暫停音樂、前后首等音頻控制。

核心技術(shù)優(yōu)勢:

聯(lián)發(fā)科技MediaTek全新無線連網(wǎng)系統(tǒng)單芯片F(xiàn)ilogic 130A(MT7933),整合獨立音頻數(shù)字訊號處理器(DSP),可便捷地為產(chǎn)品增加語音助理等服務(wù)。使用的HiFi4 DSP具有3個ADC / 2 DAC和專用SRAM,可提供超低功耗、Always-On的麥克風(fēng)功能,具有語音活動檢測(VAD)和喚醒詞(Wake Word)支持功能。

大聯(lián)大品佳集團(tuán)提供全方位技術(shù)支持,從前期開發(fā)設(shè)計適合的音訊硬體、增減修改預(yù)定義的本機(jī)語音命令及調(diào)整音頻處理效能。量產(chǎn)階段的無線連接效能測試等。

方案規(guī)格:

應(yīng)用處理器:

ARM®Cortex-M33 MCU具浮點運算,運作時脈300MHz;

1MB嵌入式SRAM和8MB虛擬SRAM(PSRAM);

支持外接serial flash達(dá)16MB,支持就地執(zhí)行(XIP);

網(wǎng)絡(luò)安全硬件加密引擎包含AES、DES/3DES、SHA、ECC、TRNG;

支持47組GPIOs多工切換SPI,I2C,Aux ADC,UART,及GPIO功能;

支持12 DMA channels。

音頻數(shù)字訊號處理器(DSP):

Cadence®Tensilica®HiFi4處理器,運作時脈600MHz;

Audio Codec具有2組ADC及1組DAC;

256KB內(nèi)嵌SRAM memory;

語音活動檢測(VAD)和喚醒詞(Wake Word);

3.5mm音頻埠外接主動式喇叭。

Wi-Fi技術(shù)規(guī)格:

雙頻段IEEE 802.11 1T1R a/b/g/n/ax 5GHz及2.4GHz;

2.4G/5GHz頻帶,20MHz頻寬MCS0 ~ MCS8。

藍(lán)牙技術(shù)規(guī)格:

符合Bluetooth v5.0,傳輸速率2Mbps PHY,支持長距離Long-range及LE Advertising Extensions。

 


 

關(guān)于大聯(lián)大控股:

大聯(lián)大控股是全球第一、亞太區(qū)最大的半導(dǎo)體元器件分銷商*,總部位于臺北(TSE:3702),旗下?lián)碛惺榔健⑵芳?、詮鼎及友尚,員工人數(shù)約5,000人,代理產(chǎn)品供貨商超250家,全球80個分銷據(jù)點,2021年營業(yè)額達(dá)278.1億美金(自結(jié))。大聯(lián)大開創(chuàng)產(chǎn)業(yè)控股平臺,專注于國際化營運規(guī)模與在地化彈性,長期深耕亞太市場,以「產(chǎn)業(yè)首選.通路標(biāo)桿」為愿景,全面推行「團(tuán)隊、誠信、專業(yè)、效能」之核心價值觀,連續(xù)21年蟬聯(lián)「優(yōu)秀國際品牌分銷商獎」肯定。面臨新制造趨勢,大聯(lián)大致力轉(zhuǎn)型成數(shù)據(jù)驅(qū)動(Data-Driven)企業(yè),建置在線數(shù)字化平臺─「大大網(wǎng)」,并倡導(dǎo)智能物流服務(wù)(LaaS, Logistics as a Service)模式,協(xié)助客戶共同面對智能制造的挑戰(zhàn)。大聯(lián)大從善念出發(fā)、以科技建立信任,期望與產(chǎn)業(yè)「拉邦結(jié)派」共建大競合之生態(tài)系,并以「專注客戶、科技賦能、協(xié)同生態(tài)、共創(chuàng)時代」十六字心法,積極推動數(shù)字化轉(zhuǎn)型。