高通Qualcomm日前推出Smart Speaker智能音箱方案,基於APQ8009系統級晶片(SoC),通過高度回應的語音啟動(Voice Ac
tivity Detection)與波束成形(Beamforming)技術,提供先進的多麥克風遠場語音功能(Far-Field Voice),並獨特地結合了處理能力、語音使用者介面選項等頂級音訊技術。
麥克風是這些技術裡不可或缺的關鍵硬體
元件,在APQ8009參考設計中,圓形的麥克風陣列板提供了豐富功能:
•支援兩種數位麥克風元件(TDM mic / PDM mic)
•7顆分時多工TDM(Time-Division Multiplexed)數位麥克風,六角形排列(1顆置於正中央),預設給遠場語音功能使用
•4顆脈衝密度調變PDM(Pulse-Density Modulation)數位麥克風,方形排列
•2顆脈衝密度調變PDM數位麥克風,預設給BT語音功能使用
•5個按鍵(Power/Vol+/Vol-/Activate/Mute)
•16顆RGB LEDs環形排列,以及LED控制器
•1顆Mute指示LED
經過改良後的麥克風陣列板如下:
【我們的設計改良概念與項目】
1. 麥克風的選擇原則
數位麥克風的訊號輸出有兩種調變格式
(a)
I2S mic / TDM mic使用的脈衝編碼調變
PCM(Pulse-Code Modulation),是最早且最普遍的數位音訊格式。I2S介面在音頻領域非常通用常見,但一條data line最多只支援2 channels(即兩顆麥克風),若要在同一條data line擴充使用更多channels就必須使用分時多工TDM方式,然而業界各家廠商有不同技術協定來實現TDM,並未如I2S介面有較統一通用的標準協定。
(b)
PDM mic使用的脈衝密度調變
PDM(Pulse-Density Modulation),元件設計較簡單、有良好的抗干擾特性,在目前的數位麥克風應用上成為主流,成為很多人口中「DMIC(數位麥克風)」的代名詞。PDM介面中一條data line最多只支援2 channels,無法擴充。
由於開發、評估與音質調適上的需要,我們同時保留了這兩種數位訊號格式的麥克風。為了提供高品質的智能音箱語音功能,更重要的是麥克風的規格選擇,須注意以下幾點:
•作為遠場語音、波束成型功能使用的麥克風陣列,建議全部是同一型號料件,以確保相同的靈敏度Sensitivity與頻率響應Frequency Response(誤差+/- 3 dB)
•訊號雜訊比SNR越高越好(>64dB)
•麥克風元件的運作時脈Clock Frequency能在平台上被支援
•麥克風陣列的擺放盡量對稱
•麥克風陣列的機構條件盡量一致(比如機構開孔、封裝方式一致)
2. 料件成本與備料考量
相對於目前主流的PDM mic,由於TDM mic各家廠商技術不同,價差及備料考量成為很大的難題,尤其是原始參考設計所使用的7顆TDM mic ICS-52000,不僅價格較貴、庫存備料上也有較大困難。
台灣MEMS麥克風龍頭大廠 鈺太科技Zilltek有優異的麥克風模組技術,包含自行開發的ASIC與感測器,不管是製程、價格與備料方面都有優勢。TDM mic我們選擇ZTS6672,PDM mic則選擇ZTS6572S,在規格、效能各方面表現均能滿足原始設計需求。
3. TDM mics鏈接方式修改
原始參考設計所使用的TDM mic ICS-52000採用Daisy-chain串聯觸發方式,其Word Select(WS)訊號線由系統端主控制器觸發後,排列#1的麥克風元件開始輸出音頻資料,待其輸出時段結束後,#1麥克風需透過Word Select Out(WSO)觸發#2麥克風進行輸出,以此類推。我們不難發現此鏈接方式的缺點,只要鏈中某顆麥克風元件發生問題,其後的所有麥克風元件皆無法被觸發輸出。
TDM mic選擇改用Zilltek ZTS6672後,所有麥克風元件皆為獨立運作,連接方式如下圖:
我們只需事先設定ZTS6672的針腳準位,依據下表設定CONFIG、SEL pin,就能預先安排每顆麥克風元件所使用的輸出時段,比如將ZTS6672 #1的CONFIG、SEL pin皆pull low,該麥克風會使用TDM time slot 1輸出。當系統端主控制器觸發WS訊號後,各麥克風便依照排定的時段而輸出,不會互相影響。
改良的麥克風陣列板不僅能在APQ8009平台使用,我們也計畫讓後續推出的智能音箱平台能直接支援。此外,透過杜邦線可直接從板上connector連接至其他平台或電路板,達到兼用並滿足各種開發、評估、測試等需求。