随着人们生活水平的提高,用户对产品的追求呈现多元化趋势,茶吧机作为一种新兴家电产品,深受年轻人的喜爱。但针对茶吧机这种高噪环境如何实现高识别率呢?启英泰伦针对该产品领域,开发了整套离线语音茶吧机方案,下面对该方案进行介绍。
本方案采用启英泰伦CI130X系列语音识别芯片(即CI1301、CI1302、CI1303、CI1306),此系列芯片采用240MHz高主频,更大SRAM,算法可充分提供给主控应用。高度集成,外围精简,除MIC,喇叭外,板级仅需要阻容、PA芯片。在语音算法方面,85dB强噪声下依然能有85%识别率及90%唤醒率,最多能支持500条离线命令词。CI1303和CI1306还支持离线NLP,让语音交互更自然。
下图是CI130X应用框图:
以下为最常见为茶吧机增加语音识别功能的方案框架:
通讯流程:
1、声音通过麦克风传输给语音模块,语音模块识别到词条;
2、将识别到的词条信息串口告知电控;
3、电控执行相关动作;
4、电控根据动作的执行情况,告知语音模块需要播放的反馈声音;
5、语音模块根据电控反馈进行播放。
其他:当按键或者遥控按下时,语音模块也可以根据串口协议(图中③④)进行对应内容的播放
设计注意事项:
1、硬件:为方便开发者快速开发,框架中的语音模块可以直接使用启英泰伦的官方模块CI-D02GS02J(端子模块)或者CI-D02GS02S(SMT贴片模块);也可以从启英泰伦AI平台的文档中心下载相关的模块的硬件资料自行修改;
2、软件:登录启英泰伦语音AI平台,可以通过启英泰伦AI平台进行命令词、唤醒词、播放音、串口协议的更改,平台制作固件后将其下载到语音模块;
3、结构:茶吧机产品设计时,请特别注意MIC的结构设计,尽量将mic 放在远离噪声位置,并将mic 尽量密封固定好,更多细节可以通过启英泰伦文档中心—硬件开发—结构注意事项进行查看:
该方案具有以下特点:
1、语音直控茶吧机,无需联网,安全不受平台限制
2、家居安静环境下能支持8-10米的远场识别
3、0.2~0.8s语音识别极速响应,不受互联网带宽影响
4、多芯片方案配置,满足高中低端需求
5、第三代离线语音芯片更强的抗噪,更好的识别效果,芯片的高可靠性。
CI130X芯片内置多个IO,可以复用为uart,iic,pwm,adc、gpio等,也可以作为产品的MCU使用,更多开发细节可以查看启英泰伦官网及语音AI平台。
|