前言:个人比较喜欢接触新鲜事物,在NXP芯片开发上很少使用Keil,因为官方提供的开发软件MCUXpresso IDE,使用起来更加方便,提供SDK库加载也非常容易,接下来带您体验下官方提供的语音识别案例。目前该案例只支持识别以下部分单词:const std::string labels[] = {"Silence", "Unknown","yes", "no", "up", "down", "left", "right", "on", "off", "stop", "go" }; 一、IMXRT1050-EVKB 开发板MIC转换ADC电路图:硬件话筒使用的是板载MIC-EM6022P,使用WM8960低功耗、立体声编码器,将mic模拟信号转换为数字信号传导到MCU。 音频输入/输出连接器 MIMXRT1050 EVK 板上使用的音频编解码器为 Wolfson 的低功耗、高质量立体声编解码器 WM8960。 MIMXRT1050 EVK 板包括一个耳机接口(J12)、一个板载 MIC (P1)、两个扬声器接口(J16、J17)和 SPDIF 接口(J14 和 J18、DNP)。J12 是一款 3.5mm 音频立体声耳机插孔,支持插入检测。
二、语音识别主要程序其语音识别使用的是Tensorflow神经网络,目前使用的是工程自带的语音模型,如果想要扩展的话,需要使用ML-KWS-for-MCU 进行大量的训练,提炼新的语音模型。过程很耗时间,所以我之后会选择使用其他语音识别SDK进行语音上的开发。也因为做嵌入式硬件开发也不擅长或者说不会使用神经网络,神经网络属于专门学科或者面相算法开发的。 const std::string labels[] = {"Silence", "Unknown","yes", "no", "up", "down", "left", "right", "on", "off", "stop", "go" }; Source/ds_cnn_s_model.h 是用来存放语音模型信息 三、语音识别操作流程首先打开 IDE , 选择导入工程,编译下载仿真,步骤很简单。 Debug完成后,打开串口调试助手,设置好后便会一直循环打印语音识别的结果。
接下来来体验语音识别吧!
|