米尔电子
直播中

jf_046417564

4年用户 6经验值
擅长:嵌入式技术 控制/MCU
私信 关注
[技术]

【米尔-RK3562开发板试用评测】RK3562J开发板-语音识别功能测试(一)

非常感谢电子发烧友论坛,以及米尔电子,最近拿到了电子发烧友试用的米尔电子开发板。正好手边可能有一项语音识别的功能要做。

硬件环境​​:

  • 使用电子发烧友论坛提供的米尔电子开发板
  • 音频输入限制:板载耳机麦克风接口与现有设备不兼容,暂无法直接录音

​测试方案​​:

采用预录制的WAV文件进行离线语音识别测试,规避实时输入问题。


​软件环境搭建步骤​

  1. ​开发语言​

    • 选用 Python 作为主要开发语言(系统已预装或手动安装)
  2. ​模型框架​

    • 采用 ​​Vosk​​ 离线语音识别框架
    • 优势:支持嵌入式场景,资源占用低
  3. ​模型文件准备​

    vosk-model-small-cn-0.22 中文识别模型

  4. ​测试数据准备​

    • 使用标准格式的WAV文件:
      • 单声道(1 channel)
      • 16位PCM编码
      • 采样率16kHz(与Vosk模型匹配)
    • 示例文件:OSR_cn_000_0072_8k.wav(存放于/usr/test/

image.png

2.在电脑端测试效果
image.png

3.部署在嵌入式linux端,进行测试结果的验证
image.png

更多回帖

发帖
×
20
完善资料,
赚取积分