ARM技术论坛
直播中

创龙教仪

2年用户 272经验值
擅长:嵌入式技术 EDA/IC设计
私信 关注
[讨论]

人工智能教学实验箱_国产处理器:5-29 语音识别控制实验

3568-5-29

一、实验目的

熟悉Qt程序的开发流程。
掌握Qt Creator的基础开发使用。
通过编写Qt程序实现语音识别的显示界面。

二、实验原理

Qt工程的创建步骤包括:
(1)创建Qt工程;
(2)GUI的设计实现:LCD显示界面以及与用户的交互;
(3)编辑控制代码;
(4)编译程序;
(5)运行程序。

image.png

根据原理图,可知本实验中使用的语音控制模块是基于启英泰伦CI122模组的,

image.png

CI112X 芯片

CI112X 芯片具有较强的CPU运算能力,支持硬件NN加速,以及充足的RAM。能够完成一些常见的语音处理算法。主要包含了ASR(语音识别)和语音降噪功能。
   语音识别(Automatic Speech Recognition),一般简称ASR,是将声音转化为文字的过程。CI112X系列芯片中,CI1122支持50 ~ 80条语音指令。
   降噪(DENOISE)算法能有效抑制稳态噪声,在保证语音失真度的同时具有良好的噪声抑制效果。开启该功能后,可以通过降低稳态噪声的方式进行识别效果的提升,但是同时该功能会消耗24KB的芯片内部存储空间,并且会消耗CPU的带宽资源。

三、操作现象

实验设备

本实验中使用的软件为VMware17+Ubuntu18.04.4 和串口调试工具Xshell。

image.png

image.png

本实验中使用的是TL3568-PlusTEB实验箱,所需的配件为Micro SD卡、Type-C线、电源和语音识别模块。

image.png

image.png

image.png

image.png

image.png

编译源码

我们先打开Ubuntu,将Demo文件夹拷贝到RK3568目录下。
"Ctrl+Alt+T"打开控制台,执行命令启动Qt Creator。
打开工程文件
如有弹出的对话框,点击No。对话框主要内容为:是否需要加载上一台电脑的配置文件,此文件包含上一台电脑的配置规则,我们不需要使用,重新制定规则。勾选3568套件,然后点击configure project即可。
打开界面控制的源码
查看界面设计
点击"Projects",可以查看编译文件保存的路径
编译生成ARM端的Qt程序镜像,在右下角会出现编译进度条,变绿后编译完成。可在目录下查看生成的ARM端Qt程序镜像
编译完成后使用OpenSSH命令将文件拷贝至实验箱文件系统。

屏幕截图 2024-10-10 145947.png

硬件连接

接着进行硬件连接,
(1)将Linux系统启动卡插至Micro SD卡槽。
(2)使用Type-C线连接USB TO UART2调试串口到PC机。
(3)将语音控制模块插入实验箱的GPIO/PWM/SPI/UART/CAN 拓展接口。
(4)连接电源线,先不要上电。

屏幕截图 2024-10-10 150014.png

软件操作

接着进行软件部分操作。
(1)先在设备管理器查看串口的端口号;
(2)再设置串口调试工具,波特率设置为1500000,点击连接,在Xshell调试终端会显示连接成功。
(3)连接成功后,拨动实验箱的电源开关,将实验箱上电。
(4)等待系统登录SD卡系统了。
(5)登录成功后,在可执行程序所在目录执行命令运行程序。
(6)程序运行后可以看到LCD显示的界面。
(7)对着模块喊“你好创龙”唤醒模块,语音识别模块会回应。
(8)接着再喊“打开彩灯”,则模块上面的LED灯会亮起,同时屏幕上的开关会变成打开。
(9)对着模块喊“你好创龙”唤醒,再说“关闭彩灯”,则模块上面的LED灯会熄灭,同时屏幕上的开关会变成关闭。
(10)先不要戴着耳机,以免音量过大。对着模块喊“你好创龙”唤醒,再说“播放音乐”,则会播放VenusMars1.wav音乐文件。播放音乐后,再慢慢戴上耳机。
(11)对着模块喊“你好创龙”唤醒,再说“停止音乐”,则会停止音乐。

屏幕截图 2024-10-10 150043.png

更多回帖

发帖
×
20
完善资料,
赚取积分