发帖

怎么设计基于嵌入式系统的语音口令识别系统？

2998 语音识别嵌入式系统硬件电路

问答对人有帮助，内容完整，我也想知道答案 0 随着计算机技术和信息技术的迅速发展，语音口令识别已经成为了人机交互的一个重要方式之一。语音口令识别系统将根据人发出的声音、音节或短语给出响应，如通过语音口令控制一些执行机构、控制家用电器的运行或做出回答等。在数字信号处理芯片上已经实现了语音口令识别系统或语音口令识别系统的部分功能，然而随着嵌入式微处理器处理能力的大幅度提高，计算量大的语音口令识别算法已经能够通过嵌入式微处理器来完成，将语音口令识别系统与嵌入式系统相结合，发挥语音识别系统的潜力，使语音识别系统能够广泛应用于便携式设备中。　　 0
2019-9-3 08:27:23　　评论淘帖0 邀请回答您可以邀请以下用户，快速回答问题 × heks 该类别下有 16 个回答。邀请回答 ChristineGu 该类别下有 16 个回答。邀请回答 HengDu 该类别下有 16 个回答。邀请回答 dfasda 该类别下有 15 个回答。邀请回答 nhonglan 该类别下有 15 个回答。邀请回答 yonglanzhang 该类别下有 15 个回答。邀请回答 chm5 该类别下有 14 个回答。邀请回答 muwersddg 该类别下有 14 个回答。邀请回答杀狼000 该类别下有 14 个回答。邀请回答 wenminglang 该类别下有 14 个回答。邀请回答 C880U 该类别下有 14 个回答。邀请回答 jhdfvs 该类别下有 14 个回答。邀请回答 billbian 该类别下有 13 个回答。邀请回答 a732538 该类别下有 13 个回答。邀请回答 hrtuoyu 该类别下有 13 个回答。邀请回答 hfgdzc 该类别下有 13 个回答。邀请回答 thyysbk 该类别下有 13 个回答。邀请回答凡人wlj 该类别下有 13 个回答。邀请回答 kszdj113 该类别下有 13 个回答。邀请回答飞雪9366 该类别下有 13 个回答。邀请回答举报范召琳相关推荐 • 嵌入式语音识别系统在生活中的应用有哪些呢 3677 • 怎样去设计一种基于LD3320芯片的嵌入式语音识别系统呢 2321 • 怎样去搭建一个基于kaldi的嵌入式在线语音识别系统 3286 • 怎样去搭建一种基于嵌入式平台的在线语音识别系统呢 2670 • 怎样去搭建一个基于kaldi的嵌入式语音识别系统呢 1915 • 基于嵌入式的指纹识别系统 3202 • 怎样去设计一种基于嵌入式架构的指纹识别系统呢 1619 • 求大佬分享一种基于SVM的0MAP5912非特定人嵌入式语音识别系统的实现方法 1230 • 求一种基于TMS320VC5402的嵌入式音乐语音识别系统设计方案 1556 • 分享一种基于嵌入式系统开发语音识别与语音合成应用 1720 3个回答

答案对人有帮助，有参考价值 0 采用隐马尔克夫模型(Hidden Markov MODEL，HMM) 描述语音信号的非平稳性和局部平稳性，HMM中的状态与语音信号的某个平稳段相对应，平稳段之间以转移概率相联系。由于HMM建模对语音信号长度和模型的混合度的要求都比较低，因此在现有的非特定人语音口令识别系统中，多采用状态输出具有连续概率分布的连续隐马尔可夫模型(ConTInuous Density Hidden Markov MODEL，CDHMM)。　　论文给出一种基于嵌入式系统的语音口令识别系统的设计方案，硬件系统的核心芯片是嵌入式微处理器，语音口令识别算法采用CDHMM。语音口令首先经过预处理，提取MFCC(Mel-Frequency Ceptral Coefficients)特征参数，然后建立此口令的CDHMM模型，把所有语音口令的模型放在模型库中，在识别阶段，通过概率输出分，取分最大的一个作为识别出的口令。将语音识别系统与嵌入式系统相结合，可以使语音口令识别系统广泛应用于便携式设备中。　　1 硬件电路的设计和工作原理　　基于嵌入式系统的语音口令识别系统需要有接收语音信号的输入芯片配合麦克风实现将模拟语音信号转换成数字信号的功能，然后由嵌入式微处理器对输入的语音口令信号进行处理。完成语音口令信号输入功能的芯片采用的是PHILIPS公司的低功耗芯片UDAl341TS，供电电源电压为3V，该音频处理芯片由模数／数模转换(ADC)、控制逻辑电路、可编程增益放大器(PGA)和数字自动增益控制器(DAGC)以及数字信号处理器等部分组成，能进行数字语音处理。　　芯片UDAl341TS采用标准的内部集成电路声音总线IIS(Inter IC Sound Bus)，该总线是由PHILIPS等公司共同提出的数字音频总线协议，专门用于音频设备之间的数据传输，目前很多音频芯片和微处理器都提供了对IIS总线的支持。　　IIS总线有三根信号线，分别是位时钟信号BCK(Bit Clock)、字选择控制信号WS(Word Select)和串行数据信号Data，由主设备提供串行时钟信号和字选择控制信号，IIS总线的时序如图1所示。　　WS也称为帧时钟信号，该信号的电平为低电平时，传输的输入音频数据信号是左声道的音频数据信号；信号WS的电平为高电平时，传输的输入音频数据信号是右声道的音频数据信号。BCK对应着输入音频数据信号的每一位音频数据，其频率为2×采样频率×每个采样值的位数。　　与BCK同步的串行音频数据信号采用补码的形式传输，传输顺序是高位先传输。IIS总线格式的信号无论有多少位有效数据，数据的最高位MSB总是出现在WS信号改变(也就是传输一帧数据信号开始)后的第2个串行数据信号SCLK脉冲位置。　　通过上述IIS总线能够得到输入的音频数据信号，而其它的信号如自动增益控制、输入数据格式的选择和输入增益的控制等控制信号通过称为“L3” 形式的接口总线传输。为了减少引脚数和保持连线简单，该接口总线采用串行数据传输方式，接口总线由3条信号线组成：时分复用的数据通道线L3DATA、模式控制线L3MODE和时钟信号线L3CLOCK。模式控制线L3MODE为低电平时的传输模式为地址传输模式；为高电平时的传输模式为数据传输模式。　　语音口令识别系统的硬件电路的核心芯片是嵌入式微处理器Samsung S3C2440 AL，主频为400MHz。三星公司推出的RISC微处理器S3C2440 AL具有低功耗、高性能等特点，可以广泛应用于便携式设备中。 S3C2440AL具有一个IIS总线音频编码／解码接口，语音口令识别系统的硬件电路如图 2所示。其IIS总线控制器通过5根信号线与UDAl34lTS编解码芯片相连。这些5根信号线分别是：系统时钟信号CDCLK：位时钟信号I2- SSCLK；字选择控制信号I2SLRCK；串行数据输入信号I2SSDI；串行数据输出信号I2SDO。S3C2440 AL使用L3接口传输其他(如自动增益控制、输入数据格式的选择和输入增益的控制等)控制信号。为了使系统间能够更好地同步，S3C2440AL需要向芯片UDAl341TS提供CDCLK，该时钟信号的频率可以选择采样频率的256倍、384倍或512倍。

2019-9-3 15:24:10 评论举报李葛葛

答案对人有帮助，有参考价值 0 　2 基于CDHMM的口令识别的软件设计　　2．1 口令识别的软件系统框图　　语音口令识别的软件系统分别由特征参数提取、语音模型库和概率输出分三大模块组成，如图3所示：1)语音口令特征参数的提取，输入不同的语音口令，首先要进行特征参数提取，采用Mel频率参数作为CDHMM的建模参数，Mel频率参数是根据人耳的听觉特性将语音信号的频谱转化为基于Mel频率的非线性频谱，然后转换到倒谱域上。2)在训练阶段，对不同的语音口令建立CDHMM模型。3)在口令识别阶段，通过概率输出分对待测语音口令做出识别。　　语音口令首先经过预处理，提取MFCC特征参数，然后建立此口令的CDHMM模型，把所有语音口令的模型放在模型库中，在识别阶段，通过概率输出分，取分最大的一个作为识别出的口令。　　2．2 CDHMM算法　　HMM是一种双重随机过程，用概率统计的方法描述语音信号的产生及变化过程。HMM的模型参数为λ=(N，M，π，A，B)，其中，N为模型中马尔克夫链的状态数目；M为每个状态对应的可能的观察数目；π为初始状态概率矢量，π=(π1，…，πN)；A为状态转移矩阵，A=(aij)NN；B 为观察概率矩阵，B=(bjk)NN。　　CDHMM的B不再是一个矩阵，而是一组观察值概率密度函数，由M个连续高斯密度函数描述：　　N(o，ujk，∑jk)为多维高斯概率密度函数，o是观察矢量序列，即从语音中提取的特征矢量参数(o1，o2，…，ot)，t为观察矢量序列的时间长度。ujk，∑jk分别为高斯分布的均值和方差参数，Cjk为高斯分布的权值，满足约束条件CDHMM参数估计采用“分段K-平均法”。初始模型可以随机选取，由是改进后的模型，再将作为初始值，重新估计。　　基于“分段K-平均法”的CDHMM参数估计具体过程为：　　(1)设置模型参数初始值λ=(π，A，B)。　　(2)根据此λ用Viterbi算法将输入的训练语音数据划分为最可能的状态序列，利用状态序列估计参数A。　　(3)用分段K-平均法对B进行重新估计，即将第二步得到的每一种状态的训练语音数据搜集在一起并对其特征进行统计，从而得到B。　　对于概率密度函数由若干正态分布函数线性相加的CDHMM系统，每个状态θj(1≤j≤N)的概率密度函数bj(X)由K个正态分布函数线性相加而成，这样可以把每一状态语音帧分成K类，然后计算同一类中诸语音帧矢量X的均值矢量，方差矩阵∑jk和混合密度函数中各概率密度函数的权重系数 Cjk。　　(4)由(2)和(3)估计的CDHMM参数作为初值，利用重估公式对CDHMM参数进行重估，得到参数。　　(5)利用(4)所得的计算，并与p(O／λ)相比较。如果差值小于预定的阈值或迭代次数超过预定的次数，即说明模型参数已经收敛，无需进行重估计算，可将作为模型参数输出。反之，若差值超出阈值或迭代未到预定的次数，则将计算结果作为新的初值，重复进行下一次迭代。

2019-9-3 15:24:15 评论举报马丹丹

答案对人有帮助，有参考价值 0 3 结束语　　论文建立了一种基于嵌入式系统的语音口令识别系统，并且对上升、下降等14条口令进行测试，每条语音先切除静音，预加重，然后通过 Hamming窗分帧处理，帧长和帧移分别为20ms和10ms，然后对每一帧语音信号提取16MFCC+16AMFCC共32维参数作为特征矢量。该语音口令识别系统达到了实时的要求，可以使语音口令识别系统广泛应用于便携式设备中。

2019-9-3 15:24:17 评论举报陈发赫

只有小组成员才能发言，加入小组>>

嵌入式学习小组

10350个成员聚集在这个小组

精选推荐

最新话题

热门话题

FreeRTOS任务调度及优先级问题

1020浏览 1评论
芯片封装

1849浏览 1评论
如何知道嵌入式电子控制单元（ECU）中的RAM使用情况？

1359浏览 1评论
推荐一个支持js的嵌入式设备开发平台

1851浏览 0评论
嵌入式单片机设计

1177浏览 0评论

创建小组步骤

创建小组创建自己的地盘
个性设置精心打造小组空间
邀请好友邀请好友加入我的小组
小组升级小组积分升级赢得社区推荐

创建属于自己的小组

快速回复 返回顶部 返回列表

关注微信公众号

电子发烧友网

电子发烧友论坛

社区合作: 刘勇; 联系电话：15994832713; 邮箱地址：liuyong@huaqiu.com

社区管理: elecfans短短; 微信：elecfans_666; 邮箱：users@huaqiu.com

返回嵌入式学习小组

回复

关闭

站长推荐 /9

快速回复 返回顶部 返回列表

- 厂商专区: 飞凌嵌入式

瑞萨单片机论坛

米尔电子

Aigtek安泰电子

斯丹麦德电子

芯佰微电子

其利天下技术小组

道生物联技术社区

视美泰

FCom富士晶振

大大通

合众恒跃

进迭时空

RT-Thread论坛

EASY-EAI灵眸科技

- 技术社区: 张飞电子技术社区

KaihongOS技术社区

FPGA开发者技术社区

RISC-V MCU技术社区

HarmonyOS技术社区

- OpenHarmony开源社区: OpenHarmony开源社区

- 嵌入式论坛: ARM技术论坛

STM32/STM8技术论坛

嵌入式技术论坛

单片机/MCU论坛

RISC-V技术论坛

瑞芯微Rockchip开发者社区

FPGA|CPLD|ASIC论坛

DSP论坛

- 电路图及DIY: 电路设计论坛

DIY及创意

电子元器件论坛

专家问答

- 电源技术论坛: 电源技术论坛

无线充电技术

- 综合技术与应用: 机器人论坛

USB论坛

电机控制

模拟技术

音视频技术

综合技术交流

上位机软件（C/Python/Java等）

- 无线通信论坛: WIFI技术

蓝牙技术

天线|RF射频|微波|雷达技术

- EDA设计论坛: PCB设计论坛

DigiPCBA论坛

Protel|AD|DXP论坛

PADS技术论坛

Allegro论坛

multisim论坛

proteus论坛|仿真论坛

KiCad EDA 中文论坛

DFM|可制造性设计论坛

- 测试测量论坛: LabVIEW论坛

Matlab论坛

测试测量技术

传感技术

- 招聘/交友/外包/交易/杂谈: 项目外包

供需及二手交易

工程师杂谈|交友

招聘|求职|工程师职场

- 官方社区: 发烧友官方/活动

华秋商城

华秋电路

+ 元器件搜索引擎: 元器件搜索引擎

time

recommend

hot

post

—
—
—

版
块
导
航