完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>
一、概述 1.芯片介绍 LD3320 是一颗基于非特定人语音识(SI-ASR:Speaker-Independent Automatic Speech Recognition)技术的语音识/声控芯片。提供了真正的单 芯片语音识解决方案。 LD3320 芯片上集成了高精度的 A/D 和 D/A 接口,不再需要外接辅助的 Flash 和 RAM,即可以实现语音识/声控/人机对话功能。并且,识的关键词 语列表是可以动态编辑的。 基于 LD3320,可以在任何的电子产品中,甚至包括最简单的 51 作为主控 芯片的系统中,轻松实现语音识/声控/人机对话功能。为所有的电子产品增 加 VUI(Voice User Interface)语音用户操作界面。 2.语音识别介绍 语音识 ASR 技术,是基于关键词语列表识的技术。只需要设定好要识 别的关键词语列表,并把这些关键词语以字符的形式传送到 LD3320 内部,就可 以对用户说出的关键词语进行识别。不需要用户作任何地录音训练。 ASR 技术最重要的现实意义就在于提供了一种脱离按键,键盘,鼠标的基 于语音的用户界面 VUI:Voice User Interface 每次识的过程,就是把用户说出的语音内容,通过频谱转换为语音特 征,和这个关键词语列表中的条目进行一一匹配,最优匹配的一条作为识结 果。比如在手机的应用中,这个关键词语列表的内容就是电话本中的人名/手机 的菜单命令/T 卡中的歌曲名字。 不论这个列表的条目内容是什么,只需要用户设置相关的寄存器,就可以 把相应的待识条目内容以字符形式传递给识引擎。 LD3320 可以识列表中的关键词,用户说的语音可以是这个列表中任意的 关键词语,而且不需要用户在识前进行任何训练。 识引擎不关心关键词语列表中的关键词语的内容,可以是命令,人名, 歌曲名字,操作指令等等任何的汉字字符串。 每条关键词语最大可以支持的字数,从算法角度是限制在 30 字以内。但是 从实际情况来看,用户一口气说超过 8 个字以上的条目时,几乎肯定会出现说 错字/说漏字/说多字/打嗝/停顿等情况,这些情况都会严重影响识并造成识 错误。因而一般来说,如果要获得理想的识效果,建议每条关键词语的字 数不要过长,避免影响效果。 3.技术参数 1. 内置单声道 mono 16-bit A/D 模数转换 2. 内置双声道 stereo 16-bit D/A 数模转换 3. 内置 20mW 双声道耳机放大器输出 4. 内置 550mW 单声道扬声器放大器输出 5. 支持并行接口或者 SPI 接口 6. 内置锁相电路 PLL,输入主控时钟频率为 2MHz - 34MHz 7. 工作电压:(VDD: for internal core) 3.3V 8. 48pin 的 QFN 7*7 标准封装 9. 省电模式耗电:1uA 4.应用场景 电磁炉/微波炉/智能家电操作 导航仪 MP3/MP4 数码像框 机顶盒/彩电遥控器 智能玩具/对话玩具 PMP/游戏机 自动售货机 地铁自动售票机 导游机 楼宇电视的广告点播 公共照明系统/卫生系统/智能家居的声控 二、LD3320 资料 1.管脚 |
|
|
|
只有小组成员才能发言,加入小组>>
4484个成员聚集在这个小组
加入小组3327 浏览 0 评论
航顺(HK)联合电子发烧友推出“近距离体验高性能Cortex-M3,免费申请价值288元评估板
4260 浏览 1 评论
4287 浏览 0 评论
小黑屋| 手机版| Archiver| 电子发烧友 ( 湘ICP备2023018690号 )
GMT+8, 2024-12-18 14:09 , Processed in 0.557392 second(s), Total 75, Slave 58 queries .
Powered by 电子发烧友网
© 2015 bbs.elecfans.com
关注我们的微信
下载发烧友APP
电子发烧友观察
版权所有 © 湖南华秋数字科技有限公司
电子发烧友 (电路图) 湘公网安备 43011202000918 号 电信与信息服务业务经营许可证:合字B2-20210191 工商网监 湘ICP备2023018690号