完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>
|
随着AI技术的进步,智能语音开始将人机交互从手+眼睛的传统模式中解放出来。带给人们更便捷、更风趣、更有人情味的体验,让***作对象变得不再只是一个死板的工具,而更像是一个有生命的助理。“帮我打开空调”,“明天上班需要带伞吗”,“帮我冲100块钱话费”…在万物互联的时代,你的所有需求只需要一句话便能实现。AliOS Things 集成的Link Voice SDK即可实现智能语音交互。 原文:http://click.aliyun.com/m/43694/ 关于阿里智能语音服务 阿里智能语音服务为设备提供语音交互能力、丰富的音乐内容、智能家居控制等,并可进行专有设备技能定制(如:语音操控跑步机、按摩椅等设备)。包括:
功能集成 设备接入阿里语音服务,需要集成Alink SDK和Link-Voice SDK,其中Alink SDK为设备提供接入阿里IoT平台的连接、账号体系、配网、OTA等能力,而Link-Voice SDK为设备提供阿里智能语音服务。设备首先要集成了Alink SDK成为SDS平台的一个设备,才能通过集成Link-Voice SDK使用阿里智能语音服务。Link-Voice SDK除了依赖Alink为设备完成平台接入设备管理外,还需要表格所列模块完成相应工作。其中websockets用来进行语音数据的交互;opus完成语音录制的PCM格式到opus格式的转换(服务端只接收opus格式);cjson用来做json解析;mbedtls为alink和websockets的底层连接进行加密,为其数据传输提供安全保障。 而目前AliOS Things已完成以上表格所有模块的移植适配工作并将其集成进来,所以我们直接使用AliOS Things便可完成愉快的智能语音开发。主mcu性能建议:
单次语音识别流程图 简化缓冲处理等细节: 开发平台准备 按理满足功能集成章节性能要求,并带音频录制及播放功能的开发板即可。前提是需要完成AliOS tings的移植适配工作。本文以全志xr871evb(已完成OS适配)为例进行介绍。本平台资源:
环境搭建及代码编译 先搭建AliOS开发环境(以linux为例):AliOS-Things-Linux-Environment-Setup 然后从github阿里官方开源库下载最新版本的AliOS Things源码(https://github.com/alibaba/AliOS-Things): 以linux下开发为例: 切换到主分支: 建议再在主分支上新建一个自己的开发分支: 到目前为止环境也安装好了,代码也准备完毕,只待编译及烧录测试。编译link-voice测试例程: 代码烧入: 修改串口配置: 将串口改成你板子的串口号,可ls /dev/tty*查看,保存退出。 代码烧写,先将全志开发板启动选择拨码开关拨至NO位置,如同所示: 然后执行 打开minicom或其他串口工具监视设备输入信息,波特率115200。 功能演示: 初次上电后先进行配网: 其中ssid和psswd分别替换为你无线网络名及密码。 由于没有加本地关键词识别功能,所以现在没次对话需要按键触发。 根据终端提示,待网络连接后,出现以下提示时: 按按键2(AK2)触发语音识别功能。 此时对着开发板说话,语音数据被编码、上传到云端、识别成功后返回相应信息,识别失败亦有相应提示。 示例: 1:明天上班需要带伞吗? 2.给我讲个鬼故事。 3.推荐一部悬疑电影。 4.把空调打开。 以下为一个小的演示视频: http://v.youku.com/v_show/id_XMzQ1NjQ4MjIyOA==.html?spm=a2h3j.8428770.3416059.1 API介绍 1)初始化 int pal_init(const struct pal_config *config);
2)销毁 void pal_destroy();
3)获取SDK版本 int pal_version();
4)设置日志级别 void pal_set_log_level(int level);
5)设置环境 void pal_set_env(int env);
6)厂商播放器向SDK上报消息 int pal_notify_msg(const char *msg);
7)厂商播放器通过SDK透传ALink消息 int pal_post_alink_msg(const char *msg);
8)开始一次语音识别 int pal_asr_start();
9)发送语音数据 int pal_asr_send_buffer(const char *buffer, int buffer_len);
10)结束本次语音识别(同步接口) struct pal_rec_result* pal_asr_stop();
11)结束本次语音识别(异步接口) void pal_asr_stop_async(pal_asr_callback callback, void *user);
12)取消本次语音识别 void pal_asr_cancel();
13)销毁语音识别结果 void pal_rec_result_destroy(struct pal_rec_result *result);
14)文本转语音(同步接口) struct pal_rec_result* pal_get_tts(const char *text);
|
|
相关推荐
|
|
BP86211D 12V/0.5A家用电器方案DEMO资料分析(电路原理图及BOM)
1501 浏览 0 评论
PD诱骗取电芯片_PD_Sink端芯片之XSP05实战应用电路
2514 浏览 1 评论
BLDC、PMSM电机智能栅极驱动芯片之TMC6140知识分享
1259 浏览 0 评论
国产电源芯片DP4054 软硬件兼容TP4054 规格书资料
1723 浏览 0 评论
3533 浏览 3 评论
/9
小黑屋| 手机版| Archiver| 电子发烧友 ( 湘ICP备2023018690号 )
GMT+8, 2025-12-13 00:11 , Processed in 0.657148 second(s), Total 63, Slave 45 queries .
Powered by 电子发烧友网
© 2015 bbs.elecfans.com
关注我们的微信
下载发烧友APP
电子发烧友观察
版权所有 © 湖南华秋数字科技有限公司
电子发烧友 (电路图) 湘公网安备 43011202000918 号 电信与信息服务业务经营许可证:合字B2-20210191

淘帖
2646