完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>
文字转语音使用的技术简称为TTS。一般情况下我用的都是在线的EDGE-TTS服务。但非常幸运的是,BM1684X上居然有适配好的本地运行TTS,那自然是要体验一番。 先转到project文件夹下,克隆下整个仓库,并切换到
接下来下载模型
下面下载nltk数据,由于python包中自动下载部分基本都会下载失败,因此我们先手动下载下来。
下面来配置虚拟环境:
全部运行完成后,启动示例:
接下来需要等待一段时间来加载模型,然后如果看到以下输出,说明启动顺利: 打开网页后,可以看到以下界面: 输入文字后,点击生成。就可以朗读。 测试完成,接下来我们需要研究下代码,看看如何可以应用到我们的项目中。 在使用前,我们还需要知道speaker和emotion有哪些值可以用。其中可支持的speaker列表见./data/youdao/text/speaker2,可支持的任意文字,参考的emotion列表见./data/youdao/text/emotion。所有的变量都是字符串的格式。 那么接下来,我们只需要稍微改动一下 先注释最后两行:
接着我们新建一个
运行以下,就可以看到我们直接调用了方法,并且生成好了对应的音频文件。 |
|
相关推荐
|
|
只有小组成员才能发言,加入小组>>
【算能RADXA微服务器试用体验】+ GPT语音与视觉交互:6,功能整合,完成项目
4424 浏览 0 评论
【算能RADXA微服务器试用体验】+ GPT语音与视觉交互:4,文字转语音
552 浏览 0 评论
【算能RADXA微服务器试用体验】+ GPT语音与视觉交互:2,图像识别
693 浏览 0 评论
【算能RADXA微服务器试用体验】+ GPT语音与视觉交互:1,LLM部署
775 浏览 0 评论
【算能RADXA微服务器试用体验】+ GPT语音与视觉交互:1,LLM部署
775浏览 0评论
【算能RADXA微服务器试用体验】Radxa Fogwise 1684X Mini 规格
1081浏览 0评论
【算能RADXA微服务器试用体验】+ GPT语音与视觉交互:2,图像识别
693浏览 0评论
【算能RADXA微服务器试用体验】+ GPT语音与视觉交互:3,语音识别
333浏览 0评论
【算能RADXA微服务器试用体验】+ GPT语音与视觉交互:4,文字转语音
552浏览 0评论
小黑屋| 手机版| Archiver| 电子发烧友 ( 湘ICP备2023018690号 )
GMT+8, 2024-11-23 17:38 , Processed in 0.418337 second(s), Total 38, Slave 33 queries .
Powered by 电子发烧友网
© 2015 bbs.elecfans.com
关注我们的微信
下载发烧友APP
电子发烧友观察
版权所有 © 湖南华秋数字科技有限公司
电子发烧友 (电路图) 湘公网安备 43011202000918 号 电信与信息服务业务经营许可证:合字B2-20210191 工商网监 湘ICP备2023018690号