我们在刷短视频的时候经常会听到一些AI合成声音,它们有各种音色、语调,甚至不同的情绪,听起来与人声无异
其实这些大都是利用微软Azure的文字转语音技术来实现的
虽然国内也有很多配音工具,但体验下来还是微软的效果最好,语气最为自然
不过Azure的文字转语音功能是收费的……
好在小编最近发现了一款工具,可以无限制使用微软的最强配音功能
希望你们喜欢~
TTS-VUE
一款开源免费的语音合成工具,调用微软官方接口,使用 Electron + Vue + ElementPlus + Vite 构建。
支持SSML语音合成标记语音、批量文本转换,转换内容过长时,可自动拆分后进行转换
整体体验很不错,界面简约清晰,也非常容易上手
使用说明
操作上比较简单,输入需要转换的文字→配置发言人、语言风格等信息→点击开始转换→下载
转换完毕后会自动播放试听,没问题的话点击播放条左侧的绿色按钮即可下载
发言人
发言人有20多位,比较常见的云希、云野都有,支持在发音人选择列表处进行试听
每位发言人都有不同的说话风格,像开心、生气、客服、新闻等等,说话风格可以让声音更真实、生动~
SSML多人语音混合编辑
如果能实现多人物、多语气的情景对话效果,是不是就更完美了
这就需要用到SSML语音合成标记语言来进行编辑了,它可以为每段话都设置不同的配音员及语音风格
不过需要一点学习成本,有需要可以参考下这篇微软官方教程
https://docs.microsoft.com/zh-cn/azure/cognitive-services/speech-service/speech-synthesis-markup
批量转换
批量转换也是一个非常重要的功能,虽然该程序可以自动将大段文字分段来绕过文字数量限制
但在文字很多的情况下还是可能出现莫名其妙失败的情况
这时便可以尝试手动将他们分段后再进行转换