本工具完全免费,仅供学习研究,严禁用于商业用途,违者将自行承担全部责任!
当前版本:
- MS-TTS:
V2.0.1.4
- Edge-TTS:
V2.0.0.2
所有版本低于v2.0.1.4的小伙伴请在文章末尾下载v2.0.1.4版本完整压缩包解压后使用!此版本对自动更新模块进行了修复改进!
更新内容(ms-tts)
v2.0.1.0
- 语言列表数据排序优化;
- 修复语言角色错乱bug;
- 优化多音字典dict读取方式;
- 修复保存目录设置无效bug;
v2.0.1.1
- 修复部分英文合成失败bug;
- 处理合成内容与角色语言不匹配问题;
v2.0.1.2
- 优化合成400问题;
- 修复最终合并音频时长与系统显示时长不一致问题;
- 增加选择文本试听功能(选择文本-鼠标右键-试听)
v2.0.1.3
- 增加风格强度选项;
- 增加汉字拼音查询;
- 增加角色性别标注;
- 修复添加删除角色错误bug
v2.0.1.4
- 修复多角色超长文本合成内容串联bug;
- 修复改进自动更新模块。
软件界面
重要说明
- MS-TTS使用的是微软Azure文本转语音演示DEMO页面接口,每次合成内容有长度限制以及合成频率限制,长度限制你们不用管,由软件自动分段切割,合成频率这块软件基本已经调整到了最高上限,千万不要自作聪明多开,免得搞一晚上到最后一个都合成不了还跑来问为什么。
- Edge-TTS使用的是edge浏览器大声朗读接口,合成条件相对较宽松,但不支持对语言角色进行深度调整,对语音角色没有特别强的定制需求推荐使用Edge-TTS,接口稳定,合成速度快。
- 软件下载地址在文章末尾,在下载使用前,建议先观看视频教程或仔细阅读下面的文字教程内容,遇到问题同样请认真观看视频或仔细阅读文字教程,绝大部分问题都有说明,看完教程基本都可以自行解决,谢谢配合!
视频教程
https://www.bilibili.com/video/BV1Tk4y1Y7h2/
文字教程(以下内容请仔细阅读
)
1、下载的压缩包记得先解压缩,再使用!!!
2、解压后运行主程序 MS-TTS.exe
或Edge-TTS.exe
(注意:软件有加密保护,会被部分杀毒软件和电脑管家勿报及限制操作权限,建议将杀毒软件及电脑管家关闭后使用,当然,如果不放心,可以不要使用)
3.1 选项
质量:导出音频文件质量
语言:TTS文本转语音中的文本内容所属语言(一定要和合成内容的语言相对应)
语音:根据所先语言不同,对应的语音角色也不相同,要自行根据实际情况选择
语速:语音合成时的说话速度,0是正常水平,>0加快,<0减慢
音调:语音合成时的说话音调,0是正常水平,>0音调升高,<0音调降低
添加角色:可将设置好的角色添加到下方的角色列表,用于文本转语音时实现多角色配音的效果(不添加角色时,所有语音合成直接使用上方角色及各项设置)
- 保存:保存当前接口角色列表中的角色数据
- 载入:载入之前保存过的角色列表数据
- 删除:删除指定角色(删除角色后为同步角色序号将会自动执行保存功能)
- 清空:清空列表所有角色数据
全局旁白:合成内容中所有未指定角色内容,统一使用左侧中间部分角色信息进行合成。
3.2 简单模式-中小文本
主要用于合成文本内容不多的情况,可以更为方便快捷的对文本内容进行各种自定义
全局间隔,主要用于一键设置全文所有语句间隔停顿时间。
在编辑区域点击鼠标右键,会弹出右键菜单
- 粘贴:将复制好的文本内容粘贴到编辑区域
- 清空:清空编辑区域所有内容
- 插入间隔:插入指定时长停顿
- 设置角色:使用此功能需要在左侧列表先添加角色,然后使用指定角色对选中范围文本内容进行标记,进行过角色标记的内容在后面进行语音合成时,将以指定的角色设置进行语音合成。
3.3 简单模式-超长文本
在表格区域点击鼠标右键,会弹出右键菜单:
- 导入:导入需要进行tts合成的txt文本文件
- 导入的txt文本大小不能超过5MB(超过5MB文本文件无法导入)
- 导入的txt文本文件编码格式必须为UTF-8,非UTF8编码文件在导入后,在状态栏会显示“编码错误”,在进行tts语音合成时,会直接跳过
- 清空:清空列表
- 也可以直接选中多个txt文本文件,拖动到软件界面完成导入
3.4 软件设置
- 保存目录:可自定义合成音频保存目录(打开:快速打开保存目录,选择文件夹:选择保存目标文件夹)
- 合成音频使用原始文件名命名:在超长文本模式下生效,勾选后,最终合并音频文件名以“原始导入文本文件名_tts”进行命名
- 合成结束打开保存目录:在语音合成任务完成后打开保存目录(如果保存文件夹已经有打开则不会再打开)
- 分段音频合并数量:在进行超长文本合并时,如果将所有音频进行完整合并,最终生成的音频文件将会非常大,动辙几GB,于是采取了二级合并的模式,可以自行根据需求按指定数量合并(如果还是不能理解,打个比方,你的文本合成音频后,有300个音频文件,如果对这300个音频文件进行完整合并,最终合成的文件只有一个,且文件大小将会达到几GB,不方便移动传输,且合成时间会非常长,现增加的二级合并,意思就是按照指定的数量对前面生成的300个文件进行合并,比如默认二级合并数量50,意思就是以50个音频为一组,对前面的300个音频进行分开合并,这样300个音频文件合成完成后,就会生成6个二级合并的音频文件,每个二级合并音频文件大小就会降到几百MB)
- 合成结束删除1级音频片段:1级音频片段就是最多的,4位数字开头的音频片段文件
- 合成结束删除2级音频片段:2级音频片段就是按照上面指定分段音频合并数量对1级音频片段进行合并后生成的3位数字开头音频文件
- 是否进行最终完整合并:就是将所有分段音频文件合并成一个音频文件。
路径检测
:显示YES表示路径正常,可正常进行音频合并
,NO表示软件保存完整路径中存在空格(),;等特殊特殊字符,需要将路径中的特殊字符去除才可以(最简单的解决方法,将软件解压缩,或是剪切到磁盘根目录,除了C盘其它哪个盘都行,有的电脑系统C盘软件操作需要额外权限)- 保存配置:将各项设置内容保存至配置文件
注:删除音频片段时,将遵循保护性逻辑,即:在只存在1级音频片段时,即使勾选合成结束删除1级音频片段也不会执行删除,在同时存在1级音频片段与2级音频片段时,勾选删除1级音频片段生效,而2级音频片段即使勾选删除将不会执行,同理,在同时存在1级、2级音频片段,且进行了最终完整合并的前提下,勾先删除1级、2级音频片段才会生效执行。
4、多音字
MS-TTS运行后会自动在程序目录生成“dict.txt”词典文件,
将需要自动替换的内容按照:原始内容,替换内容
的格式一行一条,写入“dict.txt”词典文件保存即可,dict必须为utf-8编码),如下:
直接使用拼音替换指定多音字,例如:wēn,wén,wěn,wèn
5、试听合成
5.1 试听
单角色提供最长不超过450字符内容的角色声音试听,存在多角色时,只能试听第一段内容;
5.2 合成
按照设置好的角色对指定内容进行TTS语音合成
5.3 全局旁白
老版本合成内容角色设置要么全部设置角色,要么全部不设置,在合成内容中同时存在指定角色内容和未指定角色内容时,只能合成指定角色内容,当前版本合成音频时,指定角色内容使用左下方角色列表中指定角色进行合成,未指定角色内容全部使用左侧中间角色数据进行合成,因为这部分内容不需要指定角色,也以叫全局旁白;
5.4 停止
停止正在进行的任务
5.5 更新
为大家减少麻烦,软件已启用自动更新,当软件检测到新版本后会自动下载新版本,下载完成后重新运行即可,**重点:更新时会自动打本页面,请务必仔细阅读更新内容,方便掌握最新功能。
软件报病毒
软件有加密保护,会被部分杀软误报,所以,如果你在使用过程中遇到这样或那样的问题,请尝试关闭各类杀毒软件或电脑管家后再试一下,当然:
如果不放心请勿使用
,谢谢!!!
常见问题:合成正常,但无法进行最终合并
- 1、检查软件保存完整路径以及输出音频保存路径是否存在空格(),;等特殊特殊字符,如有,需要将路径中的特殊字符去除;
- 2、彻底退出杀毒软件/电脑管家,鼠标右键-使用管理员模式运行此程序;