文字转语音,我想很多视频创作者并不陌生吧!直接通过使用转换工具,将文本转换为语音文件,可以大大的节省后期配音的工作。然而,最近小编发现了一款叫做“ChatTTS”的文字转语音模型,并且这个模型被很多使用过它的人都快吹爆了。于是,在好奇心的驱使下,我也体验了一下该模型,下面大家一起来了解下吧!另外文章中我会将ChatTTS V3增强版整合包一并分享给大家,需要的可自行下载使用。

被吹爆的ChatTTS
在正式进入ChatTTS体验环节之前,66分享网(66fxw.com)小编觉得有必要先跟大家介绍一下这款被吹爆的文本转语音模型,好让大家对它有个基本的了解。
ChatTTS是一款免费开源的文本转语音模型,项目开源在GitHub上,目前已经获得了27.5k stars。它的亮点是:针对对话式任务进行了优化,能够实现自然且富有表现力的合成语音。它支持多个说话者,便于生成互动式对话。且该模型可以预测和控制精细的韵律特征,包括笑声、停顿和插入语。另外,在韵律方面超越了大多数开源 TTS 模型。

好了,简单介绍完该模型后,下面我们来一起体验一下这款被吹爆的ChatTTS吧!这里提下一下大家,可以先试听一下本文上方的音频文件,看看ChatTTS的文本转语音效果如何。
首次一键启动ChatTTS V3增强版整合包,大家可能会遇到提示“CUDA环境异常”的提醒,这时大家不要慌,直接按住键盘上的Ctrl键别松开,然后用鼠标点击它提示的CUDA下载地址,然后在弹出的下载页面找到对应你电脑版本的CUDA安装包,下载并安装重启电脑即可。

CUDA安装包下载页面地址:
https://developer.nvidia.com/cuda-11-8-0-download-archive?target_os=Windows&target_arch=x86_64&target_version=11&target_type=exe_local

电脑重启好以后,此时我们再次双击运行ChatTTS V3增强版整合包,就不会有CUDA环境异常的提醒了。

再接着,稍作等待就会弹出ChatTTS V3增强版的Web UI界面了。
在这个界面,大家只需要将你的文本输入到“输入文字”框中,然后再在“选择音色配置”下拉框选择一个音色,就可以点击“生成”按钮来进行文本转语音了。

语音生成好以后,大家可以进行试听,如果你不满意生成的语音文件,这里大家可以在下方这个网址,下载一个喜欢的音色。
音色下载:https://modelscope.cn/studios/ttwwwaa/ChatTTS_Speaker

然后将音色上传到ChatTTS V3增强版中,音色上传好以后点击“刷新配置列表”让音色生效,接着再点击生成。
由于ChatTTS是生成式AI模型,所以建议大家多生成几次,直到对生成好的语音文件满意为止。

最后,点击生成好的语音文件右上角的下载按钮,就可以将生成好的语音文件导出来了。
软件获取方式
结尾
写到这里,关于ChatTTS的介绍与ChatTTS V3增强版就分享完了。最后,说一下我的使用感受吧!总体上ChatTTS使用下来,我个人还是很满意的,因为他不像其他的文字转语音工具生成的语音文件那么机械,而且大家还可以通过在文本中添加[laugh], [uv_break]和[lbreak]命令,来让生成的语音文件更具真人情绪效果。因此,ChatTTS确实是一款值得被吹爆的文本转语音模型。


微信扫一扫
支付宝扫一扫

