最强开源文本转语言项目 ChatTTS 一键本地安装!

全栈技术 Aug 12, 2025

ChatTTS 是由 2Noise 团队研发的面向对话场景(如助手、聊天机器人)的文本转语音(TTS)模型,专注于生成更自然、富于表现力的语音输出。支持 中英文双语,并通过数十万小时的语音训练来提高语音质量和真实感。

audio-thumbnail
ChatTTS音频示例1
0:00
/12.721633
audio-thumbnail
ChatTTS音频示例2
0:00
/12.852245

模型支持通过文本中特殊标记控制笑声、停顿、插入语等韵律特征,使输出语音更富表现力和真实感,主模型训练使用了 超过 10万小时的中英文语音数据,确保语音自然度和质量。

ChatTTS项目地址:https://github.com/2noise/ChatTTS
ChatTTS-ui一键部署项目地址:https://github.com/jianchang512/ChatTTS-ui


今天我们使用一键安装包本地部署 ChatTTS ,首先下载安装包。

  • 下载地址

百度网盘下载

通过网盘分享的文件:win-ChatTTS-ui-v1.0
链接: https://pan.baidu.com/s/1GCPeQqrZ7UY2KS2izvC9mw?pwd=77dr
提取码: 77dr
--来自百度网盘超级会员v4的分享

下载后得到两个文件,分别解压:

解压时避免和当前目录文件弄混了,记得解压到新的目录中。

然后将解压后的 asset 目录拷贝到 win-ChatTTS-ui-v1.0 目录,注意层级关系:

然后双击 app.exe 启动项目,首次启动时会比较慢,请耐心等待。

启动后会自动打开浏览器,我们在浏览器使用就可以了。

如何控制停顿、笑声?在文本中插入这两个即可控制停顿和笑声了。

  • [laugh] 代表笑声
  • [uv_break] 代表停顿

值得注意的是,笑声和停顿不是一定生效,而是要看你的实际文本内容,比如你的文本是讲很正式的语句,这时你加入笑声是不生效的。

而且不同的音色对相同的文本最终输出的效果区别会很大。

我测试了下面这段文字是可以的:

💡
从现在看来 [uv_break] ,大模型大约是开始进入尾声了 [uv_break] ,未来比较长的一段时间内我们可能会进入ai的一段瓶颈期[uv_break],难道不是吗 [laugh]
audio-thumbnail
实际测试效果
0:00
/10.848