ChatTTS 是一个专为对话场景设计的文本到语音(Text-to-Speech, TTS)生成模型,具有以下特点:
- 多语言支持:支持中文和英文,适用于多语言环境。
- 大规模数据训练:使用约10万小时的中文和英文数据进行训练,确保语音合成的高质量和自然度。
- 对话任务兼容性:特别适合大型语言模型(LLM)助手的对话任务,提供自然流畅的互动体验。
- 开源计划:项目团队计划开源一个经过训练的基础模型,促进学术研究和社区开发。
- 控制和安全性:提高模型的可控性,添加水印,确保模型的安全性和可靠性。
- 易用性:用户只需输入文本,即可生成相应的语音文件。
ChatTTS 可广泛应用于大型语言模型助手的对话任务、对话式音频和视频介绍、教育和培训内容的语音合成等场景。
加载中...