一款适用于日常对话的生成式语音模型。
ChatTTS 是一款专门为对话场景(例如 LLM 助手)设计的文本转语音模型。
亮点:
对话式 TTS: ChatTTS 针对对话式任务进行了优化,能够实现自然且富有表现力的合成语音。它支持多个说话者,便于生成互动式对话。
精细的控制: 该模型可以预测和控制精细的韵律特征,包括笑声、停顿和插入语。
更好的韵律: ChatTTS 在韵律方面超越了大多数开源 TTS 模型。我们提供预训练模型以支持进一步的研究和开发。
数据集和模型:
主模型使用了 100.000+ 小时的中文和英文音频数据进行训练。
HuggingFace 上的开源版本是一个在 40.000 小时数据上进行无监督微调的预训练模型。
在线网址:https://2noise.com/
github地址:https://github.com/2noise/ChatTTS
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
评论0+