【AI声音克隆】MOSS-TTSD整合包，支持两人播客内容，支持音色克隆+长文本内容！8G显存可用，支持50系显卡!-AI声音克隆-AI之家论坛

0 0 0

【AI声音克隆】MOSS-TTSD整合包，支持两人播客内容，支持音色克隆+长文本内容！8G显存可用，支持50系显卡!

aizj

发布于 6月前 317 0

MOSS-TTSD（Text to Spoken Dialogue）是开源的口语对话语音生成模型，由清华大学语音与语言实验室（Tencent AI Lab）开发。能将文本对话脚本转化为自然流畅、富有表现力的对话语音，支持中英文双语生成。模型基于先进的语义-音学神经网络音频编解码器和大规模预训练语言模型，结合了超过100万小时的单人语音数据和40万小时的对话语音数据进行训练。支持零样本语音克隆，能根据对话脚本生成准确的对话者切换语音，适用于AI播客、访谈、新闻报道等多种场景。

特点是支持生成两人博客，对口相声。双人情感也很到位，可以配合提示词AI生成对话文本

MOSS-TTSD播客语音结合本地大模型一键包 https://pan.quark.cn/s/51ba02491f09

最新回复 (0)

暂无评论

请先登录后发表评论！

登录注册

aizj

UID:1 管理员组

主题数
15

帖子数
3

粉丝数
0

版块热门