首页 技术教程 正文阅读

语言模型,小米最新开源声音克隆TTS

emer 2026-05-30
2 0

小米最新开源!覆盖600+语种方言声音克隆TTS 只需3-10秒声音 可控一键合成声音 超40倍速OmniVoice

OmniVoice是一款最先进的大规模多语言零样本文本到语音(TTS)模型,支持超过600种语言。该模型基于一种新颖的扩散语言模型架构,能够以卓越的推理速度生成高质量语音,并支持语音克隆和声音设计。

超广语言覆盖:支持600+语言,零样本TTS中覆盖最广。

零样本语音克隆:仅需3–10秒参考音频,无需训练即可复刻音色,质量顶尖。

自由语音设计:用文本指令控制性别、年龄、音高、口音/方言、耳语等,无需参考音。

极速推理:RTF低至0.025,比实时快40倍,适合批量与实时场景。

精细发音控制:支持笑声/叹气等非语言标记,支持拼音/音标强制纠音。

架构简洁高效:扩散语言模型结构,兼顾音质、速度与扩展性。

易用部署:一键启动Web UI,已经制作好了离线整合包给大家使用,大家有需要的可以试试。

完全开源:GitHub开源,可本地部署(已经可以本地离线运行了)、二次开发与商用友好。

PS:支持如下方言:

陕西话、河南、四川话、贵州话、云南话、桂林话、济南话、石家庄话、甘肃话、宁夏话、青岛话、东北话
本资源来自互联网,如有水印联系方式,请不要相信,谨防诈骗,一切后果自行承担,与本人、

该资源由乐我知免费分享!

社区无关!

链接:
「OmniVoic...oice」,复制整段内容,打开最新版「夸克APP」即可获取。
无需下载在线播放视频,畅享原画5倍速,支持电视投屏。
筷莱枵腹瓿皿舞夺郝
/~7bc23YoNDh~:/
链接:立即下载

⚠️ 重要免责声明
版权说明: 本资源全部来源于网络的公开收集与整理,仅为方便个人学习、研究或欣赏之用,请勿用于任何商业用途。

拿走dd,谢谢大家[太开心][太开心][太开心]

语言模型,小米最新开源声音克隆TTS - 第 1 张图
语言模型,小米最新开源声音克隆TTS - 第 2 张图
语言模型,小米最新开源声音克隆TTS - 第 3 张图

emer

emer

每天发现网络新鲜事

67006 文章
13 分类
10062.2k+ 访问

搜索

Zoomed Image