智谱AI正式发布并开源了工业级语音合成系统GLM‑TTS。官方介绍显示,仅需3秒的语音片段,GLM‑TTS即可精准捕捉目标说话人的音色特征与语调习惯。该模型在通用文本朗读、情感化配音、教育口语评测、电子书播讲、智能有声客服等多种实际应用场景中,均可输出自然连贯、高度拟人化的语音效果。GLM‑TTS采用两阶段语音生成架构,并在训练过程中融合基于GRPO的强化学习策略,在公开基准测试的「字错误率(CER)」与「情感表达准确度」两项关键指标上,均达到当前开源模型中的最优水平(SOTA)。该模型基于G...
智谱ai正式发布并开源了工业级语音合成系统 glm‑tts。
官方介绍显示,仅需3秒的语音片段,GLM‑TTS 即可精准捕捉目标说话人的音色特征与语调习惯。该模型在通用文本朗读、情感化配音、教育口语评测、电子书播讲、智能有声客服等多种实际应用场景中,均可输出自然连贯、高度拟人化的语音效果。
GLM‑TTS 采用两阶段语音生成架构,并在训练过程中融合基于 GRPO 的强化学习策略,在公开基准测试的「字错误率(CER)」与「情感表达准确度」两项关键指标上,均达到当前开源模型中的最优水平(SOTA)。
该模型基于 GRPO 框架,设计了多维度奖励函数与稳定性增强机制,在确保可控性的前提下,显著提升了语音的表现力与鲁棒性。
其强化学习模块创新性地结合真实训练数据与高质量合成数据构建训练样本,实现了近乎零成本的数据扩充。通过与优化后的训练算法深度协同,有效抑制了奖励欺骗(reward hacking)现象,保障了模型

性能的真实性与泛化能力,即便面对未参与训练的新样本,依然保持优异表现。
值得关注的是,GLM‑TTS 仅依赖约10万小时的训练数据,远低于主流商用语音合成模型所需的数据量。同时,它在训练效率与效果之间取得良好平衡:预训练阶段仅需单台服务器运行4天,即可达成开源领域领先的“发音准确率”与“音色保真度”;而针对精品音色微调的 LoRA 模块及后续强化学习精调,也仅需单机1天即可完成,大幅优于行业平均耗时。
此外,GLM‑TTS 在成本大幅降低的同时,仍斩获业内顶尖的 MOS 分数(Mean Opinion Score,平均主观评分),展现出卓越的听感品质。
GLM‑TTS 相关资源(含模型权重、推理代码、示例工程等):
GitHub:https://www./link/bc931d478676400884a7371ff4b9b0f5
Hugging Face:https://www./link/23270334cb68c628783066181ece864b
源码地址:点击下载
相关推荐:
AI写作免费生成工具,让创作从未如此轻松!
免费爆文采集平台,让你轻松获得优质内容!,ai 生成 植物
免费语言模型网站,开启智能写作的全新时代,ai训练ai模型
AI写作自动生成:助您开启高效创作新时代
使用WordPress同步1688,开启电商自动化新纪元,ai做3d圆柱
SEO优化怎样?让你的网站脱颖而出!
AI写作生成标题软件:打造您的专属“爆款标题”神器!
怎样使用AI写文章:释放创作潜能,提升写作效率
AI人工智能生成文章:开启写作新时代
OpenAI官网入口:开启AI科技的新纪元,ai天然美女
SEO学堂:开启数字营销新时代,全面提升网站排名与流量,文山ai营销推广方案
SEO优化程序:提升网站流量与排名的关键利器
SEO优化是怎么操作的?揭秘高效的SEO优化策略
如何通过SEO优化提升短|视频|网页入口流量,助力品牌突破网络营销瓶颈,ai 名片教程
ChatGPT暂时不可用?如何高效应对并寻找最佳替代方案!,波司登ai试穿
文章写作AI:让创作更高效、精准的智能助手
SEO主要是做什么的?揭秘SEO的核心作用与技巧
AI自动生成:开启智能时代的无限可能,AI修复名人背后的道德
如何通过贴吧来进行推广引流?
智能AI写作生成:如何借助人工智能提升创作效率与质量
好用的人工智能AI软件推荐,让你的生活更智能!
AI写文章大纲创作新方式,轻松提升写作效率
AI写文档:高效办公新体验
如何辨别一篇论文是否具备原创性?五大核心要素告诉你真相,创作工厂ai写作
SEO代码优化有哪些方法?提高网站排名的关键技巧
未来已来!打造简洁高效的AI人工智能登录页面,让用户体验飞跃,AI字符识别
2025年SEO最新技术:让你的网站脱颖而出!,ai打扮
动态官网爬取工具让网站数据采集更加智能与高效,儿时ai
SEO付费推广:企业实现高效网络营销的新选择
Bing搜索不能预览了?搜索引擎的新变革与挑战,ai ps硬件要求