欢迎光临,我们是一家专注中小型企业营销推广服务的公司!

咨询热线:400 9868 577
淮南兰乔电子商务有限公司
新闻中心News
淮南兰乔电子商务有限公司

智谱上线并开源工业级语音合成系统 GLM‑TTS

作者:碧海醫心 | 点击: | 来源:碧海醫心
1212
2025
智谱AI正式发布并开源了工业级语音合成系统GLM‑TTS。官方介绍显示,仅需3秒的语音片段,GLM‑TTS即可精准捕捉目标说话人的音色特征与语调习惯。该模型在通用文本朗读、情感化配音、教育口语评测、电子书播讲、智能有声客服等多种实际应用场景中,均可输出自然连贯、高度拟人化的语音效果。GLM‑TTS采用两阶段语音生成架构,并在训练过程中融合基于GRPO的强化学习策略,在公开基准测试的「字错误率(CER)」与「情感表达准确度」两项关键指标上,均达到当前开源模型中的最优水平(SOTA)。该模型基于G...

智谱ai正式发布并开源了工业级语音合成系统 glm‑tts。

官方介绍显示,仅需3秒的语音片段,GLM‑TTS 即可精准捕捉目标说话人的音色特征与语调习惯。该模型在通用文本朗读、情感化配音、教育口语评测、电子书播讲、智能有声客服等多种实际应用场景中,均可输出自然连贯、高度拟人化的语音效果。

GLM‑TTS 采用两阶段语音生成架构,并在训练过程中融合基于 GRPO 的强化学习策略,在公开基准测试的「字错误率(CER)」与「情感表达准确度」两项关键指标上,均达到当前开源模型中的最优水平(SOTA)。

该模型基于 GRPO 框架,设计了多维度奖励函数与稳定性增强机制,在确保可控性的前提下,显著提升了语音的表现力与鲁棒性。

其强化学习模块创新性地结合真实训练数据与高质量合成数据构建训练样本,实现了近乎零成本的数据扩充。通过与优化后的训练算法深度协同,有效抑制了奖励欺骗(reward hacking)现象,保障了模型

性能的真实性与泛化能力,即便面对未参与训练的新样本,依然保持优异表现。

值得关注的是,GLM‑TTS 仅依赖约10万小时的训练数据,远低于主流商用语音合成模型所需的数据量。同时,它在训练效率与效果之间取得良好平衡:预训练阶段仅需单台服务器运行4天,即可达成开源领域领先的“发音准确率”与“音色保真度”;而针对精品音色微调的 LoRA 模块及后续强化学习精调,也仅需单机1天即可完成,大幅优于行业平均耗时。

此外,GLM‑TTS 在成本大幅降低的同时,仍斩获业内顶尖的 MOS 分数(Mean Opinion Score,平均主观评分),展现出卓越的听感品质。


GLM‑TTS 相关资源(含模型权重、推理代码、示例工程等):

GitHub:https://www./link/bc931d478676400884a7371ff4b9b0f5
Hugging Face:https://www./link/23270334cb68c628783066181ece864b

源码地址:点击下载

相关推荐
我要咨询做网站
成功案例
建站流程
  • 网站需
    求分析
  • 网站策
    划方案
  • 页面风
    格设计
  • 程序设
    计研发
  • 资料录
    入优化
  • 确认交
    付使用
  • 后续跟
    踪服务
  • 400 9868 577
    info#ilanqiao.cn
Hi,Are you ready?
准备好开始了吗?
那就与我们取得联系吧

咨询送礼现在提交,将获得兰乔电子商务策划专家免费为您制作
价值5880元《全网营销方案+优化视频教程》一份!
下单送礼感恩七周年,新老用户下单即送创业型空间+域名等大礼
24小时免费咨询热线400 9868 577
合作意向表
您需要的服务
您最关注的地方
预算

直接咨询