智谱深夜放大招:GLM-5发布,Pony Alpha身份揭晓

深夜官宣:Pony Alpha就是GLM-5
2026年2月11日深夜,智谱正式发布新一代旗舰模型GLM-5。
这个消息并不完全意外——此前The Information就报道过,在OpenRouter上神秘出现的开源模型"Pony Alpha",实际身份就是智谱的新模型。今晚,官方终于证实了这个猜测。
核心能力:Coding与Agent双SOTA
根据智谱官方披露,GLM-5的核心突破集中在两个方向:
Coding能力: GLM-5在编程场景取得开源SOTA表现。更值得关注的是,官方表示"在真实编程场景的使用体感逼近Claude Opus 4.5"——这是相当大胆的对标。
Agent能力: GLM-5擅长复杂系统工程与长程Agent任务。这意味着模型不仅能写代码,还能理解复杂的多步骤任务、维护长期上下文、完成系统性工程。
Pony Alpha:先打榜再亮相的营销策略
智谱这次玩了一手漂亮的营销。
GLM-5以"Pony Alpha"的身份先在OpenRouter上匿名发布,让用户在不知道模型出处的情况下自然使用和评价。等到口碑积累、数据验证之后,再官宣真实身份。
这种"先交卷再署名"的策略,比直接发布更有说服力——用户的真实反馈比任何benchmark都更有分量。
对标Claude Opus 4.5意味着什么
智谱选择对标Claude Opus 4.5而非GPT-4o,这个选择本身就很有意思。
Claude Opus 4.5是目前公认的代码能力天花板,尤其在复杂工程任务上表现出色。智谱敢说"使用体感逼近",要么是真有实力,要么是准备好被打脸。
从Pony Alpha的用户反馈来看,智谱应该不是在吹牛。
国产大模型的Agent时代
GLM-5的发布,标志着国产大模型竞争进入新阶段:
从"能用"到"好用": 早期国产模型的目标是能跑起来、能对话;现在的目标是在专业场景真正好用。
从通用到专精: Coding和Agent是目前最有商业价值的两个方向,智谱选择在这里重点突破,战略清晰。
从追赶到对标: 敢于直接对标Claude Opus 4.5,说明国产模型的自信心在增强。
接下来看什么
GLM-5刚发布,还有几个问题等待验证:
- API定价:智谱一贯走性价比路线,GLM-5会定什么价?
- 开源计划:GLM-5会像之前版本一样开源吗?
- 实测表现:官方说"逼近Claude Opus 4.5",第三方测评会怎么说?
今晚先到这里,明天等更多细节出来再更新。
消息来源:界面新闻、The Information、科创板日报