最近有个东西让我有点坐不住。
GLM-5.1 发布了,编程评测 45.3 分,直逼 Claude Opus 4.6 的 47.9。

光看跑分还不够,我得亲自下场测一测。
于是我给了它一个真实项目需求:从零开发一个在线简历编辑器——派简历。9 份需求文档、前后端完整开发、自动化测试,全程不让它停。
大约 11 分钟
最近有个东西让我有点坐不住。
GLM-5.1 发布了,编程评测 45.3 分,直逼 Claude Opus 4.6 的 47.9。

光看跑分还不够,我得亲自下场测一测。
于是我给了它一个真实项目需求:从零开发一个在线简历编辑器——派简历。9 份需求文档、前后端完整开发、自动化测试,全程不让它停。
大家好,我是二哥呀。
虽然只是一个小版本,但经过两天的高强度使用,GLM-5.1 给我的感受远不是 0.1 这个数字所能表达的。
它在长时间跨度、长链路依赖、多工具协同、强目标一致等关键能力上都令我印象深刻,仿佛吃了仙丹一样,Coding 方面的进化远超我的预期。
下面是我用 GLM-5.1 从 0 到 1 完成的一个 AI 智能简历生成 Agent——派简历的完整录屏测试。
【录屏】
咱们直接上实战。
系好安全带,咱们滴滴滴出发~
大家好,我是二哥呀。
刚刚,GLM-5-Turbo 正式发布,这是全球首个龙虾大模型。实测后发现,OpenClaw 有了他之后,能力提升的不是一星半点。
作为龙虾的重度患者,哦不,重度使用者,开心那 😄
注意注意,更新澳龙(AutoClaw)到最新版,已经默认配置好了 GLM-5-Turbo 模型。

大家好,我是二哥呀。
昨天深夜,前脚 DeepSeek V4 悄悄灰度,后脚 GLM-5 悄悄发布。
争先恐后,好不热闹。

我熬夜测了 6 小时,先上结论:GLM-5 就是目前最聪明的国产模型,没有之一。
以前我还会用Claude Opus 规划开发文档,用 GLM 4.7 去具体执行,但经过这一夜,我决定 All in GLM-5。