最近有个东西让我有点坐不住。
GLM-5.1 发布了,编程评测 45.3 分,直逼 Claude Opus 4.6 的 47.9。

光看跑分还不够,我得亲自下场测一测。
于是我给了它一个真实项目需求:从零开发一个在线简历编辑器——派简历。9 份需求文档、前后端完整开发、自动化测试,全程不让它停。
最近有个东西让我有点坐不住。
GLM-5.1 发布了,编程评测 45.3 分,直逼 Claude Opus 4.6 的 47.9。

光看跑分还不够,我得亲自下场测一测。
于是我给了它一个真实项目需求:从零开发一个在线简历编辑器——派简历。9 份需求文档、前后端完整开发、自动化测试,全程不让它停。
大家好,我是二哥呀。
刚刚更新 Codex,发现了一个新的功能,插件。

按理说,【技能和应用】应该叫“技能和插件”才对,但不知道为什么 Codex 翻译成了这个鬼样子,GPT-5.4 的文本能力是真的差劲啊,😄

大家好,我是二哥呀。
虽然只是一个小版本,但经过两天的高强度使用,GLM-5.1 给我的感受远不是 0.1 这个数字所能表达的。
它在长时间跨度、长链路依赖、多工具协同、强目标一致等关键能力上都令我印象深刻,仿佛吃了仙丹一样,Coding 方面的进化远超我的预期。
下面是我用 GLM-5.1 从 0 到 1 完成的一个 AI 智能简历生成 Agent——派简历的完整录屏测试。
【录屏】
咱们直接上实战。
系好安全带,咱们滴滴滴出发~
大家好,我是二哥呀。
虽然我一直强调,token 就是生产力,这年头要至少备一个 Coding Plan 套餐,否则你的生产力会严重拖后。
但 Coding Plan 现在也不好买,lite 版本基本上都抢不到。看看现在这个 token 消耗量吧。
2026 年 3 月份来到了 140 万亿。

老王是某大厂的一位高级工程师,一头秀发直垂肩背,人不谈不上英俊,但气宇不凡。
他的第一个问题是:“你简历上写的熟悉 Agent Skills,那你说说 Skills 和 Prompt 到底有什么区别?”

瞅着老王的秀发出了神,以至于那一刻我脑子一片空白,支支吾吾说了句“Skills 就是封装好的 Prompt”。
大家好,我是二哥呀。
最近一直在高强度调教 Claude Code 的 Skill,说实话,越用越觉得这东西设计得挺巧妙的。但作为一个程序员,光会用是不够的,总得搞清楚它背后是怎么运转的。
你说对吧?
今天咱们就来拆解一下 create-skill 这个 Skill,看看它从被触发到执行完毕,中间到底经历了什么。我直接把源码扒了个底朝天,连函数调用顺序都给你理清楚了。

老王和蔼可亲地问:“知道我们阿里新成立的 token 事业群吗?”
“那必须啊,我可是提前做好功课的,不信我背给你听。”我自信满满地说。
全名 Alibaba Token Hub,简称 ATH,下设五个部门,分别是:

①、通义实验室:也就是 Qwen 大模型;②、MaaS 业务线:主要是阿里百炼那一套;③、千问事业部:包括千问 APP 等;④、悟空事业部:主要是钉钉那一套;⑤、AI 创新事业部:探索各类 AI 创新应用。
大家好,我是二哥呀。
上个月,我们组在讨论要不要引入 Skills。Leader 当场泼冷水:"这不就是把 Prompt 换个名字吗?有啥好折腾的。"
我没说话,但心里不服。
一周后,我默默给团队写了 30 个 Skill。代码审查时间从平均 2 小时降到 20 分钟,文档生成效率提升了 5 倍。Leader 偷偷把我拉到茶水间:"这个月的绩效,你拿 A。"
今天,我就把 Skills 的底层原理、开发实战、最佳实践,全部掏心窝子分享给你。
固定的流程我一般会用脚本来完成,需要借助一点AI能力的我会用Skills,最后才是上OpenClaw。
大家好,我是二哥呀。
用了这么多年终端,从系统自带的 Terminal.app 到 iTerm2,我一直觉得,命令行这玩意儿,能用就行,花里胡哨的东西都是浮云。
直到我把 Warp 和 Claude Code/OpenClaw 配合起来用了一周。
真心话,回不去了。

大家好,我是二哥呀。
昨天文章的留言区,有好几个读者提到了 ZeroClaw,于是我今天就马不停蹄在本地跑了一遍。

去GitHub瞅了一眼,已经 4k 多star 了,增长的飞快。
