最近有个东西让我有点坐不住。
GLM-5.1 发布了,编程评测 45.3 分,直逼 Claude Opus 4.6 的 47.9。

光看跑分还不够,我得亲自下场测一测。
于是我给了它一个真实项目需求:从零开发一个在线简历编辑器——派简历。9 份需求文档、前后端完整开发、自动化测试,全程不让它停。
最近有个东西让我有点坐不住。
GLM-5.1 发布了,编程评测 45.3 分,直逼 Claude Opus 4.6 的 47.9。

光看跑分还不够,我得亲自下场测一测。
于是我给了它一个真实项目需求:从零开发一个在线简历编辑器——派简历。9 份需求文档、前后端完整开发、自动化测试,全程不让它停。
大家好,我是二哥呀。
刚刚更新 Codex,发现了一个新的功能,插件。

按理说,【技能和应用】应该叫“技能和插件”才对,但不知道为什么 Codex 翻译成了这个鬼样子,GPT-5.4 的文本能力是真的差劲啊,😄

大家好,我是二哥呀。
虽然只是一个小版本,但经过两天的高强度使用,GLM-5.1 给我的感受远不是 0.1 这个数字所能表达的。
它在长时间跨度、长链路依赖、多工具协同、强目标一致等关键能力上都令我印象深刻,仿佛吃了仙丹一样,Coding 方面的进化远超我的预期。
下面是我用 GLM-5.1 从 0 到 1 完成的一个 AI 智能简历生成 Agent——派简历的完整录屏测试。
【录屏】
咱们直接上实战。
系好安全带,咱们滴滴滴出发~
大家好,我是二哥呀。
今天在研究 Claude Code 的自动化能力时,我想到了一个特别有意思的需求:能不能用 Claude Code 直接把我写好的文章自动发布到技术派网站上?
这可不是简单的 HTTP 请求就能搞定的,需要登录、填写表单、上传图片、预览、发布,一整套浏览器操作流程。

大家好,我是二哥呀。
如果这几个月你有关注AI教育赛道,应该会明显感觉到一个变化:大家不再只讨论"AI能不能帮学生写作业",而是开始讨论"AI怎么让学习变得更高效"。
这背后的需求是,我们缺的不是学习资料,而是"把知识吃透"的能力。
Google做过一组对照实验,使用AI辅助的学生成绩平均提升9%,长期记忆效果提高11%。这个数据很能说明问题,AI辅助教育确实有明显的优势。

大家好,我是二哥呀。
如果这几个月你有关注AI教育赛道,应该会明显感觉到一个变化:大家不再只讨论"AI能不能帮学生写作业",而是开始讨论"AI怎么让学习变得更高效"。
这背后的需求是,我们缺的不是学习资料,而是"把知识吃透"的能力。
Google做过一组对照实验,使用AI辅助的学生成绩平均提升9%,长期记忆效果提高11%。这个数据很能说明问题,AI辅助教育确实有明显的优势。

大家好,我是二哥呀。
如果这几个月你有关注 AI 编程圈子,应该会明显感觉到一个变化:大家不再只讨论哪个模型更强,而是开始讨论「怎么让 AI 更好地干活」。
这背后其实有一个很朴素的需求,我们需要的不是一个会聊天的 AI,而是一个能真正理解项目、能写完整代码、能解决问题的工程助手。
这种转变下,Agent Skills 这个概念就开始频繁出现在视野里了。
简单来说,Skills 就是给 AI Agent 装上的「技能插件」,让它掌握特定领域能力。就好比你玩游戏给角色学技能一样,AI 也可以通过安装 Skills 变得更厉害。
大家好,我是二哥呀。
看到朋友轩辕做了一个特别有意思的网站,用 Gemini 做 SVG 动画,尤其是历史人物的一生足迹动图,能动态展示某人一生去过哪些地方、经历过什么大事。

我看到后的第一个想法是,能不能用 Kimi 复刻一个版本。
大家好,我是二哥呀。
如果把时间拨回到 2023 年,AI 圈讨论最多的还是:谁更会聊天、谁更像人、谁能写诗。那时候的大模型,说白了就是"文本处理专家",你给它文字,它回你文字。
到了 2024 年,风向开始变了。GPT-4V、Gemini 这些模型开始能看图了,但它们的方式很简单:文本归文本团队管,图像归视觉团队管,最后把两个模块拼在一起,美其名曰"多模态"。
这就好像你公司里有个翻译团队,还有个设计团队,两个团队分别干活,最后老板说:"你俩合作一下吧"。
2026 年 1 月 22 日,百度正式发布了文心大模型 5.0,这一次他们选了一条完全不同的路——原生全模态。