标签: MCP

大家好，我是二哥呀。

GPT-5.3-Codex 还没捂热，OpenAI 又正式发布了 GPT-5.4。

这不是一次普通的模型更新，而是被 OpenAI 定位为 AI 数字员工的首个大一统模型。它整合了推理、编程及百万级上下文能力，原生支持电脑操作，Agent 任务成本直接降低 47%。

基准测试成绩相当亮眼：SWE-Bench Pro 拿下 57.7%，MMMU-Pro 达到 81.2%，BrowseComp 更是飙到 82.7%。在内部投行建模测试中，GPT-5.4 的得分从 GPT-5 的 43.4% 直接干到了 87.3%。

沉默王二大约 9 分钟

大家好，我是二哥呀。

话说公元前 141 年，未央宫里正在进行一场特殊的面试。

汉武帝刘彻端坐龙椅，手里拿着一份竹简，眉头紧锁：“东方朔，朕听闻你精通 AI 辅助编程，可解天下难题？”

东方朔躬身答道：“回陛下，臣虽不敢言精通，但确有一些心得。”

“哦？那你倒是说说，什么是 Skills？和普通的 Prompt 有何区别？”

东方朔略一思索：“启禀陛下，Skills 是预置的最佳实践指南（SKILL.md 文件），包含针对特定任务的详细操作步骤和注意事项。通过渐进式披露机制，让 LLM 节点更智能、能力更强。”

沉默王二大约 11 分钟