从0到1带你速通QoderWork，这可能是最适合国内的Agent产品

沉默王二约 4548 字大约 15 分钟

大家好，我是二哥呀。

这两个月 Agent 赛道的热度大家有目共睹，Codex 说自己是 NO1，Claude Code也得偷偷靠边站。

编码、操控浏览器、接管桌面全能干，群里/留言区隔三差五就有人问教程什么时候安排上。

这里先给大家推荐一个网站，AI进阶之路，就是用 QoderWork 设计后通过 Codex 实现的（后面会讲）：https://ai.javabetter.cn/

今天这篇主要来讲讲阿里的 QoderWork，它是目前国内最适合做 Agent 的桌面智能体了，功能全面、体验流畅、上手简单。

如果你没办法用Codex，那QoderWork一定要用一下。

01、下载安装

访问官网 https://qoder.com.cn/qoderwork，macOS 和 Windows 均提供了独立客户端。

下载完成后，打开客户端注册登录，进入主界面。整个过程非常丝滑，没有多余的配置步骤。

左侧菜单栏可以看到 QoderWork 的五大核心板块：

专家套件：针对产品设计、法务合规、企业财税、投行研究等垂直领域，提供预设好的完整工作流
技能：QoderWork 的插件生态，汇集了大量第三方开发者贡献的功能模块
连接器：桥接外部系统的入口，包括 Chrome 浏览器、桌面操控、QoderWork 国际版等
定时任务：设定周期性自动执行的后台作业
IM 频道：与钉钉、飞书、微信等即时通讯工具打通，实现手机端远程指挥

一个小建议：初次使用时，给 QoderWork 指定一个独立的工作目录。

文件操作默认只在授权目录内生效；浏览器操控和桌面控制走各自独立的权限体系，互不干扰。

福利方面，新注册用户首月可领 Pro 权益；在校学生和教师认证通过后还能额外领取 4000 Credits，非常适合拿来练手。

02、四个工作台

QoderWork 把高频使用场景拆分成了四个独立工作台：通用、设计、写作、幻灯片。入口在输入框左下角，随时切换。

通用工作台是万金油，行业调研、本地文件整理、数据统计分析、简历筛选、周报生成都能处理。你只管描述需求，QoderWork 会自动将任务拆解为若干步骤，依次执行，最终给出结果。

分享一个我自己遇到的真实情况。某次 Codex 执行完任务后遗留了两个 Python 后台进程，持续占用 CPU 将近 30 分钟，笔记本风扇一直在吹，机身摸上去发烫。我把问题抛给 QoderWork，它自动定位到这两个进程并安全终止了。

对于不熟悉 kill 命令和进程管理的小伙伴，这种场景特别友好。不用担心误杀关键系统进程，QoderWork 会先确认再操作。

设计工作台

这是我个人最常用的一个场景。它的设计思路是 Code as Design，生成出来的不是图片，而是基于组件库的所见即所得的网页预览。

模板库收录了 100 多种视觉风格，科技感、极简主义、商务正式、潮流新锐都有覆盖。选好风格参考后，用自然语言描述页面需求即可。

最终交付的是完整的工程代码，适配主流前端组件库，可以一键推送到 Qoder IDE 里继续迭代。研发拿到的是能跑的视觉稿。

我用设计工作台做了一个 Claude Code / Codex 学习网站的完整首页，生成质量让我很惊喜。

设计工作台采用无限画布的交互方式，页面上的任意元素都能单独选中、修改样式或替换内容。不满意某个模块，直接框选修改就行。

暗黑模式也能一键切换预览效果。

我把亮色版和暗色版放在一起看了看，基本就是理想中 Claude Code 学习站该有的模样。

写作与幻灯片

写作工作台采用左右分栏布局，左侧是对话区用来发需求，右侧是文档区实时呈现内容。遇到需要局部修改的地方，框选文字写一句批注，AI 就能定向调整，支持润色、改写、段落扩展和多语言翻译。

幻灯片工作台的设计思路是多 Agent 协作。一份 PPT 被拆解成 11 个阶段，大纲梳理、主题配色、图片选配、逐页正文、演讲备注各有独立 Agent 负责。每页内容以独立 HTML 文件存储，成品支持 PDF、HTML、PPTX 三种格式导出，每一页还自动附带 150 到 300 字的演讲备注。内置模板 30 多套，做出满意的版本后也可以抽取为团队级模板循环使用。

03、专家套件

专家套件是 QoderWork 面向垂直行业的预制工作流。首批上线了 10 个方向：产品管理、企业法务、合同管理、企业财税、咨询交付、市场营销、投研分析、投行业务、股权投资、财富管理。

每个套件的构成是统一的：一组 / 快捷命令 + 预配置的工具接口 + 行业知识库。安装之后开箱可用，不需要自己从零编写 Skill。如果预设的命令不能完全满足需求，套件支持自定义编辑，增删改都可以。

以产品设计套件为例，内置了 28 条快捷命令，从最初的需求澄清到最终的工程文档输出，全链条覆盖。

实战演练：宠物寄养平台

假设我们有一个创意：做一个宠物寄养平台，撮合宠物主人和附近的寄养家庭。

先输入 /问题框定，把这个想法告诉 QoderWork。Agent 会引导我们逐步梳理目标用户是谁、核心痛点是什么、产品方向怎么定，最终输出一份结构化的设计框架。

往后走，不需要再重复输入项目背景信息。QoderWork 的上下文自动衔接，Agent 记得之前聊过什么。直接进入原型生成阶段。

到视觉设计环节，用 /视觉情绪板 可以基于用户旅程中的关键情感触点，推导出 3 到 4 套差异化的色彩方案。接着 /Web页面设计 直接产出多屏页面 Flow 和对应的 .tsx 代码文件。

最后一步，/写PRD 输出一份近万字的产品需求文档。文档里包含设计资产的路径索引、技术实现的约束条件、优先级排序，直接交给开发团队就能启动编码。

整条链路上，每个 Skill 之间靠链式上下文自动衔接。从最初的一句“我想做宠物寄养”，到拿出一份可交付的 PRD，中间没有上下文断裂的问题。

这份 PRD 的细节程度远超我的预期，页面层级、交互逻辑、边界条件都写得很清楚。

04、技能市场

技能（Skill）是 QoderWork 的插件扩展体系。每个 Skill 的本质是一份自然语言编写的工作规范，告诉 Agent 在什么条件下触发、按什么步骤执行、有哪些注意事项。

文件结构非常简洁：一个文件夹里放一个 SKILL.md。本地存储路径在 ~/.qoderworkcn/skills/ 目录下，可以随时查看和修改。

对 Claude Code 用户有一个好消息：QoderWork 的 Skill 格式与 Claude Code Skills 完全兼容。之前在 Claude Code 里写好的 Skill 直接复制过来就能用，零改动迁移。

技能市场里已经有不少第三方开发者提交的现成 Skill，覆盖文档处理、数据分析、图像编辑等方向。找到合适的直接安装，不合适的自己写一个也很快。

从 PRD 到可运行的 UI 页面

继续宠物寄养平台的案例。把上一步输出的 PRD 文件拖入新任务的上下文窗口，让 QoderWork 根据需求文档生成 UI 设计。

产出结果覆盖了 PRD 中 MVP 阶段定义的全部 8 个核心页面。

为了演示效果，我把生成的 JSX 文件转换成了 HTML 格式。

视觉体系很统一：暖琥珀色作为主色调传递信任感，翡翠绿用于认证标识和完成状态，玫红色高亮价格信息和紧急操作入口。

清新淡雅的整体气质，和宠物寄养这个主题非常搭，完成度远超我的预期。

05、连接器

连接器是让 QoderWork 的能力边界突破应用本身的关键。目前最有价值的两个连接器是浏览器操控和计算机桌面控制。

浏览器操控

浏览器连接器以 Chrome 扩展的形式安装，绑定的是你日常使用的那个 Chrome 实例，所有已登录的网站状态全部自动继承。

在连接器页面点击【加号】完成绑定，操作非常简单。

绑定成功后，Chrome 浏览器的扩展栏里也能看到连接状态的指示。

Chrome 扩展有一个非常实用的“接力页面”按钮。点击后，插件会把当前浏览器标签页的完整内容推送给 QoderWork，Agent 自动识别并解析页面信息。

试着发一条简单的指令。

在 QoderWork 的输入框左下角，可以随时确认当前激活了哪些连接目标。

连接器面板会列出 Chrome 当前打开的所有标签页，想操作哪个页面就选哪个，指向非常明确。

举一个具体的使用场景。我让 QoderWork 为我的开源项目 PaiAgent 创建一条新的工作流。

把窗口切换到 Chrome，可以清楚地看到 QoderWork 正在浏览器里逐步点击和填写内容。

直连 Chrome 最大的好处是登录态的天然复用。小红书、知乎、B 站这类需要登录才能操作的平台，不需要单独配置账号密码，QoderWork 直接用浏览器已有的登录状态就能完成任务。多个 Agent 还可以分别占据不同的标签页并行操作，互不干扰。

如果某个任务中途放弃，直接归档就行。QoderWork 自动释放对应的上下文资源，保持工作区干净。

计算机桌面控制

第一次启用这项功能，需要到 macOS 系统偏好设置里授权辅助功能和屏幕录制两项权限。

权限开启后，QoderWork 可以通过模拟鼠标和键盘的方式操控 Mac 上的任何应用程序。功能上对标 Codex 的 Use Computer，实际操控的流畅度和准确性都不错。

06、定时任务与 IM 远程调度

定时任务

QoderWork 内置了定时执行引擎，提供六种触发频率：单次执行、固定间隔、按小时、按天、按周、按月。

创建定时任务不需要写 cron 表达式，用自然语言描述即可。比如输入“每天 18 点把下载目录里的文件按类型整理到对应文件夹”，QoderWork 会自动解析出触发频率和具体的执行逻辑，生成完整的定时计划。

每次定时触发都会产生一条独立的对话记录，完整保留执行过程。执行期间可以调用已安装的 Skill、连接器，也可以读写本地文件，能力和手动发起任务完全一致。

有一点需要特别注意：定时任务依赖本地运行环境，设备不能进入休眠状态。QoderWork 提供了“防止系统休眠”的选项，开启后电脑会一直保持唤醒，笔记本合盖就不行了。

定时任务配合 IM 频道使用效果更好。比如设定“每天早上 9 点生成数据日报并发送到钉钉群”，整个流程全自动完成，不需要人坐在电脑前。

IM 频道

QoderWork 目前适配了五个 IM 平台：钉钉、飞书、Lark、微信、企业微信。

以微信为例，绑定流程就是在 IM 频道页面找到微信，扫一下二维码完成授权。

绑定完成后，最有价值的场景是远程触发任务。人不在电脑旁边，拿起手机在微信里 @ 一下机器人，描述清楚你要做什么，桌面端的 QoderWork 就会自动启动执行。任务完成后，结果消息自动推送回聊天窗口。

我试过在微信机器人里发一条“查一下葡萄牙的比赛几点踢，帮我在电脑上设个闹钟”。QoderWork 先查询了赛程信息，然后直接在 Mac 上创建了一个提醒事项。

07、几个藏在细节里的能力

应用快照

在 Mac 上连按两次 Command 键，QoderWork 会自动截取当前最前面那个窗口的画面，并作为上下文附件发送给 AI。

我正在浏览器里查阅 Claude Code 的官方文档，按下两次 Command。

QoderWork 瞬间获取到截图内容，开始提取和解析页面中的关键信息。

这个功能省掉了手动截图、打开 QoderWork、粘贴图片、再描述上下文这一整套操作，日常使用频率非常高。语音输入方面，设计工作台支持直接语音描述设计需求，对话区也支持上传音频文件自动转录成文字，不方便打字的时候用语音也能完成任务下达。

意识系统

QoderWork 的“意识”模块包含三个子功能：记忆管理、反思机制、技能进化。

记忆管理分两层。日常对话中产生的信息先存为短期记忆，跨会话后仍然有参考价值的内容自动晋升为长期记忆。所有记忆数据以 Markdown 文件的形式保存在本地磁盘上，你可以随时打开查看或手动编辑。

技能进化是一个很聪明的设计。当 QoderWork 检测到你多次执行相似的任务模式时，会主动建议将这套流程固化为一个 Skill。你可以选择采纳并保存，也可以驳回。驳回之后系统自动进入冷却期，不会反复提醒。

技术实现上，进化任务走的是 Fork Session 机制：从主会话分叉出一条轻量级子会话，共享原始上下文但独立运行，额外的资源消耗控制在主对话总开销的 5% 以内。

模型自由切换

这一点对国内用户特别重要。

QoderWork 接入了 DeepSeek V4、GLM-5.2、Kimi 2.6 等多个主流国产大模型，不锁定单一模型厂商。夜间时段（具体时间以官方公告为准）会自动切换到 Qwen3.7-Max 运行，这时 Credits 消耗倍率从白天的 0.5× 降低到 0.1×，相当于打了 2 折，但模型的推理能力并没有任何缩减。

对于有大量任务要跑的用户来说，把非紧急任务安排在夜间执行，Credits 的使用效率会提升数倍。我现在就养成了习惯，白天把需要跑的调研任务攒一攒，晚上集中让 QoderWork 处理，省下来的额度留给白天需要交互的场景。

ending

从安装到把核心功能跑完一圈，QoderWork 给我的整体感受就是两个字：顺手。

四个工作台覆盖日常高频需求，专家套件把垂直行业的复杂流程打包成了即装即用的方案，连接器把 Agent 的操作范围从应用内扩展到了浏览器和整个桌面，定时任务加 IM 远程调度让很多重复性工作可以完全自动化。

设计工作台出来的产物一键导入 Qoder IDE 就能继续写代码。Qoder + Quest + QoderWork + Qoder CLI 这套组合，在国产 AI Agent 产品矩阵里目前确实没有看到同等量级的对手。

【对大多数人来说，一个打开就能用、用完就不想换的工具，比什么跑分榜单都实在。】

我们下期见。