无限期免费,Token 随便用,舒服啊!
大家好,我是二哥呀。
粗略算一下,我每个月的token账单在 4000 多,其中 Claude 和 Codex 占大头。
说不心疼是假的,但这些钱在AI时代又必须得花,因为几乎每天都在高强度使用。

尤其是处在项目密集开发期的时候,token的消耗非常大,所以我对免费的 token 是非常渴望的。
这不,必须得告诉大家一个好消息。
Agnes AI 宣布无限期免费开放全模态模型 API。文本、图片、视频,三条线全免费,不限量哦。

我拿到的一个数据样本是这样的。全模态总Token调用量达到3.12T,其中文本模型 Agnes-2.0-Flash 贡献了约1.9T;视觉模型Agnes-Image-2.1-Flash + Agnes-Video-V2.0 合计贡献了约1.2T。
非常恐怖的一个数据啊!
说明大家对免费token的需求真的非常大。
我也是第一时间就把 Agnes 的这三个模型接到了 PaiAgent(我的一个开源项目),从文本对话到图片生成到视频输出,一条龙跑完。

系好安全带,我们粗粗粗发~
01、先把 API Key 搞到手
Agnes 的注册流程很快,访问:
https://platform.agnes-ai.com
登录后在控制台创建 API Key。

Agnes 的 API 是兼容 OpenAI 格式的,Base URL 是 https://api.agnes-ai.com/v1,认证方式和 OpenAI 一样,在 Header 里传 Authorization: Bearer <API_KEY>。
这意味着市面上所有支持 OpenAI 接口的工具、框架和平台,改一下 Base URL 和 API Key 就能直接用 Agnes 的模型。
简单给大家介绍下,PaiAgent是一个类似dify的企业级工作流编排平台,用到了LangGraph4J、SpringAI、MCP、Skill、React等一系列 AI Agent 相关的技术栈,在GitHub上也有快 500 star了。
https://github.com/itwanger/PaiAgent

好,我们继续上实战。
在 PaiAgent 的全局模型配置里,新建一个配置,供应商选 Agnes,API 地址填 https://api.agnes-ai.com/v1,模型名填 agnes-2.0-flash,API Key 填之前复制的那个。

为了支持图片和视频生成,图片模型填 agnes-image-2.1-flash,视频模型填 agnes-video-v2.0,保存即可。

TTS 预计本周五灰度,到时候我也会第一时间接入。
有了语音能力,Agnes 就真正实现了全模态覆盖,文本、图片、视频、语音四条线齐活。
02、文本模型Agnes-2.0-Flash
Agnes-2.0-Flash 是一个通用文本模型,覆盖对话、代码生成、知识问答、任务规划和工具调用。
在 Claw-Eval 评测中,它的 Safety 得分达到 97.2、Robustness 得分 95.4,这两个维度衡量的是模型在对抗性输入下的稳定性和安全性,属于 Agent 场景下的硬指标。

Claw-Eval 和传统 Benchmark 不同,评测的不是数学题和选择题,而是模型在真实 Agent 场景下的综合执行能力,包括工具调用准确性、多步骤规划和复杂上下文保持。
是最接近 AI Agent 实战能力的评测。

目前,Agnes-2.0-Flash 已支持 1M 上下文,我也将其接入到了 PaiCLI,这是我手搓的一个类似 Claude Code 的工具。

由于加了底部状态栏和token预测,所以能很直观地看到 1M 上下文的使用情况。
对于长文档处理和复杂 Agent 场景来说,这个容量的提升非常有用,尤其是当模型需要频繁回顾之前的对话历史或者工具调用结果时。
我把Redis的面渣逆袭扔给他,这份文档有 4.6 万字,我们先让PaiCLI读取一下完整的内容。
读一下:https://javabetter.cn/sidebar/sanfene/redis.html 这份文档的内容,稍后我会问你一些问题

我的第一个问题是:说一下rdb和aof的区别吧。

注意看底部的状态栏,上下文只占用了 1M 上下文的 18%。

上下文窗口装的内容越多,相对来说摘要压缩的触发频率就越低,我们就越容易在长文档里找到准确的细节信息。
注意,PaiCLI在读取面渣逆袭Redis篇的时候,还调用了 Web Fetch 工具和 Chrome Devtools MCP 工具。

Function Calling 是 Agent 场景的核心能力,Agnes-2.0-Flash 在这方面的表现也很不错。
03、图片模型Agnes-Image-2.1-Flash
Agnes-Image-2.1-Flash 是 Agnes 旗下的核心图片生成模型,支持文本生成图片(文生图)和图片编辑(图生图)两大类能力。
目前正在灰度支持 4K 输出,最高可以生成 4096×4096 的超高清图像。
免费模型能输出 4K,这个诚意十足啊。
图片模型的 API 同样兼容 OpenAI 格式,核心参数就四个。
{
"model": "agnes-image-2.1-flash",
"prompt": "提示词",
"size": "1K",
"ratio": "1:1"
}size 支持 1K、2K、3K、4K 四档,ratio 支持 1:1、3:4、4:3、16:9、9:16、2:3、3:2、21:9 八种宽高比。
我在 PaiAgent 里用图片生成节点实测了几个场景。
文生图,提示词是“清晨的长安街道,一位穿汉服的年轻女子(约摸20岁)撑着油纸伞走过石板路,樱花花瓣飘落,背景是朦胧的木质建筑,整体色调温暖柔和,胶片质感”。

出图速度大约 10 秒,人物的发丝细节和伞面的光泽渲染得很自然,花瓣的飘落轨迹也没有那种 AI 生成常见的悬浮感。

再来一张:“一位戴着圆框眼镜的亚洲女生,坐在咖啡馆靠窗的位置,阳光透过玻璃打在脸上,自然光线,浅景深,照片级真实感,富士 Superia 400 胶片色调”。

皮肤质感、光影过渡、眼镜边框的反光都处理得很到位,尤其是窗外光线在脸上形成的明暗分界线非常自然,没有那种 AI 人像常见的磨皮感。
图生图,让模型把人物表情改成自然的微微一笑,并且改成证件照。

Agnes-Image-2.1-Flash 的编辑能力支持图改图、多图融合、局部修改、背景替换、风格转换、文字编辑和图像修复,总共七种编辑模式。
我试了一下证件照场景,上传一张普通照片,提示词写“将图像生成一张蓝底证件照”,出来的结果背景替换得很干净,人物边缘没有明显的毛边。

4K 能力上线后,对电商主图、产品海报、广告素材这类需要高分辨率输出的场景会更友好。
只需要把 size 参数从 1K 改成 4K,其他代码不用动。
04、视频模型Agnes-Video-V2.0
Agnes-Video-V2.0 支持原生音画同步生成,这个“原生”是指视频和音频在同一次推理中同步产出,不是先出画面再配音。
输出分辨率可选 720P 和 1080P。
在 Artificial Analysis 的 Video Leaderboard 上,Agnes-Video-V2.0 同样取得了不错的成绩。

视频模型的能力覆盖面很广,包括首帧生视频、首尾帧生视频、多帧生视频、多镜头内容生成、人物内容生成、景别切换、第一视角运镜和光影氛围塑造。
我在 PaiAgent 的视频生成节点跑了三个测试。
第一个是纯文本生视频。正好赶上 2026 世界杯,提示词是“世界杯赛场,一名球员进球后庆祝,镜头从正面特写缓缓拉远到中景,身后两名队友跑来拥抱,背景是虚化的看台和灯光,慢动作,电影质感”。

生成耗时大约 120 秒。
镜头拉远的过程中,两名队友从跑进画面的节奏控制得不错,背景的看台和灯光做了虚化处理,视觉重心始终在庆祝动作上。配合原生音效,球迷欢呼声和球员的喊叫都是模型自动生成的,整体氛围很到位。
【视频1】
关于音画同步这个能力,多说两句,因为这是 Agnes-Video-V2.0 和大部分同类视频模型的核心区别。
市面上大部分视频模型生成的是纯画面,音频需要额外用 TTS 或音效模型来配。
Agnes-Video-V2.0 原生输出带音频的视频文件,欢呼声、环境音都是模型根据画面内容自动匹配的。
这种场景级别的音频匹配精度在免费模型里确实少见。当然,原生音频的质量和专业音效工具比还有差距,但对于短视频、产品 Demo、社交媒体内容这类场景已经够用了。

PaiAgent 的视频生成节点内部实现了一个轮询机制,先提交生成任务拿到 taskId,然后每 5 秒查询一次任务状态,直到生成完成或超时(最长 5 分钟)。生成完的视频会自动转存到 MinIO 对象存储,返回可访问的 URL。整个流程对用户透明,在工作流画布上拖一个视频生成节点,填好提示词,点执行就行。
05、GitHub 生态和全模态布局
一个模型好不好用,看开发者愿不愿意围绕它做生态。
Agnes 模型免费开放两周以来,GitHub 上已经出现了非常多围绕 Agnes AI 的开源项目。项目类型涵盖 Agent Skill、CLI 工具、Web 应用和 API 网关,覆盖了 Claude Code、Codex 等主流开发者工具。

比如 Yacey 的 agnes-ai-generation-skill,可以把 Agnes 的文生图、图生图、文生视频能力封装成可复用的 Skill;kangarooking 的 agnes-free-model-skills,则偏向 Codex / Claude Code 这类 Coding Agent 的多模态能力扩展;还有 comfyui-agnes-ai,把 Agnes 接进 ComfyUI 节点,让设计师和创作者可以在熟悉的工作流里调用 Agnes。
- https://github.com/Yacey/agnes-ai-generation-skill
- https://github.com/kangarooking/agnes-free-model-skills
- https://github.com/16nic/comfyui-agnes-ai
Agnes 的全模态布局目前覆盖文本、图片、视频三条线,TTS(语音合成)能力预计本周也会灰度上线。到时候文本生成、图片生成、视频生成、语音合成四种能力就齐了,一套 API Key 全部搞定。
Agnes AI 官方公布了一组数据。全模态总 Token 调用量达到 3.12T。文本模型贡献约 1.9T,图片与视频模型合计约 1.2T。

其实首周的数据就已经很猛了:Agnes-2.0-Flash 调用量超过 1 万亿 Token,Agnes-Image-2.1-Flash 生成量超过 200 万张图片,Agnes-Video-V2.0 生成量超过 200 万秒视频。
说明免费政策确实降低了开发者在视觉内容生成方面的试用门槛。之前需要算着成本来生成,现在可以大量尝试不同的提示词和参数组合,不用盯着余额干活。
PaiAgent如何写到简历上?
项目名称:PaiAgent
项目简介:企业级 AI 工作流可视化编排平台,通过拖拽式界面构建和执行 AI 工作流。
技术栈:Java 21、Spring Boot 3.4、Spring AI 1.0、LangGraph4j、React 18、TypeScript 5

核心职责:
- 基于 Spring AI 框架实现多模型统一接入层,支持 Agnes、DeepSeek 等 10+ 模型供应商的热切换
- 设计并实现图片生成和视频生成节点执行器,视频节点支持异步任务提交与轮询机制,生成结果自动转存 MinIO 对象存储
- 构建 DAG + LangGraph4j 双引擎工作流执行架构,支持条件分支、并行执行和循环节点,工作流编排复杂度覆盖 90% 以上的企业 Agent 场景
- 实现 Skills 技能系统,支持 YAML 声明式技能定义和三级渐进式加载,开发一个新 Skill 的平均耗时从 2 小时降低到 15 分钟
一周前我还在纠结 API 账单怎么控制。
现在 Agnes 的文本、图片、视频三个模型全部免费,不限量。

PaiAgent 工作流里的每个节点都换上了,跑了上百次测试,一分钱没花,爽啊。
对 token 有需求的小伙伴可以冲一波。
- Agnes AI 的 API 文档:https://agnes-ai.com/doc
- Agnes API 控制台:https://platform.agnes-ai.com
