标签: Image

Agent117
Java并发编程34
Java虚拟机28
AI23
Java重要知识点22
Spring Boot22
面渣逆袭21
Claude Code21
面向对象编程20
学习路线20
PDF16
OpenClaw16
集合框架（容器）15
求职14
Skills14
城市选择13
面试题&八股文13
学习建议13
面试13
RAG13
数组&字符串11
辅助工具/轮子11
Java IO11
知识星球11
大模型11
AI工具10
Java概述9
程序员9
Java语法基础8
常用工具类8
辅助工具8
面试题8
优质面经7
MCP7
优质文章6
实战项目6
AI编程6
Codex6
异常处理5
Java NIO5
Redis5
知识库搭建5
面经5
Java5
AI Coding5
IDEA4
Java新特性4
MySQL4
秋招4
AI Agent4
DeepSeek4
GLM4
心路历程3
Java网络编程3
Spring3
Vue3
面试经验3
面试准备3
offer3
春招3
社招3
校招3
Browser3
Chrome DevTools3
PaiCLI3
CLI3
IntelliJ IDEA3
OpenAI3
Qoder3
QoderWork3
微信3
Git2
破解合集2
暑期实习2
年终奖2
LLM2
Agent平台2
CC GUI2
智谱清言2
AI教育2
学习搭子2
Hermes2
Spring AI2
开源项目2
Experts Mode2
多Agent协作2
SkillHub2
大模型测评2
Step 3.5 Flash 26032
操作系统1
计算机网络1
Elasticsearch1
Maven1
微服务网关1
MongoDB1
面试题集合1
消息队列1
netty1
Nginx1
轮子1
星球周报1
ZooKeeper1
简历1
钉钉1
蚂蚁1
Image1
Prompt1
安全1
Agent Skills1
开源1
ArkClaw1
火山引擎1
AI办公1
BMad1
敏捷开发1
实战1
Agent Browser1
浏览器自动化1
电子宠物1
Claude1
编程1
ChatGPT1
插件1
飞书1
GPT-5.41
CoPaw1
通义千问1
README优化1
Embedding1
AI进化1
EvoMap1
飞书CLI1
Token1
API1
智谱1
GLM-51
GPT-5.3-Codex1
Harness Engineering1
知识管理1
Kimi1
ok computer1
LangGraph4j1
LangGraph4J1
国产大模型1
Vibe Coding1
AI应用1
端侧模型1
AI绘图1
Lovart1
GitHub1
架构1
Memory1
Ollama1
企业微信1
OpenRouter1
存储管理1
Mac清理1
Qwen1
AI测评1
AI面试1
Skill1
源码分析1
Skywork1
桌面版测评1
AI工作流1
Twitter1
火山方舟1
Coding Plan1
工具1
安卓1
ClawBot1
WeClaw1
文心一言1
多模态1
ZeroClaw1

Agent 终于能看图了！GLM-5V 让 PaiCLI 在图像识别上有了一双眼睛。

大家好，我是二哥呀。

PaiCLI 已经非常强大了，有 ReAct、Multi-Agent、MCP、Skill、Function Calling，基本上 Claude Code 有的功能都覆盖到了。

今天这篇，我们给 PaiCLI 再追加一个能力：图片输入。听起来简单，但真正做起来涉及到的东西很多。

这个功能的核心前提是多模态模型。单纯的文本模型是看不了图的，比如说 GLM-5.1，于是我们追加了 GLM-5V 模型的 endpoint。

沉默王二大约 13 分钟