乔氪智造 · QIAOKE LAB
AI AGENT 全景报告 · 2026.06
全球产业地图 · GLOBAL AGENT LANDSCAPE

AI Agent 元年
从写代码到替你干活

三十多个工具同台 · 从硅谷前沿到中国全栈
从你坐着开的编辑器,到不关机替你跑腿的自主 Agent

2026 年,真正变的不是某个工具更强了,而是「人和机器怎么协作」这套规则,整个换了赛道——从替你写代码,到替你办事;从一个个被动工具,到一支支自己跑的 Agent。这份报告把全世界的玩家摆上同一张桌子,看清谁在狂奔,谁在掉队,谁已经死了、只是你还没收到讣告。

收录工具
34
梯队
6 大类
覆盖系统
macOS · Windows · Linux
情报窗口
2025 H2 — 2026.06
出品
乔氪智造
向下滚动 · SCROLL ↓
00THE BIG PICTURE

一口气讲清这盘棋

如果你只有三分钟,记住一句话:编程工具已经走完「自动补全 → 聊天问答 → 编辑器里的 Agent → 终端里的 Agent」四级跳,正在长出第五个物种——不关机、自己干活、随叫随到的常驻 Agent。而就在同一年,行业里两股力量正面对撞:一边是开源工具遍地开花、模型随便换;另一边是巨头把养肥了的开源项目重新关进笼子。

5
代际 · 补全到常驻
2
对撞 · 开源 vs 闭源回潮
$20+
主流月费基准线
06/18
一个时代的退役日

下面四条判断,是这份报告的骨架。看懂了它们,后面所有工具你都能自己归位:

这份报告怎么读第 01–04 章建立全局认知和全员对比;第 05 章专门写给不懂技术的普通人;第 06–10 章按场景 × 操作系统 × 远程操控 × 安全给落地打法。每个工具都标了存活状态: 活着、 要留神、 已凉。别选到僵尸项目。
01THE TAXONOMY MAP

两个真问题,定所有人的位置

看清这整张地图,只需要回答两个问题。第一,它是专门写代码的,还是什么都能干的通用 Agent?第二,它跑在厂商手里(闭源托管),还是你自己手里(开源自托管)?横轴答前一个,纵轴答后一个,三十多个工具就各就各位。挑这两根轴,是因为它们是工具改不掉的底色——至于「是交互还是自动、在线还是常驻」,那只是你怎么用它、加不加一个定时任务的事,换个用法就变,定不了谁的位置。

↑ 厂商托管 · 闭源 ↓ 自托管 · 开源 ← 专精编码 通用自主 → 商业编码工具 闭源通用 Agent · AI 员工 开源编码 Agent 自托管通用 Agent Cursor 3 Windsurf Trae Qoder CN 文心快码 CodeBuddy Antigravity 2.0 Claude Code Devin Codex CLI OpenCode Aider Cline / Continue Qwen Code CodeGeeX Pi Crush OpenHands Manus (这一格目前还空旷) Goose Hermes OpenClaw AgentScope Coze / Dify OpenManus CrewAI MetaGPT · LangGraph
图 01 坐标系 · 横轴=任务域(编码↔通用),纵轴=谁掌控运行时(托管↔自托管)· 蓝=国产 / 绿=海外开源 / 黄=闭源 / 红=旗舰或高风险
左上 · 商业编码工具

Claude Code、Cursor、Windsurf、国产 IDE。专门帮你写代码,跑在厂商云上,体验最顺、模型最强,但数据和模型你管不着,按月付费。

右上 · 闭源通用 Agent

Manus 这类「AI 员工」SaaS。野心是什么都替你干,但同样是厂商托管的黑盒。这一格眼下还空——又通用、又闭源托管、还成熟的产品,目前不多。

左下 · 开源编码 Agent

OpenCode、Aider、Qwen Code、OpenHands。一样专注写代码,但开源、可自托管、模型随便换、数据在你手里。要懂点技术,每一寸归你管。

右下 · 自托管通用 Agent

Hermes、OpenClaw、AgentScope、Dify、CrewAI。什么都能干,且装在你自己机器上。最自由,也最吃运维和安全。

02HOW WE GOT HERE

能力,是一层层叠上来的

AI 编程这几年,是把能力一层层叠上来的:先会补全,再会对话,然后能跨文件改、能自己调用工具、能扛住一个长任务。新的能力没把旧的扔掉——它们全都还在,今天你用的每个工具,都同时站在这五层之上。

L1 补全 猜你下一行 Copilot · '21–'23 L2 对话 问答 + 解释代码 ChatGPT · '23 L3 多文件编辑 跨文件自动改 Cursor / Windsurf · '24 L4 工具执行 读写文件 · 跑命令 · 调工具 Claude Code / Codex · '25 L5 长程自主 长任务 · 并行 · 失败自恢复 '25–'26 今天每个工具 都站在五层之上 Claude Code · Cursor Hermes · Qwen Code … ⚠ 「自主 / 常驻」是一个部署选择,不是新增的一层能力
图 02 五层能力,层层累加

你大概常听到「自主 Agent 是质的飞跃」这种说法。落到实处其实很朴素:把 Claude Code、Codex 挂一个定时任务,它一样能自己跑——「常驻、自己发起」是谁都能配的部署选项,不是某类工具独有的天赋。

真正把今天这些工具区分开的,是上一章那两根轴:它专精编码,还是什么都干;它跑在厂商手里,还是你自己手里。那 Hermes、OpenClaw 是什么?它们落在「通用 + 自托管」这个象限,把常驻、跨会话记忆、几十个消息通道打包成开箱即用的产品——替你省下自己搭定时任务、接消息平台、做记忆系统的功夫。它们卖的是封装和便利,这本身就很有价值。

03THE FULL ROSTER

六大梯队逐一点名

这一章是全景的肉——三十多个工具,分六个梯队,挨个点名。每一条都告诉你:谁做的、什么许可、能不能自己部署、接什么模型、跑什么系统、现在还活着没有。

活跃维护 要留神 已凉 OSS开源 闭源 国产

3.1商业编码工具 · 闭源云主力

你坐下来手动开发的主战场——体验最顺、模型最强、按月付费。
Claude Code
Anthropic
终端加桌面端的 Agent 式编码工具,被公认是「CLI Agent」这个范式的定义者。要论纯粹的 Agent 质量和多文件改动的稳,它是当下那条标尺。
订阅 / APICLI + 桌面mac · win · linuxClaude 系
Codex
OpenAI
OpenAI 的编码 Agent。命令行那端是开源的(Apache-2.0),云端缝在 ChatGPT 里。强在跟 GPT 系模型贴身配合。
CLI: Apache-2.0CLI + 云mac · win · linuxGPT 系
Antigravity 2.0
Google · I/O 2026
Google 的野心样本。它不满足于做一个编辑器,而是铺开了五个面:桌面端、CLI、SDK、托管 Agent API、企业平台。带 cron 定时任务、并行子 Agent,默认跑 Gemini 3.5 Flash。它要的不是「更好用的 VS Code」,是「你所有 Agent 的地基」。
闭源 / 订阅五面平台mac · win · linux*Gemini 3.5
Cursor 3
Anysphere
把整个界面重做成一个能并行盯着多个 Agent 干活的工作台(跨仓库、跨分支、跨远程、跨 worktree),还带可视化改 UI 的 Design Mode。它的自研编码模型 Composer 2,底子是月之暗面的 Kimi K2.5 续训而来——一个美国头部工具,建在中国基座上,这件事本身就值得品。
$20/月并行 Agent 工作台mac · win · linux自研 + 多模型
Windsurf
Cognition(Devin 母公司)
被 Devin 母公司 Cognition 以 2.5 亿美元收入囊中,注入了「自主软件工程师」的基因。自研模型 SWE-1.5 跑在 Cerebras 晶圆级芯片上,950 字/秒,比同档模型快出五到十几倍;覆盖 40 多个 IDE。它赌的是速度和广度。
$20/月40+ IDEmac · win · linuxSWE-1.5 自研
Gemini CLI
Google
105k 星、社区贡献过六千多个 PR 的开源终端 Agent(Apache-2.0)。2026-06-18 起,对免费 / Pro / Ultra 个人用户停服,由闭源的 Antigravity CLI 接棒;企业版和付费 API key 还留着。它是这份报告「开源不等于永生」最痛的注脚。
个人档退役→ Antigravity CLI(闭源)Gemini 系

3.2开源 CLI Agent · 模型随便换

命令行里跑,模型可换、数据本地、能塞进 CI。2026 上半年,这块洗了一轮牌。
OpenCode
社区 · MIT
十六万星往上,被一致认为是 2026 年「最稳的开源默认选项」——谁家模型都能接、最活跃、数据不上云。代码安全敏感的团队,第一个看它。唯一的小插曲:跟 Anthropic 闹了一场,下掉了 Claude 登录,现在得用裸 API key。
MIT自托管任意模型mac · win · linux
Aider
社区 · Apache-2.0
Git 原生的终端编码助手——每次改动都是一个 commit,每个会话都是一条能回滚的分支。它是这堆工具里纪律性最强的那个,适合做事讲究、不容乱改的人。
Apache-2.0Git 原生任意模型mac · win · linux
Goose
Block → Linux 基金会 AAIF
通用型 Agent,不止写代码(Rust 写的)。今年转进 Linux 基金会旗下的 Agentic AI Foundation,治理中立、长期靠谱。想要一个「编码之外也能干活」的,选它。
ASL-2通用 Agent任意模型mac · win · linux
Qwen Code
阿里 QwenLM
阿里开源的终端编码 Agent,npm / brew 一条命令装,原生跑 Apple Silicon。云接 DashScope,本地接 Ollama / LM Studio 连 key 都不用。国产开源 CLI 里最成熟的一个。
Apache-2.0国产DashScope + 本地mac · win · linux
Pi
Armin Ronacher · MIT
出自 Flask、Jinja2 作者 Armin Ronacher 之手,靠一份不到 1000 token 的系统提示词冲到 5 万星,是今年最受关注的「可魔改骨架」。想自己造 Agent 脚手架的 hacker,会爱它。
MIT可魔改任意模型
Cline / Continue
社区 · Apache-2.0
VS Code 里的两员开源大将。Cline(v3.81、500 万+ 安装)功能最全,今年还把核心抽成了独立 SDK;Continue 主打「开发者全程掌控」的助手,JetBrains 友好、重定制。两者都能接任意模型和本地端点。
Apache-2.0VS Code任意模型
Crush
Charm
终端美学派的代表,Charm 出品,2.5 万星,更新极勤。多模型、LSP 加持、MCP 可扩展,跨平台覆盖夸张。注意它是 FSL 源可见许可(两年后转 MIT),不算纯开源——有严格采购红线的团队要看清。
FSL → MIT终端任意模型全平台
Roo Code
社区
约 2.4 万星的 VS Code Agent,2026 年 5 月 15 日归档,团队转去做云产品。它和 Gemini CLI 一起,把同一句话钉进每个人脑子:人气,保不了命。
已归档 → 迁 Cline

3.3国产 Coding · 大厂系

大厂生态产品,体验好、接国产模型顺,多为闭源但常给企业私有化。
Qoder CN
阿里云
阿里把这条线(很多人熟悉的「通义灵码」)并进了 Qoder 品牌,现在叫 Qoder CN。形态铺满:IDE、JetBrains / VS Code 插件,还加了 CLI;底层接 GLM、DeepSeek、Kimi、MiniMax,全链路国内云、合规。主打日常编码效率和现有代码优化。
闭源 / Credits国产IDE + 插件 + CLI多国产模型
Qoder
阿里 · Qoder 1.0
和 Qoder CN 互为「双子星」,专攻任务自动化。Qoder 1.0 把 AI IDE 升级成了「Agents 自主开发工作台」——你定需求,Agent 跑全流程,还能从手机上远程派活、多 Agent 并行。跟远程操控的场景天生一对(见第 08 章)。
闭源国产手机远程Agents 工作台
CodeBuddy
腾讯云
腾讯的牌,已经出了独立 IDE 版本,不再只是插件。智能体 Craft 能自主多文件生成改写、设计稿一键转代码、秒级部署;国内版免费调 DeepSeek 等模型;企业级安全(等保三级、SM4 加密)。微信生态开发者的顺手之选。
闭源 / 企业私有国产CLI + IDE + 独立
Trae
字节跳动
字节的 AI 原生 IDE,把 AI 织进底层架构,而不是贴个插件。亮点是 SOLO 模式(自己拆需求、写代码、跑测试一条龙)和 Builder 模式(一句话生成完整项目骨架)。累计注册 600 万+、月活 160 万+。想从零快速出原型,它最对路。
闭源国产AI 原生 IDESOLO / Builder
文心快码 Comate
百度
百度的牌,最新 3.5S 版强化了多智能体协同,也支持 DeepSeek、Kimi。规格驱动开发、项目理解准,智能体 Zulu 能端到端完成编程任务,Figma 转代码尤其出色。规范优先、做前端的团队会喜欢。
闭源国产spec-driven文心系
CodeGeeX
智谱 AI · 清华
作为免费插件,它现在依然能打:更到 v2.12.0、官网在运营、百万级用户、支持 300+ 语言和本地模式。但要分清楚——它的开源大模型卡在 2024 年 7 月的 CodeGeeX4,两年没出新的。当个免费插件用没问题;你要是冲着「国产开源大模型」来的,它已经不是那个答案了。
插件免费国产开源模型 2024.07 停更GLM 系

3.4国产 · 能塞进内网的

代码不能出内网、要合规时的选择——100% 可私有化部署。
CodeFuse

蚂蚁出品,开源,能完整私有部署,覆盖编码全流程,组织持续活跃迭代。

开源 · 企业私有化 · 活跃
MonkeyCode

安全公司长亭出品,AGPL-3.0,企业级、可完全私有化、带 SDD 流程。平台较新,专用 CLI 还在早期。

AGPL-3.0 · 安全基因
SolonCode CLI

无耳科技出品,MIT、Java、全中文提示词,近乎周更。provider 无关、支持 MCP/LSP,Java 生态自建可控管线的好料。

MIT · 维护极勤

3.5通用 / 自主 Agent 框架

不只写代码——用来编排「做各种事」的框架与平台。
OpenHands
原 OpenDevin · MIT
编码型 Agent 平台,CLI、GUI、Docker 全有,今年还放出了 V1 SDK。最适合无人值守、沙箱化、塞进 CI 的活。本地跑大模型偏重(推荐配置要 64GB 以上统一内存),指向云 API 时最香。
MIT自托管CI / 无人值守mac · win · linux
OpenManus
MetaGPT 团队 · MIT
完全可自托管的通用自主 Agent,Python 3.12,带 Dockerfile,无邀请码,现在归 FoundationAgents 维护(v0.3.0)。注意:接国产模型的端点配置官方没明文,得自己验。
MIT自托管通用 Agentmac · win · linux
AgentScope
阿里通义实验室 · Apache-2.0
生产级多 Agent 编排框架,2.0 版本,2.6 万星,生态丰富。message hub 灵活编排,ReAct、工具、记忆、规划俱全,原生接 DashScope / Qwen。想自己写编排逻辑,这是国产首选。
Apache-2.0国产多 Agent 编排DashScope 原生
Coze Studio / 扣子开源版
字节跳动 · Apache-2.0
可视化的 no-code / low-code Agent 平台,拖拉拽搭工作流、RAG、知识库。强依赖 Docker,Web 界面在 localhost:8888。不想写代码的人最友好。
Apache-2.0国产可视化 no-code需 Docker
Dify · CrewAI · MetaGPT · LangGraph · AutoGPT
各社区
框架阵营的其余主力:Dify(开源 LLMOps,国内低代码 Agent 画布主流)、CrewAI(角色化多 Agent,采用率最高,MIT 核心 + 商业版)、MetaGPT(软件公司式多角色,DeepWisdom)、LangGraph(图式有状态编排,v1.2,生产领跑)、AutoGPT(自主 Agent 鼻祖,但 Classic CLI 已归档、转了 no-code,势头被前几位盖过)。多是开发者自建编排所用。
多数开源自托管框架 / SDK

3.6常驻个人 Agent · 新物种

装在不关机的机器上,常驻、自主、接消息平台——第五代。
Hermes Agent
Nous Research · MIT
这个新物种里姿态最干净的一个。核心卖点是学习闭环:干完活自己抽取可复用技能、跨会话记住你、给你建模、定期自我整理。装它不用 Docker(一条 curl 加 uv 搞定),聊天模式下可以零入站端口,五家国产模型 API 全是一等公民。常驻首选。
MIT学习闭环零暴露端口国产模型一等mac · win · linux
OpenClaw
Peter Steinberger 出品
史上涨星最快的开源项目之一,TypeScript,技能市场加 50+ 消息通道,单进程常驻能力很强。但它身上挂着多个已公开的严重漏洞——浏览器到本地的劫持、鉴权令牌窃取致远程执行(详见第 09 章)。能用,但你得有持续锁配置、追补丁的觉悟,不是装上就能撒手的。
开源安全隐患技能市场50+ 通道mac · win · linux
04THE GRAND MATRIX

全员摊开来比

点完名,把代表性选手拉到同一张表上横着量——类型、许可、能否自托管、接不接国产模型、跨不跨系统、还活着没有。

工具梯队许可自托管接国产模型跨系统状态
Claude Code前沿 CLI闭源/订阅否(自家)mac/win/linux
Codex前沿 CLICLI 开源部分否(自家)mac/win/linux
Antigravity 2.0托管云否(Gemini)mac/win/linux*
Cursor 3前沿 IDE闭源可配端点mac/win/linux
Windsurf前沿 IDE闭源可配端点40+ IDE
Gemini CLI前沿 CLIApache-2.0否(Gemini)mac/win/linux 个人档退役
OpenCode开源 CLIMIT任意端点mac/win/linux
Aider开源 CLIApache-2.0任意端点mac/win/linux
Qwen Code开源 CLI · 国产Apache-2.0原生 DashScopemac/win/linux
CodeGeeX国产 IDE插件免费/模型旧GLM 原生跨 IDE 模型停更
Qoder CN / Qoder国产厂商闭源/企业企业版GLM/DS/Kimi跨平台 + 手机
CodeBuddy国产厂商闭源/企业企业私有混元系CLI/IDE/独立
Trae国产 IDE闭源豆包系mac/win
CodeFuse / MonkeyCode国产私有化开源可配服务器
OpenHands自主框架MIT可配端点mac/win/linux
OpenManus自主框架MIT需验证mac/win/linux
AgentScope自主框架 · 国产Apache-2.0原生 DashScope跨平台
Coze Studio可视化 · 国产Apache-2.0需 Docker可配mac/linux+Docker
Hermes Agent常驻 AgentMIT五家一等mac/win/linux
OpenClaw常驻 Agent开源五家原生mac/win/linux 安全注意

* Antigravity CLI 的 Linux 仍是 preview。「接国产模型」指 DeepSeek / Qwen / GLM / Kimi / MiniMax 至少原生支持一家;「可配端点」指通过 OpenAI 兼容接口间接接入。

4.2鲜度快照 · 别选到僵尸

逐个核过的存活状态与近况(窗口至 2026.06)。下手前,先扫这一栏。
活跃维护 要留神(转型 / 新嫩 / 部分停更) 归档 / 退役
工具状态近况 / 版本(2026)给你的提醒
Claude Code 活跃CLI Agent 范式标杆,持续迭代体验天花板,闭源订阅
Codex 活跃CLI 开源 + 云端集成绑 GPT 系
Antigravity 2.0 活跃I/O 2026.05 五面平台发布正接收 Gemini CLI 用户
Cursor 3 活跃2026.04 发布,Composer 2 自研Composer 2 建在 Kimi K2.5 基座上
Windsurf 活跃Cognition 收购后连发,SWE-1.5SWE-1.5 暂无公开 API
Gemini CLI 退役2026-06-18 个人档停服迁 Antigravity CLI / OpenCode
OpenCode 活跃16 万+ 星,最活跃开源默认已下掉 Claude 登录,用 API key
Aider 活跃Git 原生,长期稳定纪律性最强
Goose 活跃转入 Linux 基金会 AAIF治理中立,通用 Agent
Qwen Code 活跃阿里维护,原生 arm64国产开源 CLI 最成熟
Pi 活跃Armin Ronacher 出品,5 万星可魔改骨架
Cline 活跃v3.81,2026.05 拆出 SDK500 万+ 安装,功能最全
Continue 活跃2026 新增 Agent ModeJetBrains 友好,重定制
Crush 活跃Charm,2.5 万星,2026.06 仍更FSL 源可见,非纯开源
Roo Code 归档2026-05-15 归档,转云产品迁 Cline / Kilo
Qoder CN / Qoder 活跃Qoder 1.0 工作台 + CLI(2026.05)原通义灵码并入此线
CodeBuddy 活跃独立 IDE + 智能体 Craft微信生态友好
Trae 活跃600 万注册,SOLO 模式快速出原型
文心快码 活跃升级 3.5S,智能体 ZuluFigma 转代码强
CodeGeeX 留神插件 v2.12 活跃,开源模型停在 2024.07当免费插件 OK,当开源大模型已落后
CodeFuse 活跃蚂蚁,2026.05 仍提交私有化可控
MonkeyCode 留神长亭 2025.12 推出,AGPL-3.0平台新,CLI 尚早期
SolonCode CLI 活跃近周更,MIT,全中文Java 生态自建
OpenHands 活跃发布 V1 SDK本地跑大模型重,宜云 API
OpenManus 活跃迁 FoundationAgents,v0.3.0接国产模型需自验
AgentScope 活跃v2.0,2.6 万星国产生产级编排首选
Coze Studio 活跃字节,频繁发版强依赖 Docker
Dify 活跃国内低代码 Agent 画布主流可视化编排
CrewAI 活跃采用率最高,加 A2AMIT 核心 + 商业版
MetaGPT 活跃DeepWisdom,SOP 多角色软件开发自动化
LangGraph 活跃v1.2(2026.05),生产领跑复杂有状态编排首选
AutoGPT 留神Classic CLI 已归档,转 no-code势头被 LangGraph/CrewAI 盖过
Hermes Agent 活跃Nous Research,学习闭环常驻首选,零暴露端口
OpenClaw 留神涨星极快,但有公开漏洞史常驻须锁配置 + 追补丁
05FOR EVERYONE

不懂技术的你该怎么选

上面那张大表,普通人不用啃。这一章只服务一件事:让一个完全不写代码的人,也能搞清楚自己到底要不要碰这些东西、碰哪个。先回答三个问题,对号入座就行。

先问自己三个问题

① 你要它
「写代码」还是「办事」?

想写代码 → 看编辑器和 CLI 那类。想让它办事(整理文件、提醒、爬信息、收发消息)→ 看常驻 Agent 那类。

② 你碰不碰
命令行、Docker?

完全不碰 → 老老实实用网页和桌面 App。愿意敲一两条命令 → CLI 类可以上。爱折腾 → 自托管随便玩。

③ 为了隐私
你愿不愿多折腾?

无所谓 → 云服务最省心。很在意 → 自托管加本地模型,但得搭上硬件和精力。

上手难度,三级台阶

🟢 零门槛
网页版 / 桌面 App——Claude 桌面、扣子、通义、文心。点开就用,不碰任何部署。适合 90% 的人
🟡 轻技术
装个 CLI——Claude Code、Qwen Code 这类。一条命令装好,在终端里用。愿意看两篇教程即可
🔴 要折腾
自托管 / 接模型——Hermes、OpenHands、OpenClaw、Coze 私有部署。要懂 Docker、端口、模型配置。技术爱好者 / 极客

三种普通人,三个答案

偶尔用一下

只想问问问题、写点小东西。→ 直接用云 App(Claude、扣子、通义),别碰部署。一个月十几二十块封顶,省心。

关键词:别折腾
想要个帮手

想让它替你处理重复杂活(邮件、整理、提醒、定时爬信息)。→ 上常驻 Agent(如 Hermes),用微信、飞书或 Telegram 这类平台遥控。需要一台常开的机器。

关键词:跑腿管家
就爱折腾

想省钱、重隐私、享受 DIY。→ 自托管加本地模型(Ollama 跑 Qwen / GLM / DeepSeek 开源版)。前期投入大,长期几乎零成本。

关键词:全在我手里

普通人,三条红线别踩

务必守住 ① 别裸奔暴露端口。常驻 Agent 能不开公网端口就别开,走聊天平台让它出来找你。
② 别给它无限权限和你的钱包。能花钱的 key、能删东西的权限,要设上限、要它先问你。
③ 别全自动放养。删除、发送、付款、对外发布这种事,让它「先问一句再动手」。

钱大概怎么花

模式怎么收费适合谁坑在哪
云 App 订阅$10–20/月 起绝大多数人高阶档能飙到 $100–200/月
API 按量按字数算有量、要灵活一个失控的循环能烧到你心疼
本地模型边际≈0重隐私、长期高频前期得买够内存 / 显卡的机器
06BY SCENARIO

六个场景六套打法

同一批工具,换个场景,答案完全不一样。这里给六个最常见的场景,每个配一套推荐组合,外加一句「为什么是它」。

场景 → 推荐技术栈 矩阵 交互编辑器CLI Agent自托管框架常驻 Agent A 个人日常编码 B 团队 / 企业 C 7×24 自动化 D 无人值守批量 E 手机 / 异地 F 隐私 / 离线 首选 可用 弱 / 不必
图 03 场景 × 技术栈推荐矩阵
场景 A

个人开发者,日常编码

你每天坐在电脑前写代码,要的是顺手、够强、够快。

Claude Code / Cursor 3 / Antigravity 2.0 挑一个当主力;想省钱或重隐私,加 Qwen Code / OpenCode 接本地模型兜底。
场景 B

团队 / 企业,协作开发

要合规、要私有化、要在大家用的不同编辑器上铺一层统一的 AI。

Windsurf(40+ IDE 统一层)或 CodeBuddy / CodeFuse / MonkeyCode(企业私有化,代码不出内网);批量任务用 OpenHands 自托管塞进 CI。
场景 C

7×24 自动化 / 运维常驻

一台常开机器,定时干活、被消息触发干活。

Hermes Agent(常驻 + 学习闭环 + 零暴露端口)或 Antigravity 2.0 定时任务;OpenClaw 只在你愿意锁死配置、持续打补丁的前提下考虑。
场景 D

无人值守批量任务 / CI

跑测试、批量改代码、定时出报告,要能脚本化、能沙箱。

OpenHands(沙箱 + CI 友好)配 Aider(Git 原生、每步可回滚);CI 里原来用 Gemini CLI 的,迁 Antigravity CLI 或换 OpenCode。
场景 E

手机 / 异地,远程指挥

人在外面,用手机让家里或公司的 Agent 干活。

Hermes(接微信生态/飞书/钉钉/Telegram,零入站端口)或 Qoder(手机端原生派活、多 Agent);编辑器派云端 Agent 用 Cursor Cloud / Antigravity 托管 Agent。详见第 08 章。
场景 F

隐私敏感 / 完全离线本地

数据一点都不能上云,全在本地跑。

OpenCode / AiderOllama 本地模型(Qwen3 / GLM / DeepSeek 开源版);国产可控选 CodeFuse / SolonCode(CodeGeeX 插件也能本地,但它的开源模型已旧)。前提:机器内存 / 显卡够(见第 07 章)。
07CROSS-PLATFORM

三套系统三种活法

同一个 Agent,装在 Mac、Windows、Linux 上,地基差很多。最关键的那个变量是你能不能在本地跑得动模型——而这,取决于你有没有合适的内存或显卡。

macOS Apple Silicon · 统一内存 本地推理 · MLX / Metal Ollama · LM Studio · llama.cpp ✓ 静音省电,适合常开 server ✗ 没 CUDA,vLLM/SGLang 用不了 ✗ 大模型受统一内存上限卡 常驻:launchd 开机自启 远程:Tailscale + SSH 门槛:16G 走云 · 64G+ 才本地 最适合:安静的家用常驻 server Windows 独显 CUDA 主场 本地推理 · CUDA / 独显 Ollama · vLLM · LM Studio ✓ 有 N 卡,大模型 + 高吞吐 ✓ 显存决定上限,可堆卡 Linux 系工具走 WSL2 常驻:任务计划 / 服务 远程:Tailscale + RDP/SSH 门槛:看显存,不是看内存 最适合:有游戏独显的重度本地跑 Linux 服务器主场 本地推理 · CUDA / ROCm vLLM · SGLang · Ollama ✓ Docker 原生,最省心 ✓ 所有自托管框架首选目标 ✓ 云 VPS 按需扩容 常驻:systemd 服务 远程:SSH / 反代 / VPN 门槛:自由度最高 最适合:正经服务器 / 云部署
图 04 跨系统部署底座对比 · Docker 依赖 / 本地推理 / 常驻 / 远程

本地模型 vs 云 API · 一个三角取舍

💰 成本

云 API 前期零投入、按量付费;本地前期砸硬件、长期边际近零。又高频又重度,本地更省。

🔒 隐私

本地数据不出机器,绝对可控;云端得信厂商。合规或敏感场景,本地或私有部署是底线。

⚡ 性能

云端是前沿大模型,能力天花板高;本地小模型在复杂多文件任务上,稳定性还是差一口气。

一句大白话没有合适的显存或大内存,就别硬上本地大模型——接国产云 API(DeepSeek / DashScope / GLM)又便宜又稳,本地模型留给隐私刚需或纯玩票。
08REMOTE CONTROL

人在外面怎么指挥它

常驻 Agent 最迷人的地方,是「你不在场也能用」。怎么从手机、从异地,安全地够到家里那台机器?三条路,下面按攻击面从小到大排。其中最该讲清楚的一件事,是怎么把它接进你天天在用的微信、飞书、钉钉

📱 你的 手机 常驻 Agent 不关机的机器 ① 聊天平台触达(最安全) 微信生态 · 飞书 · 钉钉 · 企业微信 · Telegram ✓ 零入站端口 · 纯出站 · 不开公网 ② 私有网络 · Tailscale + SSH ③ 原生手机派活 Qoder 手机端 · Cursor Cloud · Antigravity 云端中转 · 省心,但数据过厂商 ✗ 千万别直接对公网开端口
图 05 远程操控三条路 · 按攻击面从小到大
① 聊天平台(首选)

Agent 只往外发连接,不开任何入站端口。你发条消息,它干完回你。这类常驻 Agent 原生支持的多是 Telegram、Discord 这些海外平台,要接微信、飞书、钉钉得多搭一层(见下表)。家用常驻最推荐这条路。

攻击面:最小
② 私有网络

Tailscale / WireGuard 把手机和家里机器拉进同一个虚拟内网,再走 SSH 或 Web 面板。不暴露公网,适合要直接操作机器的时候。

攻击面:可控
③ 原生手机派活

Qoder(手机派活 + 多 Agent)、Cursor Cloud / Antigravity 托管 Agent。厂商云中转,最省心,但数据要经过厂商那一手。

攻击面:信任厂商

接进你常用的聊天渠道 · 实话实说

渠道能不能接 Agent怎么接注意
飞书 / Lark✓ 推荐官方机器人 + Webhook,文档全自建 Agent 接入国内最顺的一个
钉钉✓ 推荐官方机器人 + 自定义 outgoing企业场景成熟
企业微信✓ 可行应用 + 群机器人 API能触达个人微信,企业资质要求
微信公众号 / 客服△ 受限公众号被动回复 / 微信客服接口能力和频率受平台规则约束
微信个人号✗ 高风险无官方个人 API,第三方协议属灰色封号风险高,不建议用于正经常驻

实操建议:个人想要微信级别的即时触达,最稳的是走企业微信(能把消息推到你个人微信)或飞书团队直接上飞书 / 钉钉机器人。Hermes、OpenClaw 这类工具原生支持的是海外平台,接微信 / 飞书 / 钉钉通常得靠一层 Webhook 桥接或自定义通道——不难,但要自己搭。

跨系统铁律不管 Mac、Windows 还是 Linux,第一条都是「别直接对公网开端口」。要么走聊天平台纯出站,要么走 Tailscale 这类私有网络。一旦把 Agent 的控制端口裸露在公网,等于把一台能执行命令的机器,交给了全互联网。
09SECURITY

能力越大越要把门锁好

常驻 Agent 把「能执行命令、能读文件、能花钱」这三样本事,24 小时挂在网上——这是一个全新的攻击面。这一章用一个真实案例讲清楚风险长什么样,再给一份不挑系统的加固清单。

真实案例 · OpenClaw 的两道口子

浏览器到本地的劫持

安全公司 Oasis 披露的「ClawJacked」(CVSS 8.8)。根子在一个叫「localhost 谬误」的错觉:到本地的 WebSocket 连接不受跨域限制,而它的网关对本地访问的限流是豁免的、本地配对还自动批准——于是一个恶意网页就能暴力破解口令、悄悄注册成可信设备、接管你的 Agent,全程不需要你开端口、不需要公网 IP。24 小时内修复。安全机构还发现,曾有 22 万多个实例直接裸暴露在公网上。

根因:把「本地」默认当成「可信」
令牌窃取,一路到执行代码

另有一个鉴权令牌窃取漏洞,攻击者拿到令牌后能远程执行代码;它的命令白名单也能被 shell 续行符、busybox、选项缩写这些花招绕过。补丁在 2026 年上半年陆续落地。

教训:靠「认词」做白名单,挡不住人
这不是 OpenClaw 一家的病——它只是被研究得最透的那个样本。任何能执行命令的常驻 Agent,都共用这一套风险模型。

常驻 Agent 加固清单(不挑系统)

  1. 能不开端口就不开。优先聊天平台纯出站模式(像 Hermes 聊天模式可做到零入站端口)。非开不可,就只绑内网或 Tailscale。
  2. 把自己的浏览器也当成攻击面。上面那个案例的教训:哪怕你没暴露公网,一个恶意网页也能打你本地的 Agent。控制端尽量用隔离的浏览环境。
  3. 权限给到最小。给 Agent 的 API key 设额度上限;能删、能发、能付钱的权限单独审批,绝不默认全开。
  4. 让它在沙箱里干活。用 Docker 或沙箱后端跑工具调用,别让 Agent 直接在主机上裸跑 shell。
  5. 补丁要追。这类项目漏洞披露和修复都飞快,常驻就意味着你得订阅安全通告、定期更新、锁好版本。
  6. 关键动作,人必须在回路里。删除、对外发送、付款、发布——让它「先问你一句再动手」。
这对选型意味着什么在能力差不多的前提下,聊天模式零暴露端口 + 沙箱执行的 Hermes,比默认信任本地、且有公开漏洞史的 OpenClaw,对一台长期在线的机器更安全。不是说 OpenClaw 不能碰,而是它要求你有更高的运维纪律——你得真的会养它。
10THE DECISION TREE

一棵树问到底

把前面所有判断,收成一棵树。从最上面那个问题往下走,落到叶子,就是给你的答案。

你想让 Agent 做什么? 写代码 办各种事 / 常驻 省心 / 体验优先 不在意闭源 可控 / 隐私 / 省钱 开源 / 本地 Claude Code · Cursor 3 Antigravity 2.0 OpenCode · Aider Qwen Code · CodeFuse 不想运维 / 用手机 托管云 愿自托管 / 要可控 常驻自建 Qoder · Cursor Cloud Antigravity 定时任务 Hermes Agent (或 OpenHands / 加固后的 OpenClaw) 两条横切原则,任何分支都管用 ① 选工具先看最后提交时间 + 许可证(Gemini CLI、Roo 的教训) ② 常驻 = 零暴露端口 + 沙箱 + 追补丁,绝不撒手放养
图 06 全场景选型决策树
11OUTLOOK

风往哪

把这一年的动作连起来看,有六条方向已经相当确定。它们不是预言,是正在发生的事。

① 闭源化回潮

一个十万星的开源工具被收编进闭源平台,是个明确信号:巨头会把养肥的开源项目,重新关回自家的订阅墙里。开源党,得把「能不能换地方跑」当成选型的硬指标。

② 自研模型军备赛

Cursor 的 Composer 2、Windsurf 的 SWE-1.5、Google 的 Gemini 3.5 Flash——工具厂自己下场训模型,专门为自家 Agent 优化。速度和契合度,成了新护城河。

③ 并行 Agent 成标配

Antigravity 的子 Agent、Cursor 的 Agents Window、Windsurf 的并行 Agent——「一个人盯一队 Agent」从尝鲜变成了默认姿势。

④ 常驻 + 会成长

Hermes 把「跨会话记忆 + 自己进化技能」做成卖点。Agent 从「一次性任务」走向「长期陪你、越用越懂你」——只是它到底有没有用,目前还缺独立的硬证据,别全信厂商说辞。

⑤ 安全治理上桌

漏洞潮、专门的安全分类论文、零信任架构指南接连冒出来——常驻 Agent 的安全,正从「出事再补」变成「设计时就得管」。

⑥ 国产全栈成形

从大厂 IDE(Qoder CN、CodeBuddy、Trae)到可私有部署的 CodeFuse、SolonCode、MonkeyCode,再到 Qwen Code、AgentScope——国产已经能在「云 + 本地 + 私有化」三条路上自己闭环。

2026 年真正的问题,不是「哪个 Agent 最强」,而是——你的工作流跑在谁的地基上,你的数据留在谁手里,出了事谁来担。