2026 年,真正变的不是某个工具更强了,而是「人和机器怎么协作」这套规则,整个换了赛道——从替你写代码,到替你办事;从一个个被动工具,到一支支自己跑的 Agent。这份报告把全世界的玩家摆上同一张桌子,看清谁在狂奔,谁在掉队,谁已经死了、只是你还没收到讣告。
如果你只有三分钟,记住一句话:编程工具已经走完「自动补全 → 聊天问答 → 编辑器里的 Agent → 终端里的 Agent」四级跳,正在长出第五个物种——不关机、自己干活、随叫随到的常驻 Agent。而就在同一年,行业里两股力量正面对撞:一边是开源工具遍地开花、模型随便换;另一边是巨头把养肥了的开源项目重新关进笼子。
下面四条判断,是这份报告的骨架。看懂了它们,后面所有工具你都能自己归位:
看清这整张地图,只需要回答两个问题。第一,它是专门写代码的,还是什么都能干的通用 Agent?第二,它跑在厂商手里(闭源托管),还是你自己手里(开源自托管)?横轴答前一个,纵轴答后一个,三十多个工具就各就各位。挑这两根轴,是因为它们是工具改不掉的底色——至于「是交互还是自动、在线还是常驻」,那只是你怎么用它、加不加一个定时任务的事,换个用法就变,定不了谁的位置。
Claude Code、Cursor、Windsurf、国产 IDE。专门帮你写代码,跑在厂商云上,体验最顺、模型最强,但数据和模型你管不着,按月付费。
Manus 这类「AI 员工」SaaS。野心是什么都替你干,但同样是厂商托管的黑盒。这一格眼下还空——又通用、又闭源托管、还成熟的产品,目前不多。
OpenCode、Aider、Qwen Code、OpenHands。一样专注写代码,但开源、可自托管、模型随便换、数据在你手里。要懂点技术,每一寸归你管。
Hermes、OpenClaw、AgentScope、Dify、CrewAI。什么都能干,且装在你自己机器上。最自由,也最吃运维和安全。
AI 编程这几年,是把能力一层层叠上来的:先会补全,再会对话,然后能跨文件改、能自己调用工具、能扛住一个长任务。新的能力没把旧的扔掉——它们全都还在,今天你用的每个工具,都同时站在这五层之上。
你大概常听到「自主 Agent 是质的飞跃」这种说法。落到实处其实很朴素:把 Claude Code、Codex 挂一个定时任务,它一样能自己跑——「常驻、自己发起」是谁都能配的部署选项,不是某类工具独有的天赋。
真正把今天这些工具区分开的,是上一章那两根轴:它专精编码,还是什么都干;它跑在厂商手里,还是你自己手里。那 Hermes、OpenClaw 是什么?它们落在「通用 + 自托管」这个象限,把常驻、跨会话记忆、几十个消息通道打包成开箱即用的产品——替你省下自己搭定时任务、接消息平台、做记忆系统的功夫。它们卖的是封装和便利,这本身就很有价值。
这一章是全景的肉——三十多个工具,分六个梯队,挨个点名。每一条都告诉你:谁做的、什么许可、能不能自己部署、接什么模型、跑什么系统、现在还活着没有。
蚂蚁出品,开源,能完整私有部署,覆盖编码全流程,组织持续活跃迭代。
安全公司长亭出品,AGPL-3.0,企业级、可完全私有化、带 SDD 流程。平台较新,专用 CLI 还在早期。
无耳科技出品,MIT、Java、全中文提示词,近乎周更。provider 无关、支持 MCP/LSP,Java 生态自建可控管线的好料。
点完名,把代表性选手拉到同一张表上横着量——类型、许可、能否自托管、接不接国产模型、跨不跨系统、还活着没有。
| 工具 | 梯队 | 许可 | 自托管 | 接国产模型 | 跨系统 | 状态 |
|---|---|---|---|---|---|---|
| Claude Code | 前沿 CLI | 闭源/订阅 | 否 | 否(自家) | mac/win/linux | |
| Codex | 前沿 CLI | CLI 开源 | 部分 | 否(自家) | mac/win/linux | |
| Antigravity 2.0 | 托管云 | 否 | 否 | 否(Gemini) | mac/win/linux* | |
| Cursor 3 | 前沿 IDE | 闭源 | 否 | 可配端点 | mac/win/linux | |
| Windsurf | 前沿 IDE | 闭源 | 否 | 可配端点 | 40+ IDE | |
| Gemini CLI | 前沿 CLI | Apache-2.0 | 是 | 否(Gemini) | mac/win/linux | 个人档退役 |
| OpenCode | 开源 CLI | MIT | 是 | 任意端点 | mac/win/linux | |
| Aider | 开源 CLI | Apache-2.0 | 是 | 任意端点 | mac/win/linux | |
| Qwen Code | 开源 CLI · 国产 | Apache-2.0 | 是 | 原生 DashScope | mac/win/linux | |
| CodeGeeX | 国产 IDE | 插件免费/模型旧 | 是 | GLM 原生 | 跨 IDE | 模型停更 |
| Qoder CN / Qoder | 国产厂商 | 闭源/企业 | 企业版 | GLM/DS/Kimi | 跨平台 + 手机 | |
| CodeBuddy | 国产厂商 | 闭源/企业 | 企业私有 | 混元系 | CLI/IDE/独立 | |
| Trae | 国产 IDE | 闭源 | 否 | 豆包系 | mac/win | |
| CodeFuse / MonkeyCode | 国产私有化 | 开源 | 是 | 可配 | 服务器 | |
| OpenHands | 自主框架 | MIT | 是 | 可配端点 | mac/win/linux | |
| OpenManus | 自主框架 | MIT | 是 | 需验证 | mac/win/linux | |
| AgentScope | 自主框架 · 国产 | Apache-2.0 | 是 | 原生 DashScope | 跨平台 | |
| Coze Studio | 可视化 · 国产 | Apache-2.0 | 需 Docker | 可配 | mac/linux+Docker | |
| Hermes Agent | 常驻 Agent | MIT | 是 | 五家一等 | mac/win/linux | |
| OpenClaw | 常驻 Agent | 开源 | 是 | 五家原生 | mac/win/linux | 安全注意 |
* Antigravity CLI 的 Linux 仍是 preview。「接国产模型」指 DeepSeek / Qwen / GLM / Kimi / MiniMax 至少原生支持一家;「可配端点」指通过 OpenAI 兼容接口间接接入。
| 工具 | 状态 | 近况 / 版本(2026) | 给你的提醒 |
|---|---|---|---|
| Claude Code | 活跃 | CLI Agent 范式标杆,持续迭代 | 体验天花板,闭源订阅 |
| Codex | 活跃 | CLI 开源 + 云端集成 | 绑 GPT 系 |
| Antigravity 2.0 | 活跃 | I/O 2026.05 五面平台发布 | 正接收 Gemini CLI 用户 |
| Cursor 3 | 活跃 | 2026.04 发布,Composer 2 自研 | Composer 2 建在 Kimi K2.5 基座上 |
| Windsurf | 活跃 | Cognition 收购后连发,SWE-1.5 | SWE-1.5 暂无公开 API |
| Gemini CLI | 退役 | 2026-06-18 个人档停服 | 迁 Antigravity CLI / OpenCode |
| OpenCode | 活跃 | 16 万+ 星,最活跃开源默认 | 已下掉 Claude 登录,用 API key |
| Aider | 活跃 | Git 原生,长期稳定 | 纪律性最强 |
| Goose | 活跃 | 转入 Linux 基金会 AAIF | 治理中立,通用 Agent |
| Qwen Code | 活跃 | 阿里维护,原生 arm64 | 国产开源 CLI 最成熟 |
| Pi | 活跃 | Armin Ronacher 出品,5 万星 | 可魔改骨架 |
| Cline | 活跃 | v3.81,2026.05 拆出 SDK | 500 万+ 安装,功能最全 |
| Continue | 活跃 | 2026 新增 Agent Mode | JetBrains 友好,重定制 |
| Crush | 活跃 | Charm,2.5 万星,2026.06 仍更 | FSL 源可见,非纯开源 |
| Roo Code | 归档 | 2026-05-15 归档,转云产品 | 迁 Cline / Kilo |
| Qoder CN / Qoder | 活跃 | Qoder 1.0 工作台 + CLI(2026.05) | 原通义灵码并入此线 |
| CodeBuddy | 活跃 | 独立 IDE + 智能体 Craft | 微信生态友好 |
| Trae | 活跃 | 600 万注册,SOLO 模式 | 快速出原型 |
| 文心快码 | 活跃 | 升级 3.5S,智能体 Zulu | Figma 转代码强 |
| CodeGeeX | 留神 | 插件 v2.12 活跃,开源模型停在 2024.07 | 当免费插件 OK,当开源大模型已落后 |
| CodeFuse | 活跃 | 蚂蚁,2026.05 仍提交 | 私有化可控 |
| MonkeyCode | 留神 | 长亭 2025.12 推出,AGPL-3.0 | 平台新,CLI 尚早期 |
| SolonCode CLI | 活跃 | 近周更,MIT,全中文 | Java 生态自建 |
| OpenHands | 活跃 | 发布 V1 SDK | 本地跑大模型重,宜云 API |
| OpenManus | 活跃 | 迁 FoundationAgents,v0.3.0 | 接国产模型需自验 |
| AgentScope | 活跃 | v2.0,2.6 万星 | 国产生产级编排首选 |
| Coze Studio | 活跃 | 字节,频繁发版 | 强依赖 Docker |
| Dify | 活跃 | 国内低代码 Agent 画布主流 | 可视化编排 |
| CrewAI | 活跃 | 采用率最高,加 A2A | MIT 核心 + 商业版 |
| MetaGPT | 活跃 | DeepWisdom,SOP 多角色 | 软件开发自动化 |
| LangGraph | 活跃 | v1.2(2026.05),生产领跑 | 复杂有状态编排首选 |
| AutoGPT | 留神 | Classic CLI 已归档,转 no-code | 势头被 LangGraph/CrewAI 盖过 |
| Hermes Agent | 活跃 | Nous Research,学习闭环 | 常驻首选,零暴露端口 |
| OpenClaw | 留神 | 涨星极快,但有公开漏洞史 | 常驻须锁配置 + 追补丁 |
上面那张大表,普通人不用啃。这一章只服务一件事:让一个完全不写代码的人,也能搞清楚自己到底要不要碰这些东西、碰哪个。先回答三个问题,对号入座就行。
想写代码 → 看编辑器和 CLI 那类。想让它办事(整理文件、提醒、爬信息、收发消息)→ 看常驻 Agent 那类。
完全不碰 → 老老实实用网页和桌面 App。愿意敲一两条命令 → CLI 类可以上。爱折腾 → 自托管随便玩。
无所谓 → 云服务最省心。很在意 → 自托管加本地模型,但得搭上硬件和精力。
只想问问问题、写点小东西。→ 直接用云 App(Claude、扣子、通义),别碰部署。一个月十几二十块封顶,省心。
想让它替你处理重复杂活(邮件、整理、提醒、定时爬信息)。→ 上常驻 Agent(如 Hermes),用微信、飞书或 Telegram 这类平台遥控。需要一台常开的机器。
想省钱、重隐私、享受 DIY。→ 自托管加本地模型(Ollama 跑 Qwen / GLM / DeepSeek 开源版)。前期投入大,长期几乎零成本。
| 模式 | 怎么收费 | 适合谁 | 坑在哪 |
|---|---|---|---|
| 云 App 订阅 | $10–20/月 起 | 绝大多数人 | 高阶档能飙到 $100–200/月 |
| API 按量 | 按字数算 | 有量、要灵活 | 一个失控的循环能烧到你心疼 |
| 本地模型 | 边际≈0 | 重隐私、长期高频 | 前期得买够内存 / 显卡的机器 |
同一批工具,换个场景,答案完全不一样。这里给六个最常见的场景,每个配一套推荐组合,外加一句「为什么是它」。
你每天坐在电脑前写代码,要的是顺手、够强、够快。
要合规、要私有化、要在大家用的不同编辑器上铺一层统一的 AI。
一台常开机器,定时干活、被消息触发干活。
跑测试、批量改代码、定时出报告,要能脚本化、能沙箱。
人在外面,用手机让家里或公司的 Agent 干活。
数据一点都不能上云,全在本地跑。
同一个 Agent,装在 Mac、Windows、Linux 上,地基差很多。最关键的那个变量是你能不能在本地跑得动模型——而这,取决于你有没有合适的内存或显卡。
云 API 前期零投入、按量付费;本地前期砸硬件、长期边际近零。又高频又重度,本地更省。
本地数据不出机器,绝对可控;云端得信厂商。合规或敏感场景,本地或私有部署是底线。
云端是前沿大模型,能力天花板高;本地小模型在复杂多文件任务上,稳定性还是差一口气。
常驻 Agent 最迷人的地方,是「你不在场也能用」。怎么从手机、从异地,安全地够到家里那台机器?三条路,下面按攻击面从小到大排。其中最该讲清楚的一件事,是怎么把它接进你天天在用的微信、飞书、钉钉。
Agent 只往外发连接,不开任何入站端口。你发条消息,它干完回你。这类常驻 Agent 原生支持的多是 Telegram、Discord 这些海外平台,要接微信、飞书、钉钉得多搭一层(见下表)。家用常驻最推荐这条路。
用 Tailscale / WireGuard 把手机和家里机器拉进同一个虚拟内网,再走 SSH 或 Web 面板。不暴露公网,适合要直接操作机器的时候。
Qoder(手机派活 + 多 Agent)、Cursor Cloud / Antigravity 托管 Agent。厂商云中转,最省心,但数据要经过厂商那一手。
| 渠道 | 能不能接 Agent | 怎么接 | 注意 |
|---|---|---|---|
| 飞书 / Lark | ✓ 推荐 | 官方机器人 + Webhook,文档全 | 自建 Agent 接入国内最顺的一个 |
| 钉钉 | ✓ 推荐 | 官方机器人 + 自定义 outgoing | 企业场景成熟 |
| 企业微信 | ✓ 可行 | 应用 + 群机器人 API | 能触达个人微信,企业资质要求 |
| 微信公众号 / 客服 | △ 受限 | 公众号被动回复 / 微信客服接口 | 能力和频率受平台规则约束 |
| 微信个人号 | ✗ 高风险 | 无官方个人 API,第三方协议属灰色 | 封号风险高,不建议用于正经常驻 |
实操建议:个人想要微信级别的即时触达,最稳的是走企业微信(能把消息推到你个人微信)或飞书;团队直接上飞书 / 钉钉机器人。Hermes、OpenClaw 这类工具原生支持的是海外平台,接微信 / 飞书 / 钉钉通常得靠一层 Webhook 桥接或自定义通道——不难,但要自己搭。
常驻 Agent 把「能执行命令、能读文件、能花钱」这三样本事,24 小时挂在网上——这是一个全新的攻击面。这一章用一个真实案例讲清楚风险长什么样,再给一份不挑系统的加固清单。
安全公司 Oasis 披露的「ClawJacked」(CVSS 8.8)。根子在一个叫「localhost 谬误」的错觉:到本地的 WebSocket 连接不受跨域限制,而它的网关对本地访问的限流是豁免的、本地配对还自动批准——于是一个恶意网页就能暴力破解口令、悄悄注册成可信设备、接管你的 Agent,全程不需要你开端口、不需要公网 IP。24 小时内修复。安全机构还发现,曾有 22 万多个实例直接裸暴露在公网上。
另有一个鉴权令牌窃取漏洞,攻击者拿到令牌后能远程执行代码;它的命令白名单也能被 shell 续行符、busybox、选项缩写这些花招绕过。补丁在 2026 年上半年陆续落地。
把前面所有判断,收成一棵树。从最上面那个问题往下走,落到叶子,就是给你的答案。
把这一年的动作连起来看,有六条方向已经相当确定。它们不是预言,是正在发生的事。
一个十万星的开源工具被收编进闭源平台,是个明确信号:巨头会把养肥的开源项目,重新关回自家的订阅墙里。开源党,得把「能不能换地方跑」当成选型的硬指标。
Cursor 的 Composer 2、Windsurf 的 SWE-1.5、Google 的 Gemini 3.5 Flash——工具厂自己下场训模型,专门为自家 Agent 优化。速度和契合度,成了新护城河。
Antigravity 的子 Agent、Cursor 的 Agents Window、Windsurf 的并行 Agent——「一个人盯一队 Agent」从尝鲜变成了默认姿势。
Hermes 把「跨会话记忆 + 自己进化技能」做成卖点。Agent 从「一次性任务」走向「长期陪你、越用越懂你」——只是它到底有没有用,目前还缺独立的硬证据,别全信厂商说辞。
漏洞潮、专门的安全分类论文、零信任架构指南接连冒出来——常驻 Agent 的安全,正从「出事再补」变成「设计时就得管」。
从大厂 IDE(Qoder CN、CodeBuddy、Trae)到可私有部署的 CodeFuse、SolonCode、MonkeyCode,再到 Qwen Code、AgentScope——国产已经能在「云 + 本地 + 私有化」三条路上自己闭环。