开始正文前,做两个更新:
之前在最近几篇文章的补充更新提到的 github copilot pro 的学生套餐在 3 月初的时候进行了更新,现在学生账号用不了 opus-4.6、sonnet-4.6、gpt-5.4 等顶尖模型了。
Image
社区里当然是哀鸿遍野,不过我感觉也还算可以接受。毕竟每个月还能用 300 次 gpt-5.3-codex,或者 900 次 gemini-3.0-flash / haiku-4.5,尤其是放在 OpenCode 或者 Claude Code 里用的时候,按次数计费,一次往往能跑不少任务,性价比也还过得去。
另外一个更新是 codex team / business 套餐最近被大量封号。不过这两天我又发现,闲鱼上重新冒出来不少几块到二十几块不等的 ChatGPT Plus 充月卡服务,拿小号去试试的话,性价比还是很高的。
说回正题。
这几周我试了下 Nous Research 新推出的爱马仕(Hermes Agent),直观体验还行,至少比小龙虾强一些,主要有以下几个原因。
一是权限控制做得比较好。爱马仕默认运行在沙盒里,如果要执行超出沙盒范围的命令,或者那种杀伤力很大的操作,它会先让用户确认,再决定要不要继续。
二是它可以调用 OpenClaw、Claude Code 这类编程工具,这点我觉得是它和龙虾拉开差距的一个关键地方。很多 agent 看起来也能写代码、改文件、跑命令,但任务一复杂起来,比如要跨多个文件做修改、需要反复调试,或者要调用现成的编码代理,就会开始显得力不从心。爱马仕这边能接入 OpenClaw 或者 Claude Code,相当于多了一层调用外援的能力。
三是它号称能够自我进化。我现在还不敢下太确定的结论,因为社区里也有人去看了源码,发现这块功能好像也是 AI 写的代码屎山。
不过,至少从我自己的实际使用感受来看,它在这方面也不完全是嘴上说说而已。比如有些时候,我并没有特意提醒它“把这个记住”或者“把这个整理成一个 skill”,但它后面确实会根据聊天内容,自己生成一些新的 skills。再比如记忆这块,它也比我原来预想中要好一些。之前已经说过的东西,后面往往还能接得上,不太需要我一次次重复背景信息。
还有一点是,我感觉它的回答通常会更详细、更全面一些,当然代价就是 token 消耗也会更快。用了爱马仕之后,我慢慢发现一个 Plus 账号有点不太够用,于是又开了第二个。但两个账号之间来回通过 OAuth 登录切换,实在有点麻烦。也正是在这个时候,我发现了一个叫 CLIProxyAPI 的项目,可以把多个账号统一成一个 API key 来输出。这样某个账号额度不够时,就不用自己手动来回切换了。
总的来说,我不能说爱马仕已经解决了我在最近很火的龙虾到底是个啥里提出的问题,不过至少我愿意用这个去做些正经的事情。