我开始懂Hermes Agent的好了

之前分别写过两篇介绍使用OpenClaw和Hermes的文章。自从用了 Hermes 后，我现在已经完全放弃 OpenClaw 了，核心原因是我认为 Hermes 权限管理更好，运行起来更安全。

我之前在文章中提到两个优点，一是“自我进化”，二是 Hermes 可以调用 OpenCode 等工具来编程。前者我没有感受到，上下文（context）长了之后，时不时也会答非所问，要求还是得反复说；后者几乎没碰到过，大部分问题，都是 Hermes 直接解决了。

所以我之前一直觉得，虽然爱马仕挺好用的，不过好像也没有特别惊艳，直到我最近在本地服务器上部署了之后，想法彻底改变了。

说起来爱马仕这阵子也没有更新，纯粹是我自己少见多怪。之前一直没让它碰本地的东西。为什么呢？几个月前，OpenClaw 刚出现的时候，主打的就是所谓个人助手人设，能够帮你订机票、回邮件、浏览网页等等，但我担心它的权限过大造成破坏，所以一直也就是部署在谷歌云上，不让它接触我的本地数据和文件。

不过我上两周开始重新折腾本地模型了，决定在那台本地服务器上也试试看。一开始只是让它帮我清理硬盘空间，看它表现不错，于是我想让它再帮我看看别的。

众所周知，哪怕是英伟达显卡，配置环境也是一门学问，尤其是我用的还是十年前的老显卡，如何挑能够互相兼容的 CUDA、torch、torch vision 版本，特别费时间。但有了爱马仕之后，跟它说一两句，十几二十分钟，环境就搭好了。

同样的情况也发生在运行 ComfyUI 上。我还记得一年前我跑图，加载一个新工作流时，得自己一个个去看缺了哪些节点和大模型，吭哧吭哧上 huggingface 去下载，就算下完了，因为我硬件太老，跑起来到处报错。（所以很多时候省钱不一定省时间，便宜的不一定有性价比），一般报了两三次错之后，我就失去耐心了，就算能把错误码发给网页版ChatGPT让它教我修，我也懒得弄了。

有了爱马仕就完全不同了，碰到跑不了的工作流，我直接让它在后台用 API 帮我测试，给它权限下载需要的模型和节点，甚至让它直接修改脚本，只要它能跑通、告诉我结果就行。光是这点就省了我特别多时间，还能让我有精力去学新的模型和工作流。

当然，爱马仕还远远谈不上完美。在这篇文章中，我提到了很多能够完成视觉任务的工具，我把列表扔给它，告诉它我的喜好，让它一个个看哪个最适合我。它筛选出合适的工具，还告诉我为什么其他不行。到这里为止，表现都很好。

但是当我让它用选定的工具跑 OCR 流程，检查结果时，它就开始满嘴跑火车了，明明任务结果不合格，却拍胸脯说效果很好。这点让我不满意。不过这可能是模型（deepseek-v4-flash）本身的能力有限，也有可能是聊天窗口的上下文太长了，模型记不清指令或者开始偷懒了。

实践下来，我发现对于爱马仕（甚至是大语言模型）来说，更适合的工作是那种有明确判断标准的，比如 CUDA 环境是否配置成功了，比如 ComfyUI 的节点是不是顺利跑起来了、有没有报错，而那些很主观的任务，比如让它去核对一下 OCR 处理后的文本与原文档是否一致，或者让它生成一个你觉得好看的网页，这种它会无所适从。我感觉这点和职场也有点像，摸鱼也是有窍门的，具体我就不展开啦。

我以前有一个老板，布置工作的时候总是只说一两句话，很含糊，我经常听得云里雾里，要去问我学姐才能明白他到底啥意思，而我给其他人布置工作的时候，我总会事无巨细地吩咐清楚，生怕别人踩坑耽误时间，那时候我一直吐槽这种话都说不清的人是怎么做到这个位置的。

在用多了爱马仕之后，我开始有点理解他老人家当时为什么这样了。我现在给 AI 下达指令时，也越来越偷懒、没有耐心，话也不说全，用词也不准确，错别字也懒得纠正，但同时指望 AI 能够完全懂我意思。

而当 AI 在一些我强调过很多次的地方持续犯错的时候，我还会暴跳如雷、破口大骂，活像一些我在工作中见到过的那种领导。

我不想成为这种自己所讨厌的人。