之前分别写过两篇介绍使用OpenClaw和Hermes的文章。自从用了 Hermes 后,我现在已经完全放弃 OpenClaw 了,核心原因是我认为 Hermes 权限管理更好,运行起来更安全。
我之前在文章中提到两个优点,一是“自我进化”,二是 Hermes 可以调用 OpenCode 等工具来编程。前者我没有感受到,上下文(context)长了之后,时不时也会答非所问,要求还是得反复说;后者几乎没碰到过,大部分问题,都是 Hermes 直接解决了。
所以我之前一直觉得,虽然爱马仕挺好用的,不过好像也没有特别惊艳,直到我最近在本地服务器上部署了之后,想法彻底改变了。
说起来爱马仕这阵子也没有更新,纯粹是我自己少见多怪。之前一直没让它碰本地的东西。为什么呢?几个月前,OpenClaw 刚出现的时候,主打的就是所谓个人助手人设,能够帮你订机票、回邮件、浏览网页等等,但我担心它的权限过大造成破坏,所以一直也就是部署在谷歌云上,不让它接触我的本地数据和文件。
不过我上两周开始重新折腾本地模型了,决定在那台本地服务器上也试试看。一开始只是让它帮我清理硬盘空间,看它表现不错,于是我想让它再帮我看看别的。
众所周知,哪怕是英伟达显卡,配置环境也是一门学问,尤其是我用的还是十年前的老显卡,如何挑能够互相兼容的 CUDA、torch、torch vision 版本,特别费时间。但有了爱马仕之后,跟它说一两句,十几二十分钟,环境就搭好了。
同样的情况也发生在运行 ComfyUI 上。我还记得一年前我跑图,加载一个新工作流时,得自己一个个去看缺了哪些节点和大模型,吭哧吭哧上 huggingface 去下载,就算下完了,因为我硬件太老,跑起来到处报错。(所以很多时候省钱不一定省时间,便宜的不一定有性价比),一般报了两三次错之后,我就失去耐心了,就算能把错误码发给网页版ChatGPT让它教我修,我也懒得弄了。
有了爱马仕就完全不同了,碰到跑不了的工作流,我直接让它在后台用 API 帮我测试,给它权限下载需要的模型和节点,甚至让它直接修改脚本,只要它能跑通、告诉我结果就行。光是这点就省了我特别多时间,还能让我有精力去学新的模型和工作流。
当然,爱马仕还远远谈不上完美。在这篇文章中,我提到了很多能够完成视觉任务的工具,我把列表扔给它,告诉它我的喜好,让它一个个看哪个最适合我。它筛选出合适的工具,还告诉我为什么其他不行。到这里为止,表现都很好。
但是当我让它用选定的工具跑 OCR 流程,检查结果时,它就开始满嘴跑火车了,明明任务结果不合格,却拍胸脯说效果很好。这点让我不满意。不过这可能是模型(deepseek-v4-flash)本身的能力有限,也有可能是聊天窗口的上下文太长了,模型记不清指令或者开始偷懒了。
实践下来,我发现对于爱马仕(甚至是大语言模型)来说,更适合的工作是那种有明确判断标准的,比如 CUDA 环境是否配置成功了,比如 ComfyUI 的节点是不是顺利跑起来了、有没有报错,而那些很主观的任务,比如让它去核对一下 OCR 处理后的文本与原文档是否一致,或者让它生成一个你觉得好看的网页,这种它会无所适从。我感觉这点和职场也有点像,摸鱼也是有窍门的,具体我就不展开啦。
我以前有一个老板,布置工作的时候总是只说一两句话,很含糊,我经常听得云里雾里,要去问我学姐才能明白他到底啥意思,而我给其他人布置工作的时候,我总会事无巨细地吩咐清楚,生怕别人踩坑耽误时间,那时候我一直吐槽这种话都说不清的人是怎么做到这个位置的。
在用多了爱马仕之后,我开始有点理解他老人家当时为什么这样了。我现在给 AI 下达指令时,也越来越偷懒、没有耐心,话也不说全,用词也不准确,错别字也懒得纠正,但同时指望 AI 能够完全懂我意思。
而当 AI 在一些我强调过很多次的地方持续犯错的时候,我还会暴跳如雷、破口大骂,活像一些我在工作中见到过的那种领导。
我不想成为这种自己所讨厌的人。