普通人可以怎样利用AI · 吞食魔果的人

这篇文章我想聊聊自己折腾AI的经历，以及普通人可以怎样用好这些工具。

两年前，当得知会有一大段空闲时，我想干脆系统学习一下计算机和人工智能，说不定以后能自己从头训练出一个定制化的AI模型。

人工智能是一个很广的概念，它的核心分支是机器学习，而近年来大放异彩的深度学习又是机器学习的一种。但不管概念怎么套，它们的底层运行规律都高度依赖微积分、线性代数和概率论等数学知识。于是我决定开始啃数学。

好在大学学过高数，不算完全零基础。我边读英文教材边看3Blue1Brown的视频，遇到不懂的就复制文字发给ChatGPT（那时候还不能发截图给它）。然而两个多月过去，线性代数快学完了，我对AI的认知却基本还在原地踏步。两年时间虽不短，但我发现也没长到可以让我笃定地吃透所有相关的底层数学知识。

于是我调整了策略：直接去学机器学习，遇到不懂的数学概念再去问AI。我不打算靠刷大量的计算题来死磕推导过程，懂得知其然就行。我从小就有碰到问题非要追根溯源的毛病，但其实真正的大神更多是在战争中学习战争。想通这点后，我开始找机器学习的书看，跟着吴恩达的视频学，也刷了李沐的动手学深度学习。

期间，我顺带结业了赫尔辛基大学mooc.fi的python课，又开启了The Odin Project和UCB的DeCal课程。我去学过时的Ruby on Rails，是因为它依然是最适合个人独立开发的框架；去学运维，是因为我当时已经把Linux作为主力系统，觉得有必要彻底搞懂手里的工具。很有意思的是，这两块在几个月后竟然在DHH的Omakub和Omarchy项目中汇合了，也算是一种奇妙的缘分。

后来，我还啃了Sebastian Raschka的Build a Large Language Model (From Scratch)（只是没读完）。但在这个过程中，我意识到一个很尴尬的事实：我所学习的这一切，跟我的实际需求严重脱节。

我日常真实的场景，其实就是和聊天机器人对话，在自己写的小工具里调一下API，或者抄网上大神分享的Stable Diffusion和ComfyUI工作流来生图生视频。

既然实际需求只是用好工具，那我还有必要死磕去当那个造工具的大神吗？仔细掂量了一下，我发现这不仅没必要，而且极其困难。要想达到开发这些底层工具的大神级别，我起码还得付出几十倍的努力。而且说实话，光是之前啃数学教科书，就让我累得半死，常常半天就会耗光电量，导致接下来一两天什么都不想看。我开始怀疑：就算我有毅力，我真的有能力死磕到底吗？

这也是我第一次真切地意识到：哪怕身边有个全能的AI助手，很多硬核知识也不是短时间内就能速成的。

我感到很深的挫败感，眼看着AI飞速发展，我却什么都做不了。王川老师说过，这种时候普通人最该做的就是躺下休息、好好健身，争取多活几年去感受科技的红利。但我还是不信邪，总想做点什么。也恰恰就是在最迷茫的时候，我偶然看到一个帖子，彻底点醒了我。

原话记不清了，但大致意思是：如果你是个电话推销员，看到自动拨号工具的出现，你是该沮丧还是高兴？不要去跟工具竞争，而是要用新工具来放大你的优势。

我这才发现自己之前错得有多离谱。我放着自己原有的优势不用，偏要跑去自己最不擅长的领域，从零开始跟别人卷。从那以后，我渐渐放下了对编程技能的执念。

知道怎么用冰箱就好了，没有必要去学冰箱里电路板是怎么画的吧。

思路转变后，一切豁然开朗：如果我是画师，我可以让AI帮我上色；如果我是律师，我可以让AI去海量检索案例和法条；如果我是投资分析师，我可以让AI去收集和整理数据。

核心原则只有一个：你必须要有自己的优势领域，并且在这个方面有独特的见解。你可以让AI去干脏活累活，但你需要有审美，能直接判断出它干得好还是不好。

AI画图时，你要知道构图舒不舒服、色彩搭不搭配；AI帮你写东西时，你要能看出逻辑顺不顺、AI味重不重；AI做法律检索时，你要能甄别出案例是不是它幻觉现编的、现时现地到底适不适用。

以目前大语言模型的技术架构来看，在很长一段时间内它都不可能完全取代人类。未来的工作模式，大概率是一个人类带着一个或几个AI小弟组队干活。作为普通人来说，既然我们注定成为不了大神，那就不妨踏踏实实做个懂行、有审美的包工头。把底层的脏活累活全扔给AI，把有限的精力都留给自己，尽一切可能地把自己的长板拉得更长。