这篇文章我想聊聊自己折腾AI的经历,以及普通人可以怎样用好这些工具。

两年前,当得知会有一大段空闲时,我想干脆系统学习一下计算机和人工智能,说不定以后能自己从头训练出一个定制化的AI模型。

人工智能是一个很广的概念,它的核心分支是机器学习,而近年来大放异彩的深度学习又是机器学习的一种。但不管概念怎么套,它们的底层运行规律都高度依赖微积分、线性代数和概率论等数学知识。于是我决定开始啃数学。

好在大学学过高数,不算完全零基础。我边读英文教材边看3Blue1Brown的视频,遇到不懂的就复制文字发给ChatGPT(那时候还不能发截图给它)。然而两个多月过去,线性代数快学完了,我对AI的认知却基本还在原地踏步。两年时间虽不短,但我发现也没长到可以让我笃定地吃透所有相关的底层数学知识。

于是我调整了策略:直接去学机器学习,遇到不懂的数学概念再去问AI。我不打算靠刷大量的计算题来死磕推导过程,懂得知其然就行。我从小就有碰到问题非要追根溯源的毛病,但其实真正的大神更多是在战争中学习战争。想通这点后,我开始找机器学习的书看,跟着吴恩达的视频学,也刷了李沐的动手学深度学习。

期间,我顺带结业了赫尔辛基大学mooc.fi的python课,又开启了The Odin Project和UCB的DeCal课程。我去学过时的Ruby on Rails,是因为它依然是最适合个人独立开发的框架;去学运维,是因为我当时已经把Linux作为主力系统,觉得有必要彻底搞懂手里的工具。很有意思的是,这两块在几个月后竟然在DHH的Omakub和Omarchy项目中汇合了,也算是一种奇妙的缘分。

后来,我还啃了Sebastian Raschka的Build a Large Language Model (From Scratch)(只是没读完)。但在这个过程中,我意识到一个很尴尬的事实:我所学习的这一切,跟我的实际需求严重脱节。

我日常真实的场景,其实就是和聊天机器人对话,在自己写的小工具里调一下API,或者抄网上大神分享的Stable Diffusion和ComfyUI工作流来生图生视频。

既然实际需求只是用好工具,那我还有必要死磕去当那个造工具的大神吗?仔细掂量了一下,我发现这不仅没必要,而且极其困难。要想达到开发这些底层工具的大神级别,我起码还得付出几十倍的努力。而且说实话,光是之前啃数学教科书,就让我累得半死,常常半天就会耗光电量,导致接下来一两天什么都不想看。我开始怀疑:就算我有毅力,我真的有能力死磕到底吗?

这也是我第一次真切地意识到:哪怕身边有个全能的AI助手,很多硬核知识也不是短时间内就能速成的。

我感到很深的挫败感,眼看着AI飞速发展,我却什么都做不了。王川老师说过,这种时候普通人最该做的就是躺下休息、好好健身,争取多活几年去感受科技的红利。但我还是不信邪,总想做点什么。也恰恰就是在最迷茫的时候,我偶然看到一个帖子,彻底点醒了我。

原话记不清了,但大致意思是:如果你是个电话推销员,看到自动拨号工具的出现,你是该沮丧还是高兴?不要去跟工具竞争,而是要用新工具来放大你的优势。

我这才发现自己之前错得有多离谱。我放着自己原有的优势不用,偏要跑去自己最不擅长的领域,从零开始跟别人卷。从那以后,我渐渐放下了对编程技能的执念。

知道怎么用冰箱就好了,没有必要去学冰箱里电路板是怎么画的吧。

思路转变后,一切豁然开朗:如果我是画师,我可以让AI帮我上色;如果我是律师,我可以让AI去海量检索案例和法条;如果我是投资分析师,我可以让AI去收集和整理数据。

核心原则只有一个:你必须要有自己的优势领域,并且在这个方面有独特的见解。你可以让AI去干脏活累活,但你需要有审美,能直接判断出它干得好还是不好。

AI画图时,你要知道构图舒不舒服、色彩搭不搭配;AI帮你写东西时,你要能看出逻辑顺不顺、AI味重不重;AI做法律检索时,你要能甄别出案例是不是它幻觉现编的、现时现地到底适不适用。

以目前大语言模型的技术架构来看,在很长一段时间内它都不可能完全取代人类。未来的工作模式,大概率是一个人类带着一个或几个AI小弟组队干活。作为普通人来说,既然我们注定成为不了大神,那就不妨踏踏实实做个懂行、有审美的包工头。把底层的脏活累活全扔给AI,把有限的精力都留给自己,尽一切可能地把自己的长板拉得更长。