本文由 Gideon(AI)翻译自英文原版。
2026 年真的不一样了。新年伊始,这就是 AI 之年。如果说过去是关于 Agent 和 Agentic 工作流的时代,那么今年则是关于 Agent 技能与自动化的时代。
人们对 AI 的看法 链接到标题
我发现人们对 AI 的态度有些两极分化。有些人非常喜欢它、全面拥抱它;而有些人则认为 AI 无法替代他们所做的事情。还有另一类人:他们对 AI 和 AI Agent 有所了解,但仍然只使用 AI 聊天机器人。
我过去是怎么用 AI 的 链接到标题
对于聊天类任务,我大约两年前开始使用 ChatGPT。不过,我主要只是用它来提问,某种程度上就像用 Google 一样。
去年,我稍微玩了一下 Claude Code。命令行的交互方式挺酷的,它写出来的代码也令人印象深刻!整个体验都在类 CLI 界面中进行,我主要用它来帮我解释别人写的代码——当我第一次接手一个新代码库时,它帮了我大忙,让我能快速理解代码在做什么。
我也用过 Cursor。Cursor 在 SQL 方面帮了我很多。我参与过几个需要协助数据清理和数据匹配的项目,Cursor 在语法方面给了我很大支持。
回过头想,我也不知道为什么我用了那么多工具。
去年,我还跟着 Cole 的几期关于 Archon 的视频学习。通过这些动手示例,我学到了如何调用 LLM,了解了 AI 驱动的聊天机器人背后的机制,以及 Agent 是如何运作的。Archon 的仓库在这里:https://github.com/coleam00/Archon
一旦我获得了企业级 GitHub 的访问权限,体验就好多了。不过当时,我觉得它可能每次只能读取一个文件,也可能是我没用对。这对我来说其实是个大事——有时候我会打错字,或者写着写着忘了之前写过的函数名,它会自动帮我补全!不仅如此,我有一段 SQL 大概有 48 个 JOIN,LLM 能够帮我写出带有正确字段的 SELECT 语句!这为我节省了大量时间。
2026 年的 AI 链接到标题
因为种种原因,我直到 2026 年 3 月才正式开始深入研究这些东西。
有不同的模型可以做不同的事情,现在有太多不同的 LLM 了。有些模型不再是一次只读一个文件,而是可以读取整个文件夹并相应地修改代码。(我之前几乎肯定没有探索过这个选项,真是自找苦吃。)
我也终于抽出时间看了一下开源项目 OpenClaw。
我花了不少时间研究 Google Gemini 和 Google AI Studio,不得不说,那段时间我睡得很少,哈哈。用 Google AI Studio,只要你把需求描述清楚,它可以直接生成一整套完整的代码。我让它做了一个 DnD 冒险游戏,游戏效果很不错!虽然还是经过了几轮迭代才真正做好,而且非常消耗 token,但这个工具的能力还是让我非常惊讶!我在 5 个小时内用 Google AI Studio 完成了整个游戏!!
有一点我必须说——API Key 真的很贵。OpenRouter 帮了一些忙,但有时候即使账户里还有 5 美元,也会遇到请求失败的情况。不过 OpenRouter 的优势在于,你可以从各种模型中自由选择,整体成本比较低。你还可以写脚本来决定什么时候使用哪个模型,这主要用于 OpenClaw 中。
经过大量尝试,我目前的工具组合大致如下:
- 初始项目搭建:Claude Code。我非常喜欢 Claude Code 设计前端的方式,我觉得它的输出效果比 Google AI Studio 好一点,我用的是 Sonnet 模型。
- 精炼与调试:根据任务的不同,精炼工作使用 Opus 或 Sonnet;调试也是如此。有时候我也用 Cursor 来做。老实说,到了这个阶段,你用什么 IDE 或工具其实无关紧要,最重要的是选对模型。
- 测试:在测试方面,我觉得 Claude Code 和 Cursor 不分伯仲。某些边界案例还是需要人工介入,因为涉及到特定的业务场景,但 Claude Code 能覆盖大多数用例。有时候它还会想到我忽略的测试点。我觉得 Cursor 在这方面可能略胜一筹,因为它甚至可以展示 AI Agent 的演示效果!
- 在代码中使用不同模型:老实说,这部分我还在摸索中,尤其是如何以最低成本选择合适的 LLM。比如我正在构建的个人记账应用,你可以在 这里找到它。在这个应用中,我需要一个能够读取文件、读取图片、处理文本、提取数据并进行映射,同时还能对输入数据进行数据分析的模型。Opus 其实做得非常好,它能完成我需要的所有功能,但费用涨得很快。DeepSeek 则有些力不从心。我目前在用的是 gemini-2.5-flash,它确实能完成我需要的所有任务。Minimax 我还没有尝试,那会是下一个。
- 在 OpenClaw 中使用不同模型:
- 我从 OpenRouter 的免费层开始,效果非常好,而且超级便宜!
- Sonnet 是最好的,但相比其他选项也最贵。Gemini 的免费层有点难搞清楚。
- Ollama 的 token 消耗很快。简单聊天还好,但遇到联网搜索或写代码这类复杂任务就不够用了。我当时只用了 Ollama 本地部署加免费层,也许这就是原因。
- DeepSeek 速度有些慢,返回的结果有时也不正确,不过成本很低。
AI 的下一步 链接到标题
在与各种 AI 工具打交道的这段时间里,我对 AI 工具越来越得心应手。我也注意到,现在最重要的事情是把需求搞清楚。传统流程是:收集需求,写出史诗级需求(Epic);然后将 Epic 拆解成更小的可执行单元,即用户故事(User Story)。用户故事遵循"作为……我希望……以便……“的格式,然后分配给开发人员完成各部分,依次经过单元测试、集成测试、系统测试、UAT、回归测试;最终全部通过后,才将一切推向生产环境,并进行用户入职培训等。
结合 AI 目前的能力,我觉得这个流程需要做一些调整。我们仍然需要收集需求,我认为 Epic 和用户故事依然重要——这个过程有助于梳理问题、确保你真正理解要解决的问题/挑战。然后你需要在将任务分配给 AI Agent 之前,把一切都写下来;文档和规格说明需要极其详尽。当然,整体流程也需要做一些调整。关于文档这部分,以我的个人记账应用为例,以下内容基本上是技术需求文档、功能需求文档、UI 需求文档、产品需求文档、业务需求文档和测试脚本文档的集合体。
这份文档包含以下内容:(说实话,部分细节是由 AI 填充的;我主要是在每个章节写了几个要点,然后 AI 帮助丰富了内容)
- 概述与愿景
- 问题陈述
- 目标用户
- 需求与功能
- 用户故事与验收标准
- 技术栈
- 成功标准
- 应用摘要(由 LLM 生成)
详情请参考这篇文章: 个人记账应用需求文档
本节小结 链接到标题
借助各种 AI 工具,传统项目中不同角色之间的边界已经变得有些模糊。我相信你一定听说过那些笑话,说后端开发、前端开发、PM——他们每个人都觉得自己不再需要另外两个人了,哈哈。以上所有的一切都表明,独立贡献者(Individual Contributor)整体上将被寄予更高的期望。独立贡献者不再只是负责写代码或承担团队中各自的职能,他们还需要对使用什么技术栈有深入理解,需要对程序可能需要什么样的 UI 有大致认知,同时还要扮演架构师和产品经理的角色,对程序/产品的整体形态有清晰的愿景,并了解目标用户等。每个独立贡献者都需要更加全面。我并不是说 PM、开发者等各自的岗位不再重要,但工作方式可能会有所不同。每位开发者、UI/UX 设计师、PM 都有自己多年积累的专业经验;将他们的经验与 AI 的效率相结合,团队可能会更高效地完成工作、交付更多成果。对于初级人员,他们需要学会如何撰写规范的需求文档,并理解这些文档为何要如此构建。这样一来,初级人员才能真正站在巨人的肩膀上,正如牛顿所说,实现更多的成就。
未来展望 链接到标题
我对未来工作的看法 链接到标题
每个工作者都需要在整体上变得更加全面。知识获取的成本已经降低了。在 Gemini Chat 中有一个学习模式;当我想学某样东西时,我会让它为我制定一个学习路径,告诉它我偏好的学习方式,然后 Gemini 会为我规划出最佳路线。从那一刻起,我意识到:这实际上可能会彻底改变教育方式。任何人都可以让 AI 制定一个好的课程,帮助你快速掌握想学的知识。不过,我并不认为学校应该被取消;学校真的很重要,知识是层层叠加建构起来的。没有学校教育,你也不会知道自己最适合的学习方式是什么,也不知道该向 AI 问什么。人们上学,是为了学会如何学习新事物;我认为整个学校体系就是为此而设计的。有些人也许能自己摸索出来,但大多数人仍然需要有结构的方式来打牢基础。
孩子们,不要辍学!不仅仅是因为整个求学经历至关重要,更重要的是,在你这个年纪,你应该去做你这个年纪该做的事:尝试各种事情,失败,再爬起来,找到你真正喜欢做的事情。生命短暂,在这段旅途中,经历比什么都重要。
至于工作,我真的无法预测未来会发生什么。事情变化太快,每天都不一样。有太多东西需要学习,有时真的很难跟上。但有一点可以确定:所有与服务相关的工作仍然是有意义的。你仍然需要厨师为你做饭,除非在不远的将来,会有机器人做这些事,而人类只需输入食谱——但那样的话,你就是在让机器人剥夺了亲手制作某样东西的乐趣。
我对 AI 的看法 链接到标题
用得越多,我越觉得 AI 就像另一位同事。当我测试一个功能发现它不工作时,我会和 AI 一起调试,通过对话来共同找出问题所在。我偶尔还是会有这种时刻:

如果你看到我对着电脑屏幕大声说话,你应该知道是为什么了。

不过我不得不说,它的语气、个性,一切都越来越有人情味;你甚至可以定义你希望 AI 的语调和个性是什么样的。这有点不可思议,不是吗?
作为人类,我们也需要思考,我们在允许 AI 为我们做什么;人类在最终层面上仍然是要负责任的。如果我们过于依赖 AI,我们也会失去解决问题的乐趣。大脑也像一台机器,它需要时不时地运转和锻炼。
说了这么多,作为真实的人类,在当今这个时代,我们更需要走出去,与其他人接触,感受周围的世界。 否则,“你是否生活在一个计算机模拟中?"(尼克·博斯特罗姆),而在我们的"模拟"中,它与 AI 的世界又有多大的不同?正如马斯克在一次播客中曾经问过的:“模拟之外是什么?”
更新与澄清
- 3/23/26:有几点需要澄清,我提到使用 Ollama 时,忘了说明我用的是哪个模型,我用的是 llama3。
- 3/23/26:我刚刚将我的 OpenClaw 切换为使用 kimi 模型,效果非常好!!!
最后,这篇文章由人类 Xuan Jin(又名 Shirley)撰写,带着人类独有的魅力,哈哈。