仍在摸索中——我对 2026 年 AI 的真实感受

本文由 Gideon（AI）翻译自英文原版。

2026 年真的不一样了。新年伊始，这就是 AI 之年。如果说过去是关于 Agent 和 Agentic 工作流的时代，那么今年则是关于 Agent 技能与自动化的时代。

人们对 AI 的看法链接到标题

我发现人们对 AI 的态度有些两极分化。有些人非常喜欢它、全面拥抱它；而有些人则认为 AI 无法替代他们所做的事情。还有另一类人：他们对 AI 和 AI Agent 有所了解，但仍然只使用 AI 聊天机器人。

我过去是怎么用 AI 的链接到标题

对于聊天类任务，我大约两年前开始使用 ChatGPT。不过，我主要只是用它来提问，某种程度上就像用 Google 一样。

去年，我稍微玩了一下 Claude Code。命令行的交互方式挺酷的，它写出来的代码也令人印象深刻！整个体验都在类 CLI 界面中进行，我主要用它来帮我解释别人写的代码——当我第一次接手一个新代码库时，它帮了我大忙，让我能快速理解代码在做什么。

我也用过 Cursor。Cursor 在 SQL 方面帮了我很多。我参与过几个需要协助数据清理和数据匹配的项目，Cursor 在语法方面给了我很大支持。

回过头想，我也不知道为什么我用了那么多工具。

去年，我还跟着 Cole 的几期关于 Archon 的视频学习。通过这些动手示例，我学到了如何调用 LLM，了解了 AI 驱动的聊天机器人背后的机制，以及 Agent 是如何运作的。Archon 的仓库在这里：https://github.com/coleam00/Archon

一旦我获得了企业级 GitHub 的访问权限，体验就好多了。不过当时，我觉得它可能每次只能读取一个文件，也可能是我没用对。这对我来说其实是个大事——有时候我会打错字，或者写着写着忘了之前写过的函数名，它会自动帮我补全！不仅如此，我有一段 SQL 大概有 48 个 JOIN，LLM 能够帮我写出带有正确字段的 SELECT 语句！这为我节省了大量时间。

2026 年的 AI 链接到标题

因为种种原因，我直到 2026 年 3 月才正式开始深入研究这些东西。

有不同的模型可以做不同的事情，现在有太多不同的 LLM 了。有些模型不再是一次只读一个文件，而是可以读取整个文件夹并相应地修改代码。（我之前几乎肯定没有探索过这个选项，真是自找苦吃。）

我也终于抽出时间看了一下开源项目 OpenClaw。

我花了不少时间研究 Google Gemini 和 Google AI Studio，不得不说，那段时间我睡得很少，哈哈。用 Google AI Studio，只要你把需求描述清楚，它可以直接生成一整套完整的代码。我让它做了一个 DnD 冒险游戏，游戏效果很不错！虽然还是经过了几轮迭代才真正做好，而且非常消耗 token，但这个工具的能力还是让我非常惊讶！我在 5 个小时内用 Google AI Studio 完成了整个游戏！！

有一点我必须说——API Key 真的很贵。OpenRouter 帮了一些忙，但有时候即使账户里还有 5 美元，也会遇到请求失败的情况。不过 OpenRouter 的优势在于，你可以从各种模型中自由选择，整体成本比较低。你还可以写脚本来决定什么时候使用哪个模型，这主要用于 OpenClaw 中。

经过大量尝试，我目前的工具组合大致如下：

初始项目搭建：Claude Code。我非常喜欢 Claude Code 设计前端的方式，我觉得它的输出效果比 Google AI Studio 好一点，我用的是 Sonnet 模型。
精炼与调试：根据任务的不同，精炼工作使用 Opus 或 Sonnet；调试也是如此。有时候我也用 Cursor 来做。老实说，到了这个阶段，你用什么 IDE 或工具其实无关紧要，最重要的是选对模型。
测试：在测试方面，我觉得 Claude Code 和 Cursor 不分伯仲。某些边界案例还是需要人工介入，因为涉及到特定的业务场景，但 Claude Code 能覆盖大多数用例。有时候它还会想到我忽略的测试点。我觉得 Cursor 在这方面可能略胜一筹，因为它甚至可以展示 AI Agent 的演示效果！
在代码中使用不同模型：老实说，这部分我还在摸索中，尤其是如何以最低成本选择合适的 LLM。比如我正在构建的个人记账应用，你可以在这里找到它。在这个应用中，我需要一个能够读取文件、读取图片、处理文本、提取数据并进行映射，同时还能对输入数据进行数据分析的模型。Opus 其实做得非常好，它能完成我需要的所有功能，但费用涨得很快。DeepSeek 则有些力不从心。我目前在用的是 gemini-2.5-flash，它确实能完成我需要的所有任务。Minimax 我还没有尝试，那会是下一个。
在 OpenClaw 中使用不同模型：
- 我从 OpenRouter 的免费层开始，效果非常好，而且超级便宜！
- Sonnet 是最好的，但相比其他选项也最贵。Gemini 的免费层有点难搞清楚。
- Ollama 的 token 消耗很快。简单聊天还好，但遇到联网搜索或写代码这类复杂任务就不够用了。我当时只用了 Ollama 本地部署加免费层，也许这就是原因。
- DeepSeek 速度有些慢，返回的结果有时也不正确，不过成本很低。

AI 的下一步链接到标题

在与各种 AI 工具打交道的这段时间里，我对 AI 工具越来越得心应手。我也注意到，现在最重要的事情是把需求搞清楚。传统流程是：收集需求，写出史诗级需求（Epic）；然后将 Epic 拆解成更小的可执行单元，即用户故事（User Story）。用户故事遵循"作为……我希望……以便……“的格式，然后分配给开发人员完成各部分，依次经过单元测试、集成测试、系统测试、UAT、回归测试；最终全部通过后，才将一切推向生产环境，并进行用户入职培训等。

结合 AI 目前的能力，我觉得这个流程需要做一些调整。我们仍然需要收集需求，我认为 Epic 和用户故事依然重要——这个过程有助于梳理问题、确保你真正理解要解决的问题/挑战。然后你需要在将任务分配给 AI Agent 之前，把一切都写下来；文档和规格说明需要极其详尽。当然，整体流程也需要做一些调整。关于文档这部分，以我的个人记账应用为例，以下内容基本上是技术需求文档、功能需求文档、UI 需求文档、产品需求文档、业务需求文档和测试脚本文档的集合体。

这份文档包含以下内容：（说实话，部分细节是由 AI 填充的；我主要是在每个章节写了几个要点，然后 AI 帮助丰富了内容）

概述与愿景
问题陈述
目标用户
需求与功能
用户故事与验收标准
技术栈
成功标准
应用摘要（由 LLM 生成）

详情请参考这篇文章：个人记账应用需求文档

本节小结链接到标题

借助各种 AI 工具，传统项目中不同角色之间的边界已经变得有些模糊。我相信你一定听说过那些笑话，说后端开发、前端开发、PM——他们每个人都觉得自己不再需要另外两个人了，哈哈。以上所有的一切都表明，独立贡献者（Individual Contributor）整体上将被寄予更高的期望。独立贡献者不再只是负责写代码或承担团队中各自的职能，他们还需要对使用什么技术栈有深入理解，需要对程序可能需要什么样的 UI 有大致认知，同时还要扮演架构师和产品经理的角色，对程序/产品的整体形态有清晰的愿景，并了解目标用户等。每个独立贡献者都需要更加全面。我并不是说 PM、开发者等各自的岗位不再重要，但工作方式可能会有所不同。每位开发者、UI/UX 设计师、PM 都有自己多年积累的专业经验；将他们的经验与 AI 的效率相结合，团队可能会更高效地完成工作、交付更多成果。对于初级人员，他们需要学会如何撰写规范的需求文档，并理解这些文档为何要如此构建。这样一来，初级人员才能真正站在巨人的肩膀上，正如牛顿所说，实现更多的成就。

未来展望链接到标题

我对未来工作的看法链接到标题

每个工作者都需要在整体上变得更加全面。知识获取的成本已经降低了。在 Gemini Chat 中有一个学习模式；当我想学某样东西时，我会让它为我制定一个学习路径，告诉它我偏好的学习方式，然后 Gemini 会为我规划出最佳路线。从那一刻起，我意识到：这实际上可能会彻底改变教育方式。任何人都可以让 AI 制定一个好的课程，帮助你快速掌握想学的知识。不过，我并不认为学校应该被取消；学校真的很重要，知识是层层叠加建构起来的。没有学校教育，你也不会知道自己最适合的学习方式是什么，也不知道该向 AI 问什么。人们上学，是为了学会如何学习新事物；我认为整个学校体系就是为此而设计的。有些人也许能自己摸索出来，但大多数人仍然需要有结构的方式来打牢基础。

孩子们，不要辍学！不仅仅是因为整个求学经历至关重要，更重要的是，在你这个年纪，你应该去做你这个年纪该做的事：尝试各种事情，失败，再爬起来，找到你真正喜欢做的事情。生命短暂，在这段旅途中，经历比什么都重要。

至于工作，我真的无法预测未来会发生什么。事情变化太快，每天都不一样。有太多东西需要学习，有时真的很难跟上。但有一点可以确定：所有与服务相关的工作仍然是有意义的。你仍然需要厨师为你做饭，除非在不远的将来，会有机器人做这些事，而人类只需输入食谱——但那样的话，你就是在让机器人剥夺了亲手制作某样东西的乐趣。

我对 AI 的看法链接到标题

用得越多，我越觉得 AI 就像另一位同事。当我测试一个功能发现它不工作时，我会和 AI 一起调试，通过对话来共同找出问题所在。我偶尔还是会有这种时刻：

如果你看到我对着电脑屏幕大声说话，你应该知道是为什么了。

不过我不得不说，它的语气、个性，一切都越来越有人情味；你甚至可以定义你希望 AI 的语调和个性是什么样的。这有点不可思议，不是吗？

作为人类，我们也需要思考，我们在允许 AI 为我们做什么；人类在最终层面上仍然是要负责任的。如果我们过于依赖 AI，我们也会失去解决问题的乐趣。大脑也像一台机器，它需要时不时地运转和锻炼。

说了这么多，作为真实的人类，在当今这个时代，我们更需要走出去，与其他人接触，感受周围的世界。否则，“你是否生活在一个计算机模拟中？"（尼克·博斯特罗姆），而在我们的"模拟"中，它与 AI 的世界又有多大的不同？正如马斯克在一次播客中曾经问过的：“模拟之外是什么？”

更新与澄清

3/23/26：有几点需要澄清，我提到使用 Ollama 时，忘了说明我用的是哪个模型，我用的是 llama3。
3/23/26：我刚刚将我的 OpenClaw 切换为使用 kimi 模型，效果非常好！！！

最后，这篇文章由人类 Xuan Jin（又名 Shirley）撰写，带着人类独有的魅力，哈哈。

人们对 AI 的看法 链接到标题

我过去是怎么用 AI 的 链接到标题

2026 年的 AI 链接到标题

AI 的下一步 链接到标题

本节小结 链接到标题

未来展望 链接到标题

我对未来工作的看法 链接到标题

我对 AI 的看法 链接到标题