碎碎念丨Agent 还是 Workflow

date

Apr 1, 2025

slug

agent-or-workflow

status

Published

tags

LLM

Agent

碎碎念

summary

type

Post

抛开需求谈设计，抛开场景谈交互，

就和吃泡面不加火腿肠一样不可理喻（原谅我实在不能用不粗鄙的话语表述出来）。

用户其实不关心一个产品背后，是通过一个能力强悍的大模型自主调用工具完成的，还是通过工程师们搭建各种 workflow 预设好完成的。用户只关心是否能开箱即用，需求是否被及时的响应，被很好的满足。

试想一下，我们在用抖音、淘宝、美团的时候，会想着这个界面是用什么框架搭的，这个推荐算法是怎么写的，我点个购买按钮为什么就会有外卖员给我送货？并不会，因为这一切都很直觉，很习以为常，仿佛「天经地义」

当然，用户只要用就行了，但产研团队需要思考的就多了：

我该怎么设计界面和用户旅程，能让用户傻瓜式操作，降低上手门槛？

我该怎么设计服务架构和技术方案，实现高并发高性能高可用？

ok 那我们在做 AI 产品也一样，同样也需要思考：

任务是否足够复杂，需要适应性决策（ Agent），还是确定性方法（ Workflow）就足够了？

更简单的 AI 工具能否达到相同效果？

Workflow 是否涉及不确定性、变化的条件或多步推理，AI Agents 能否更有效地处理？

赋予 AI Agents 自主性会带来哪些风险，是否可以减轻？

为什么需要考虑这些？

首先来看用户与 AI 交互的任务，大体上可以分为两类，增强或自动化。

增强指的是开放性探索性的任务，比如研究、学习；

自动化指的是有固定的流程，或者说是可以直接完成的任务；

这两类任务场景下，LLM 的角色是略有不同的。

增强：LLM 充当的是一个决策者，能够自主规划和选择下一步该如何走，怎么走

自动化：LLM 充当是一个消息处理节点，综合各类信息，选择人类预设好的路径完成任务

下面看两个场景：

假设我们通过 workflow 构建一个 deep research 产品，需要配备足够丰富的搜索源，比如 google、x、reddit、arxiv，然后我们用了一个高超的方式，实现了模型能够不断研究、不断搜索，直到模型判定，内容已满足输出条件，结束任务。但如果用户想来研究《基于大数据的携程用户评论情感分析与需求识别研究》，那完了，这个 workflow 里，只写了搜索的功能，没有写爬虫的功能，抓不到数据，没有数据支撑的研究报告还能叫研究报告吗？那这还叫 deep research 吗？显然不行，用固定的 Workflow 搭建出来的 AI 应用，只能在设计好的有限的功能范围里，提供帮助。

再假设，我们让 agent 来当一个特定领域的文章爬取摘要转写的功能，这是一个高重复度的任务，每次执行，都需要动态规划处理流程吗？显然不用，完全可以用固定的流程写死。

对比上面两个 case，不难发现，

当问题足够小、重复度高的场景下，Workflow 有明显的优势，固定的流程可以批量的可确定的执行；

当问题复杂、变量多的场景下， Agent 有明显的优势，适应性足够强，应用更健壮。

回到开头的话，Agent 和 Workflow 之争，可能是 AI + X 还是 X + AI 的区别。