碎碎念丨Agent 还是 Workflow

date
Apr 1, 2025
slug
agent-or-workflow
status
Published
tags
AI
LLM
Agent
碎碎念
summary
type
Post
抛开需求谈设计,抛开场景谈交互,
就和吃泡面不加火腿肠一样不可理喻(原谅我实在不能用不粗鄙的话语表述出来)。
用户其实不关心一个产品背后,是通过一个能力强悍的大模型自主调用工具完成的,还是通过工程师们搭建各种 workflow 预设好完成的。用户只关心是否能开箱即用,需求是否被及时的响应,被很好的满足。
试想一下,我们在用抖音、淘宝、美团的时候,会想着这个界面是用什么框架搭的,这个推荐算法是怎么写的,我点个购买按钮为什么就会有外卖员给我送货?并不会,因为这一切都很直觉,很习以为常,仿佛「天经地义」
当然,用户只要用就行了,但产研团队需要思考的就多了:
我该怎么设计界面和用户旅程,能让用户傻瓜式操作,降低上手门槛?
我该怎么设计服务架构和技术方案,实现高并发高性能高可用?
ok 那我们在做 AI 产品也一样,同样也需要思考:
  1. 任务是否足够复杂,需要适应性决策( Agent),还是确定性方法( Workflow)就足够了?
  1. 更简单的 AI 工具能否达到相同效果?
  1. Workflow 是否涉及不确定性、变化的条件或多步推理,AI Agents 能否更有效地处理?
  1. 赋予 AI Agents 自主性会带来哪些风险,是否可以减轻?
为什么需要考虑这些?
首先来看用户与 AI 交互的任务,大体上可以分为两类,增强 或 自动化。
增强指的是开放性探索性的任务,比如研究、学习;
自动化指的是有固定的流程,或者说是可以直接完成的任务;
这两类任务场景下,LLM 的角色是略有不同的。
增强:LLM 充当的是一个决策者,能够自主规划和选择下一步该如何走,怎么走
自动化:LLM 充当是一个消息处理节点,综合各类信息,选择人类预设好的路径完成任务
下面看两个场景:
假设我们通过 workflow 构建一个 deep research 产品,需要配备足够丰富的搜索源,比如 google、x、reddit、arxiv,然后我们用了一个高超的方式,实现了模型能够不断研究、不断搜索,直到模型判定,内容已满足输出条件,结束任务。但如果用户想来研究《基于大数据的携程用户评论情感分析与需求识别研究》,那完了,这个 workflow 里,只写了搜索的功能,没有写爬虫的功能,抓不到数据,没有数据支撑的研究报告还能叫研究报告吗?那这还叫 deep research 吗?显然不行,用固定的 Workflow 搭建出来的 AI 应用,只能在设计好的有限的功能范围里,提供帮助。
再假设,我们让 agent 来当一个特定领域的文章爬取摘要转写的功能,这是一个高重复度的任务,每次执行,都需要动态规划处理流程吗?显然不用,完全可以用固定的流程写死。
对比上面两个 case,不难发现,
当问题足够小、重复度高的场景下,Workflow 有明显的优势,固定的流程可以批量的可确定的执行;
当问题复杂、变量多的场景下, Agent 有明显的优势,适应性足够强,应用更健壮。
回到开头的话,Agent 和 Workflow 之争,可能是 AI + X 还是 X + AI 的区别。

© 溪河 2021 - 2025