Agent 性能之王 Agno 背后的开源故事
date
Mar 29, 2025
slug
journey-of-open-source-ango
status
Published
tags
AI
Agent
AgenticWorkflows
story
summary
Agno 是一个轻量级的 Agent 开源框架,2 年时间便收获了 22k 的 star,每周有超过 1 万个 Agent 基于此构建并发布。
3 月 27 日,Agno 正式发布,其作者 Ashpreet Bedi 分享了他的开源之旅。以下是作者的自述,在保留愿义的基础上添油加醋了一番
type
Post

Agno 是一个轻量级的 Agent 开源框架,2 年时间便收获了 22k 的 star,每周有超过 1 万个 Agent 基于此构建并发布。
3 月 27 日,Agno 正式发布,其作者 Ashpreet Bedi 分享了他的开源之旅。以下是作者的自述,在保留愿义的基础上添油加醋了一番:
从 RAG 到 “框架疲劳”
2022 年, 我挥别了工作 5 年的公司 AirbnbEng,在休息了一阵后开始帮助一些公司构建 AI 产品。
那时 GPT-3.5 横空出世,RAG 火的一塌糊涂,我也开始跟风做了不少项目,但总感觉不对劲。尝试了各类方向但总不奏效,总感觉自己在和“每月一换的流行框架“(Framework of The Month)较劲。
链式调用(Concepts of Chains)? 提示模板(prompt Templates)?Excuse Me? 这些概念都是啥啊,这不就是 Python 本来就能干的事吗?为啥还要套个框架,和玩俄罗斯套娃一样?
手搓万岁:返璞归真才是王道
我从来不是那种热衷于”工程炫技”(merchant of complexity)的工程师,所以我干脆放弃框架,回归原始,从零手搓:直接发 API、手动文本切分、爬数据,连向量数据库都自己撸。
结果您猜这么着——嘿,这事还挺有意思!
随着我构建的 AI 产品越来越多,开始把这些常用工具封装成类。不是那种“封装到你看不懂”的类,而是“点进去就能看懂”的类,这是一个健康的抽象——最多只封装一层,目标是通过统一接口暴露 LLM 的 API,而不是把它们“包裹”起来。
我们称这些类为“助手”(“Assistants”),并且它们灰常给力。
Function Calling 让一切飞起来
大概 2023 年中,OpenAI 推出了 Function Calling,我们的 Assistants 变得异常强大。
它们可以做到管理对话状态(存储与记忆)、向量数据(处理知识库)和工具调用。这是一个巨大的飞跃,也促使我们开源 Agno(当时叫 Phidata),但我们立下了两条铁律:
- 不制造复杂性。Assistants 就是基础类,点进去就能看到完整代码。我已经对“嵌套 5 层的类”有严重的 PTSD 了。
- “未经打磨,不说生产可用(Producttion-Ready)”。很多框架一上来就自称生产可用,但这就是误导,不是说装个监控就能上生产了,咱们讲究真材实料。
Auto-RAG 与 LLM OS:不被复杂性绑架的胜利
我们推出了 Auto-RAG(现在叫 Agentic RAG)和 LLM OS,一炮而红。
它们证明了一件事:你完全可以构建一个强大的 AI 产品,而不被“复杂性矩阵(Complexity Matrix)”拖下水。
性能才是真正的生产力
但问题随之而来:真正的生产系统对性能的要求极高。
除非你真的构建过每分钟处理 2–3 万请求、服务数百万用户的 Agent 系统,否则你很难真正理解“生产可用(Production-Ready)”意味着什么。
相信我——光靠 Trace 和 Eval 根本不够用。
它们当然有价值,但并不是万金油(原文为 Silver Bullets,在软件工程中指能让生产力在十年中提高十倍的方法。出自《No Silver Bullet》--是Fred Brooks在1987年所发表的一篇关于软件工程的经典论文)。
真正的挑战在于系统工程。
首先, 你的 Agent 启动必须快到飞起,因为每个请求都要新建一个 Agent。这样才能确保 Agent 的状态是为该用户请求量身定制的。而且你不能让一个 Agent 同时服务多个用户,因此你必须严格限制每个 Agent 能访问的数据范围——这只有在为“该用户该请求”动态实例化 Agent 时才能做到。
其次,你的数据库和向量数据库实现必须快得离谱,因为你会多次频繁的读写状态和知识。
这就是我们为什么如此执着于性能的原因。
我们动手优化后,让 Agno 的 Agent 启动时间缩短到了约 2 微秒,同时将内存和知识驱动的性能提升了 70%。(想看细节?请戳:https://x.com/ashpreetbedi/status/1846599817943810354)
我们坚持“性能优先”的信仰,这在开发者中引起了强烈共鸣,也让 Phidata 成为了全球众多顶级公司工程师的首选框架。
今年早些时候,Phidata 正式更名为 Agno —— 这是目前构建多模态 Agent 最快的开发库,没有之一。
正式上线,实战验证
Agno 现在已经过实战验证,在数百个 Agent 系统中稳定运行,每天悄无声息地处理数百万请求。
我不是那种轻易说“生产可用”的人,但今天,我可以自信地说:
Agno,真的准备好了。

不聊了,小编要麻溜的去搓 Agent 了