从单 Agent 到多 Agent 的案例落地实践
大家好,我是玄姐。 ▼最近直播超级多,预约保你有收获 关于 Agent 的定义目前还没有形成共识,目前有3个代表性的定义: 流行最广的是前 OpenAI 研究与安全副总裁 Lilian Weng 对 Agent 的定义:Agent = LLM + Planning + Tools + Memory。 除此之外,LangChain 对 Agent 的定义为:使用 LLM 决定应用程序控制流的系统。 OpenAI 对 Agent 的定义是:Agent 是能够代表用户自主完成任务的系统。 尽管目前对 Agent 的定义还没形成共识,但是大家对 Agentic System(智能系统)基本的共识是:Agentic System 是一种有目标、基于环境的决策系统。与 LLM 最大的区别在于,Agentic System 可以与现实世界交互,从感知环境开始,做出决策并执行,影响环境,然后基于反馈调整,不断持续迭代循环。 —1— Agentic System 架构设计剖析 一个完整的 Agentic System 架构包含四个核心组成部分: 感知:为大模型构建上下文信息。常见的方法包括检索增强生成(RAG),查询结构化数据(比如:数据库、网页内容)或者检索历史记录(比如:长短期记忆)。 决策:本质上是 Planning 规划过程。可以通过规则引擎(Workflow)实现,也可以由大语言模型(LLM)驱动(自主 Agent),或者借助外部规划器。在设计时需要权衡泛化能力和准确性–LLM 驱动的决策泛化能力强,但不确定性较高;而基于规则的工作流泛化能力较弱,但更可控。 执行:通过调用工具来改变环境。包括 API 调用(比如:REST、RPC、SQL、函数调用)或与图形软件的集成(比如:Anthropic 的 Computer use)。 反馈:用于评估和迭代的机制。反馈可以通过人工标注、规则或模型生成,更新可以是离线的或在线的。 ...