Agent详解(学习内容整理)
Agent 核心机制补充

Agent 的本质理解
LLM 自主决策 + 工具使 + 上下文记忆。
ReAct 核心逻辑
遵循以下范式循环执行:
- Thought
- Action
- Action Input
- Observation
- Final Answer
工程衔接的关键点
依赖 Observation 作为 stop 信号,实现模型思考与代码执行的交替。
本质上是一个持续循环的过程:
不断执行,直到出现 Final Answer 为止。
架构演进思路(混合架构)
在稳定的 Workflow 中:
- 将确定性流程交给代码控制
- 将异常处理与复杂推理交给 Agent 节点
Demo级 Agent 实现原理
参考实现:
https://github.com/kid0317/crewai_mas_demo/blob/main/m1l2/m1l2_raw_agent.py
核心逻辑
1 | # 1. 生成系统提示词和用户提示词 |
单 Agent 的典型问题
上下文长度爆炸:ReAct 会不断追加工具执行结果,多次搜索与读取后很容易突破数万 Tokens,导致推理速度和指令遵循能力断崖式下降。
上下文内容污染:模型极易受前文影响,在同一上下文中进行“生成 + 评价”时会出现自我强化,导致结果失去客观性。
多指令挑战:单 Agent 同时承担多工具、多任务时,工具描述占用大量上下文,且容易因注意力分散选错工具或生成错误参数,导致流程卡死。
ReAct 在生产环境的典型问题(精简版)
- 需要支持多模型接入与切换,在效果与成本之间做动态权衡。
- 模型调用不稳定,必须设计重试与 fallback 机制。
- 容易陷入死循环,需要限制最大执行轮次与超时。
- 需要引入 memory 机制以支持用户偏好和上下文延续。
- 模型存在不确定性,关键操作必须加安全控制与校验。
- 缺乏可观测性,需要完善日志、监控与执行链路追踪。
- Agent 具备执行能力,必须通过 sandbox 做环境隔离。