Skip to content
雲里
里雾

Agentic Loop 🌱 Seed

AI

aka: 代理循环, Agent Loop

Content

Agentic Loop 是 AI Agent 的核心工作模式,由三个交织的阶段组成:收集上下文(Gather Context)→ 执行动作(Take Action)→ 验证结果(Verify Results),循环往复直到任务完成。

你的指令 → [收集上下文] → [执行动作] → [验证结果] → 循环直到完成
                ↑                                    |
                └────── 你可以随时打断和调整 ─────────┘

Acceptance

Agentic Loop 是 AI Agent 的核心工作模式,由三个交织的阶段组成:收集上下文(Gather Context)→ 执行动作(Take Action)→ 验证结果(Verify Results),循环往复直到任务完成。

与传统的”输入→处理→输出”不同,Agentic Loop 的每一步结果决定下一步做什么——模型根据中间观察自主选择工具、调整策略、纠正方向。用户可以在任意点打断并重新引导。

Agentic Loop 由两个组件驱动:负责推理的模型(Model)和负责行动的工具(Tools)。Agent 框架(如 Claude Code)提供工具、上下文管理和执行环境,把语言模型变成有行动能力的代理。

来源:Claude Code 官方文档 “How Claude Code Works”

Question

  • Agentic Loop 中的”验证结果”阶段在实践中如何实现?是通过工具(如运行测试)还是模型自身判断?
  • 如果没有外部验证手段(测试、lint 等),Agent 的 Loop 质量会下降多少?
  • Agentic Loop 和强化学习的”状态→动作→奖励”循环有什么异同?

See Also

Agent
Tool Use
Claude Code
Context Window
MAS安全的涌现不可还原性

Reference

YoYo’s Note

Agentic Loop 是理解所有 AI Agent 的钥匙概念。

无论是 Claude Code、OpenClaw、AutoGPT 还是任何其他 Agent 框架,底层都是某种形式的这个循环。区别在于:循环有多自主(完全自动 vs 每步确认)、工具有多丰富(只能生成文本 vs 能读写文件执行命令)、验证有多可靠(依赖模型自判断 vs 有外部测试套件)。

从 Jeff 的移动开发视角看,Agentic Loop 最像 iOS 的 RunLoop 或 Android 的 Looper/Handler 机制——一个持续运行的事件处理循环,根据收到的消息决定下一步做什么。但关键区别是:传统 RunLoop 的逻辑是确定性的(代码写死了),而 Agentic Loop 的逻辑是概率性的(模型”推理”出来的)。这也是为什么需要 Hook 这样的确定性机制来保证某些行为一定发生。

分享这张卡片:
分享到 X

Agentic Loop

#AI #Agent

反向链接