diff --git a/loop-engineering-learning-blog.md b/loop-engineering-learning-blog.md index 83a6efc..f0e8e49 100644 --- a/loop-engineering-learning-blog.md +++ b/loop-engineering-learning-blog.md @@ -31,29 +31,6 @@ --- -### 核心定义 - -**Loop Engineering(循环工程)** 是 2026 年以来受到广泛关注的新概念,由 Google 工程师 **Addy Osmani** 系统整理,Anthropic Claude Code 负责人 **Boris Cherny** 和 OpenClaw 创始人 **Peter Steinberger** 共同推动。 - -**一句话定义**(Addy Osmani): -> Loop Engineering 就是把「负责提示 AI 的你」这个角色,换成一套替你做这件事的 **系统**。 - -**传统工作流 vs Loop Engineering 对比** - - -| 维度 | 传统 Prompt Engineering | Loop Engineering(新范式) | -|------|------------------------|---------------------------| -| **你的角色** | 写提示词的人 | 设计循环系统的工程师 | -| **AI 行为** | 一次问答,等待人类下一步 | 自主发现任务、执行、检查、记录、继续 | -| **交互模式** | 人驱动每一步 | 人设计系统边界,AI 持续运转 | -| **核心问题** | "这一轮 AI 怎么答更好?" | "下一轮 AI 为什么会启动、拿到什么信息、做什么动作、如何被检查、结果写入哪里,以及什么时候停止?" | - -> 换句话说:Prompt Engineering 关注单轮对话质量,Loop Engineering 关注整个系统的可持续运行。 - ---- - ---- - ### 进化谱系:四个"Engineering" Loop Engineering 不是凭空出现,而是 AI 工程化的第四层演进: @@ -421,7 +398,7 @@ Loop Engineering 的核心挑战之一是长期记忆管理。以下是 2025-202 |------|------|---------|-----------|---------| | Infini Memory | 2026 | Topic Documents(主题文档) | 孤立记录存储 | 跨会话证据聚合 | | MemForest | 2026 | 层级时间索引 | 粗粒度状态管理 | 并行更新、低延迟 | -| Agentic Memory | 2025 | 记忆作为工具 | 记忆操作与推理耦合 | 端到端优化 | +| Agentic Memory | 2026 | 记忆作为工具 | 记忆操作与推理耦合 | 端到端优化 | | AgentEval | 2026 | DAG 步级评估 | 端到端检查掩盖失败 | 精确定位中间失败 | | Verifiability-First | 2025 | 运行时认证 | 意图与行为不一致 | 高安全要求场景 | @@ -885,11 +862,11 @@ if evaluation["needs_human_review"]: | **ReAct** | [2210.03629](https://arxiv.org/abs/2210.03629) | 2023 | 推理与行动交替循环 | ⭐⭐⭐⭐⭐ | | **Reflexion** | [2303.11366](https://arxiv.org/abs/2303.11366) | 2023 | 语言反馈的强化学习 | ⭐⭐⭐⭐⭐ | | **Self-Refine** | [2303.17651](https://arxiv.org/abs/2303.17651) | 2023 | 迭代精炼与自我反馈 | ⭐⭐⭐⭐ | -| **AgentEval** | [2604.23581](https://arxiv.org/abs/2604.23581) | 2025 | DAG 步级评估 | ⭐⭐⭐⭐ | +| **AgentEval** | [2604.23581](https://arxiv.org/abs/2604.23581) | 2026 | DAG 步级评估 | ⭐⭐⭐⭐ | | **Infini Memory** | [2606.10677](https://arxiv.org/abs/2606.10677) | 2026 | 主题文档记忆结构 | ⭐⭐⭐⭐ | -| **Agentic Memory** | [2601.01885](https://arxiv.org/abs/2601.01885) | 2025 | 统一长短期记忆管理 | ⭐⭐⭐⭐ | +| **Agentic Memory** | [2601.01885](https://arxiv.org/abs/2601.01885) | 2026 | 统一长短期记忆管理 | ⭐⭐⭐⭐ | | **Verifiability-First** | [2512.17259](https://arxiv.org/abs/2512.17259) | 2025 | 可验证性优先架构 | ⭐⭐⭐⭐ | -| **FORGE** | [2605.16233](https://arxiv.org/abs/2605.16233) | 2025 | 自演化记忆(无权重更新) | ⭐⭐⭐⭐ | +| **FORGE** | [2605.16233](https://arxiv.org/abs/2605.16233) | 2026 | 自演化记忆(无权重更新) | ⭐⭐⭐⭐ | | **TrustMem** | [2606.25161](https://arxiv.org/abs/2606.25161) | 2026 | 可信记忆整合 | ⭐⭐⭐⭐ | | **Gödel Agent** | [2410.04444](https://arxiv.org/abs/2410.04444) | 2024 | 递归自我改进框架 | ⭐⭐⭐ | @@ -1083,7 +1060,7 @@ Loop Engineering 的三大理论支柱: ## 十、关键要点回顾 -1. **Loop Engineering 是 2026 年 AI 工程的核心范式转移**:从"你 prompting agent"到"系统 prompting agent" +1. **Loop Engineering 是 2026 年 AI 编程工具中的一个重要工程化趋势**:从"你 prompting agent"到"系统 prompting agent" 2. **七大要素缺一不可**: - Trigger(触发器) @@ -1123,7 +1100,7 @@ Loop Engineering 的三大理论支柱: | 信源 | 类型 | 主要贡献 | 一致性验证 | |------|------|---------|-----------| -| **Addy Osmani 原文** | 权威博客 | Loop Engineering 定义、五大原语、工作流 | ✅ 所有其他信源均引用或认同此框架 | +| **Addy Osmani 原文** | 权威博客 | Loop Engineering 定义、五大原语、工作流 | ✅ 多个信源支持此框架,但具体范围和定义仍有争议 | | **IEEE Spectrum** | 学术期刊 | Prompt Engineering 有效性研究 | ✅ 与 Addy Osmani、小黑盒文章观点一致 | | **Claude Code 官方文档** | 官方文档 | `/goal` 命令详细机制 | ✅ 与 Addy Osmani 描述一致:evaluator model 机制 | | **小黑盒文章(两篇)** | 中文技术博客 | 七大要素、Dreaming 记忆循环、风险分析 | ✅ 与 Addy Osmani 框架高度一致,补充了实战案例 | @@ -1136,12 +1113,12 @@ Loop Engineering 的三大理论支柱: | **ReAct** | ICLR 2023 | 推理与行动交替循环 | Loop Engineering 的理论基石 | | **Reflexion** | 2023 | 语言反馈的强化学习 | Evaluation 和 Memory 要素的理论参考 | | **Self-Refine** | 2023 | 迭代精炼框架 | Refinement Loop 模式 | -| **AgentEval** | 2025 | DAG 步级评估 | Evaluation 的最新研究进展 | +| **AgentEval** | 2026 | DAG 步级评估 | Evaluation 的最新研究进展 | | **Infini Memory** | 2026 | 主题文档记忆 | Memory 要素的结构化存储方案 | -| **Agentic Memory** | 2025 | 统一长短期记忆管理 | Memory 工具化的学术体现 | +| **Agentic Memory** | 2026 | 统一长短期记忆管理 | Memory 工具化的学术体现 | **多信源支持的趋势**(范围和命名仍有争议): -1. Loop Engineering 是 2026 年 AI 工程的核心范式转移 +1. Loop Engineering 是 2026 年 AI 编程工具中的一个重要工程化趋势 2. Addy Osmani 将两者的功能映射到类似 Loop 原语的五大类别;具体功能以官方文档为准 3. **Evaluation 是 loop 最关键的瓶颈**(Reflexion 论文强调) 4. 手工试错式 Prompt Engineering 作为独立技能边际价值下降,但作为系统工程的一部分仍然重要