Update: Loop Engineering 学习指南(修复引用冲突、更新 OpenAI Codex 状态、补充缺失参考文献)

This commit is contained in:
2026-06-26 21:57:52 +08:00
parent ae6752ead1
commit c38ff84995

View File

@@ -33,7 +33,7 @@ Loop Engineering 的核心转变是把"你写 prompt 让 AI 执行"改成"你设
## 一、什么是 Loop Engineering ## 一、什么是 Loop Engineering
**Loop Engineering** 是 2026 年受到广泛关注的新概念,由 Google 工程师 Addy Osmani 系统整理Anthropic Claude Code 负责人 Boris Cherny 和 OpenClaw 创始人 Peter Steinberger 共同推动。 **Loop Engineering** 是 2026 年受到广泛关注的新概念,Addy Osmani 在 2026 年 6 月的文章中系统命名和整理Anthropic Claude Code 负责人 Boris Cherny 和 OpenClaw 创始人 Peter Steinberger 共同推动。
> 需要先说明:**"Loop Engineering"目前更多是社区术语,而非已稳定成型的工程学科。** 它所描述的能力——持续运行、自我评估、记忆管理——本质上是 agent orchestration、workflow automation、eval-driven development 和 stateful automation 的组合。把它理解为"如何设计长期运行的 AI 系统"更准确,而不是一个已经有标准答案的新领域。 > 需要先说明:**"Loop Engineering"目前更多是社区术语,而非已稳定成型的工程学科。** 它所描述的能力——持续运行、自我评估、记忆管理——本质上是 agent orchestration、workflow automation、eval-driven development 和 stateful automation 的组合。把它理解为"如何设计长期运行的 AI 系统"更准确,而不是一个已经有标准答案的新领域。
@@ -58,7 +58,7 @@ Loop Engineering → "做完成"(让 AI 持续创造结果)
--- ---
## 二、为什么 Prompt Engineering 不够了? ## 二、为什么只做 Prompt Engineering 不够了?
### IEEE Spectrum 的研究结论 ### IEEE Spectrum 的研究结论
@@ -167,7 +167,7 @@ IEEE 的研究并不意味着 prompt 本身没用,而是揭示了:
**研究证据** **研究证据**
- **FORGE**2026[arXiv:2605.16233]:提出**基于人群的记忆演化**机制,防止记忆退化和混淆 - **FORGE**2026[arXiv:2605.16233]:提出**基于人群的记忆演化**机制,防止记忆退化和混淆
- **TrustMem**2026[arXiv:2606.25161]:专门解决记忆更新可能引入幻觉或腐败内容的问题 - **TrustMem**[15]2026专门解决记忆更新可能引入幻觉或腐败内容的问题
--- ---
@@ -189,7 +189,7 @@ IEEE 的研究并不意味着 prompt 本身没用,而是揭示了:
### 7. Human Checkpoint人工检查点 ### 7. Human Checkpoint人工检查点
**作用**:哪些节点必须让人类介入 **作用**:哪些节点需要人类确认、抽查或审计
**这不是保守,而是必要的系统设计** **这不是保守,而是必要的系统设计**
@@ -204,7 +204,7 @@ IEEE 的研究并不意味着 prompt 本身没用,而是揭示了:
## 四、工具层面的真实状态 ## 四、工具层面的真实状态
**先说一个事实核查结果**文章原版引用的 `https://developers.openai.com/codex/automations` 目前返回 403不可公开访问。OpenAI Codex 的 Subagents 和 Skills 页面同样返回 403。以下工具映射基于官方文档中可访问的部分以及 Addy Osmani 原文的描述,建议以产品界面和最新文档为准 **先说一个事实核查结果**Codex 相关文档路径在 2026 年仍处于快速变化中。本文核查时OpenAI Developers 站点已有 Codex Automations、Skills、Subagents 等页面;但具体功能是否对所有账号开放,仍可能受产品版本、权限和地区影响。因此,下面的映射应被理解为"当前公开资料下的能力对照",不是稳定 API 契约
| **Loop 原语** | **在 Loop 中的角色** | **OpenAI Codex** | **Claude Code** | | **Loop 原语** | **在 Loop 中的角色** | **OpenAI Codex** | **Claude Code** |
|--------------|--------------------|-----------------|----------------| |--------------|--------------------|-----------------|----------------|
@@ -269,7 +269,7 @@ IEEE 的研究并不意味着 prompt 本身没用,而是揭示了:
**适合**实时响应系统、告警处理、Webhook 驱动工作流。 **适合**实时响应系统、告警处理、Webhook 驱动工作流。
**学术参考**AgentEval[11]的 DAG 结构——事件触发有向无环图中的节点执行。 **学术参考**AgentEvalarXiv:2604.23581的 DAG 结构——事件触发有向无环图中的节点执行。
--- ---
@@ -346,7 +346,7 @@ gh issue view <number> --json comments | grep -q "linear.app"
**Memory 架构选择** **Memory 架构选择**
- **简单场景**Markdown 文件(如 `progress.md` - **简单场景**Markdown 文件(如 `progress.md`
- **中等复杂度**Infini Memory 的 Topic Documents 结构 - **中等复杂度**Infini Memory[14]的 Topic Documents 结构
- **高复杂度**MemForest 或向量数据库 + 知识图谱 - **高复杂度**MemForest 或向量数据库 + 知识图谱
#### Step 6: 定义 Stop Condition #### Step 6: 定义 Stop Condition
@@ -833,3 +833,9 @@ agent_teams:
[11] OpenAI. *Subagents Codex*. https://developers.openai.com/codex/subagents **[类型 B]** [11] OpenAI. *Subagents Codex*. https://developers.openai.com/codex/subagents **[类型 B]**
[12] OpenAI. *Skills Codex*. https://developers.openai.com/codex/skills **[类型 B]** [12] OpenAI. *Skills Codex*. https://developers.openai.com/codex/skills **[类型 B]**
[13] AgentEval. *DAG-Structured Step-Level Evaluation for Agentic Workflows with Error Propagation Tracking*. https://arxiv.org/abs/2604.23581 **[类型 A]**
[14] *Infini Memory: Maintainable Topic Documents for Long-Term LLM Agent Memory*. https://arxiv.org/abs/2606.10677 **[类型 A]**
[15] *TRUSTMEM: Learning Trustworthy Memory Consolidation for LLM Agents with Long-Term Memory*. https://arxiv.org/abs/2606.25161 **[类型 A]**