Update: Loop Engineering 学习指南（修复引用冲突、更新 OpenAI Codex 状态、补充缺失参考文献）

2026-06-26 21:57:52 +08:00
parent ae6752ead1
commit c38ff84995
1 changed files with 13 additions and 7 deletions
--- a/loop-engineering-prompt.md
+++ b/loop-engineering-prompt.md
@@ -33,7 +33,7 @@ Loop Engineering 的核心转变是把"你写 prompt 让 AI 执行"改成"你设
 ## 一、什么是 Loop Engineering？
-**Loop Engineering** 是 2026 年受到广泛关注的新概念，由 Google 工程师 Addy Osmani 系统整理，Anthropic Claude Code 负责人 Boris Cherny 和 OpenClaw 创始人 Peter Steinberger 共同推动。
+**Loop Engineering** 是 2026 年受到广泛关注的新概念，Addy Osmani 在 2026 年 6 月的文章中系统命名和整理，Anthropic Claude Code 负责人 Boris Cherny 和 OpenClaw 创始人 Peter Steinberger 共同推动。
 > 需要先说明：**"Loop Engineering"目前更多是社区术语，而非已稳定成型的工程学科。** 它所描述的能力——持续运行、自我评估、记忆管理——本质上是 agent orchestration、workflow automation、eval-driven development 和 stateful automation 的组合。把它理解为"如何设计长期运行的 AI 系统"更准确，而不是一个已经有标准答案的新领域。
@@ -58,7 +58,7 @@ Loop Engineering      →  "做完成"（让 AI 持续创造结果）
 ---
-## 二、为什么 Prompt Engineering 不够用了？
+## 二、为什么只做 Prompt Engineering 不够了？
 ### IEEE Spectrum 的研究结论
@@ -167,7 +167,7 @@ IEEE 的研究并不意味着 prompt 本身没用，而是揭示了：
 **研究证据**：
 - **FORGE**（2026）[arXiv:2605.16233]：提出**基于人群的记忆演化**机制，防止记忆退化和混淆
- **TrustMem**（2026）[arXiv:2606.25161]：专门解决记忆更新可能引入幻觉或腐败内容的问题
+- **TrustMem**[15]（2026）：专门解决记忆更新可能引入幻觉或腐败内容的问题
 ---
@@ -189,7 +189,7 @@ IEEE 的研究并不意味着 prompt 本身没用，而是揭示了：
 ### 7. Human Checkpoint（人工检查点）
-**作用**：哪些节点必须让人类介入？
+**作用**：哪些节点需要人类确认、抽查或审计？
 **这不是保守，而是必要的系统设计**。
@@ -204,7 +204,7 @@ IEEE 的研究并不意味着 prompt 本身没用，而是揭示了：
 ## 四、工具层面的真实状态
-**先说一个事实核查结果**：文章原版引用的 `https://developers.openai.com/codex/automations` 目前返回 403，不可公开访问。OpenAI Codex 的 Subagents 和 Skills 页面同样返回 403。以下工具映射基于官方文档中可访问的部分，以及 Addy Osmani 原文的描述，建议以产品界面和最新文档为准。
+**先说一个事实核查结果**：Codex 相关文档路径在 2026 年仍处于快速变化中。本文核查时，OpenAI Developers 站点已有 Codex Automations、Skills、Subagents 等页面；但具体功能是否对所有账号开放，仍可能受产品版本、权限和地区影响。因此，下面的映射应被理解为"当前公开资料下的能力对照"，不是稳定 API 契约。
 | **Loop 原语** | **在 Loop 中的角色** | **OpenAI Codex** | **Claude Code** |
 |--------------|--------------------|-----------------|----------------|
@@ -269,7 +269,7 @@ IEEE 的研究并不意味着 prompt 本身没用，而是揭示了：
 **适合**：实时响应系统、告警处理、Webhook 驱动工作流。
-**学术参考**：AgentEval[11]的 DAG 结构——事件触发有向无环图中的节点执行。
+**学术参考**：AgentEval（arXiv:2604.23581）的 DAG 结构——事件触发有向无环图中的节点执行。
 ---
@@ -346,7 +346,7 @@ gh issue view <number> --json comments | grep -q "linear.app"
 **Memory 架构选择**：
 - **简单场景**：Markdown 文件（如 `progress.md`）
- **中等复杂度**：Infini Memory 的 Topic Documents 结构
+- **中等复杂度**：Infini Memory[14]的 Topic Documents 结构
 - **高复杂度**：MemForest 或向量数据库 + 知识图谱
 #### Step 6: 定义 Stop Condition
@@ -833,3 +833,9 @@ agent_teams:
 [11] OpenAI. *Subagents – Codex*. https://developers.openai.com/codex/subagents **[类型 B]**
 [12] OpenAI. *Skills – Codex*. https://developers.openai.com/codex/skills **[类型 B]**
 [13] AgentEval. *DAG-Structured Step-Level Evaluation for Agentic Workflows with Error Propagation Tracking*. https://arxiv.org/abs/2604.23581 **[类型 A]**
 [14] *Infini Memory: Maintainable Topic Documents for Long-Term LLM Agent Memory*. https://arxiv.org/abs/2606.10677 **[类型 A]**
 [15] *TRUSTMEM: Learning Trustworthy Memory Consolidation for LLM Agents with Long-Term Memory*. https://arxiv.org/abs/2606.25161 **[类型 A]**