From c38ff8499523a84da557d218ad49f29f78c56825 Mon Sep 17 00:00:00 2001 From: Elaina Date: Fri, 26 Jun 2026 21:57:52 +0800 Subject: [PATCH] =?UTF-8?q?Update:=20Loop=20Engineering=20=E5=AD=A6?= =?UTF-8?q?=E4=B9=A0=E6=8C=87=E5=8D=97=EF=BC=88=E4=BF=AE=E5=A4=8D=E5=BC=95?= =?UTF-8?q?=E7=94=A8=E5=86=B2=E7=AA=81=E3=80=81=E6=9B=B4=E6=96=B0=20OpenAI?= =?UTF-8?q?=20Codex=20=E7=8A=B6=E6=80=81=E3=80=81=E8=A1=A5=E5=85=85?= =?UTF-8?q?=E7=BC=BA=E5=A4=B1=E5=8F=82=E8=80=83=E6=96=87=E7=8C=AE=EF=BC=89?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- loop-engineering-prompt.md | 20 +++++++++++++------- 1 file changed, 13 insertions(+), 7 deletions(-) diff --git a/loop-engineering-prompt.md b/loop-engineering-prompt.md index 475bb2d..10e43cc 100644 --- a/loop-engineering-prompt.md +++ b/loop-engineering-prompt.md @@ -33,7 +33,7 @@ Loop Engineering 的核心转变是把"你写 prompt 让 AI 执行"改成"你设 ## 一、什么是 Loop Engineering? -**Loop Engineering** 是 2026 年受到广泛关注的新概念,由 Google 工程师 Addy Osmani 系统整理,Anthropic Claude Code 负责人 Boris Cherny 和 OpenClaw 创始人 Peter Steinberger 共同推动。 +**Loop Engineering** 是 2026 年受到广泛关注的新概念,Addy Osmani 在 2026 年 6 月的文章中系统命名和整理,Anthropic Claude Code 负责人 Boris Cherny 和 OpenClaw 创始人 Peter Steinberger 共同推动。 > 需要先说明:**"Loop Engineering"目前更多是社区术语,而非已稳定成型的工程学科。** 它所描述的能力——持续运行、自我评估、记忆管理——本质上是 agent orchestration、workflow automation、eval-driven development 和 stateful automation 的组合。把它理解为"如何设计长期运行的 AI 系统"更准确,而不是一个已经有标准答案的新领域。 @@ -58,7 +58,7 @@ Loop Engineering → "做完成"(让 AI 持续创造结果) --- -## 二、为什么 Prompt Engineering 不够用了? +## 二、为什么只做 Prompt Engineering 不够了? ### IEEE Spectrum 的研究结论 @@ -167,7 +167,7 @@ IEEE 的研究并不意味着 prompt 本身没用,而是揭示了: **研究证据**: - **FORGE**(2026)[arXiv:2605.16233]:提出**基于人群的记忆演化**机制,防止记忆退化和混淆 -- **TrustMem**(2026)[arXiv:2606.25161]:专门解决记忆更新可能引入幻觉或腐败内容的问题 +- **TrustMem**[15](2026):专门解决记忆更新可能引入幻觉或腐败内容的问题 --- @@ -189,7 +189,7 @@ IEEE 的研究并不意味着 prompt 本身没用,而是揭示了: ### 7. Human Checkpoint(人工检查点) -**作用**:哪些节点必须让人类介入? +**作用**:哪些节点需要人类确认、抽查或审计? **这不是保守,而是必要的系统设计**。 @@ -204,7 +204,7 @@ IEEE 的研究并不意味着 prompt 本身没用,而是揭示了: ## 四、工具层面的真实状态 -**先说一个事实核查结果**:文章原版引用的 `https://developers.openai.com/codex/automations` 目前返回 403,不可公开访问。OpenAI Codex 的 Subagents 和 Skills 页面同样返回 403。以下工具映射基于官方文档中可访问的部分,以及 Addy Osmani 原文的描述,建议以产品界面和最新文档为准。 +**先说一个事实核查结果**:Codex 相关文档路径在 2026 年仍处于快速变化中。本文核查时,OpenAI Developers 站点已有 Codex Automations、Skills、Subagents 等页面;但具体功能是否对所有账号开放,仍可能受产品版本、权限和地区影响。因此,下面的映射应被理解为"当前公开资料下的能力对照",不是稳定 API 契约。 | **Loop 原语** | **在 Loop 中的角色** | **OpenAI Codex** | **Claude Code** | |--------------|--------------------|-----------------|----------------| @@ -269,7 +269,7 @@ IEEE 的研究并不意味着 prompt 本身没用,而是揭示了: **适合**:实时响应系统、告警处理、Webhook 驱动工作流。 -**学术参考**:AgentEval[11]的 DAG 结构——事件触发有向无环图中的节点执行。 +**学术参考**:AgentEval(arXiv:2604.23581)的 DAG 结构——事件触发有向无环图中的节点执行。 --- @@ -346,7 +346,7 @@ gh issue view --json comments | grep -q "linear.app" **Memory 架构选择**: - **简单场景**:Markdown 文件(如 `progress.md`) -- **中等复杂度**:Infini Memory 的 Topic Documents 结构 +- **中等复杂度**:Infini Memory[14]的 Topic Documents 结构 - **高复杂度**:MemForest 或向量数据库 + 知识图谱 #### Step 6: 定义 Stop Condition @@ -833,3 +833,9 @@ agent_teams: [11] OpenAI. *Subagents – Codex*. https://developers.openai.com/codex/subagents **[类型 B]** [12] OpenAI. *Skills – Codex*. https://developers.openai.com/codex/skills **[类型 B]** + +[13] AgentEval. *DAG-Structured Step-Level Evaluation for Agentic Workflows with Error Propagation Tracking*. https://arxiv.org/abs/2604.23581 **[类型 A]** + +[14] *Infini Memory: Maintainable Topic Documents for Long-Term LLM Agent Memory*. https://arxiv.org/abs/2606.10677 **[类型 A]** + +[15] *TRUSTMEM: Learning Trustworthy Memory Consolidation for LLM Agents with Long-Term Memory*. https://arxiv.org/abs/2606.25161 **[类型 A]**