什么是 Compound Engineering

Compound Engineering 是一种战略性软件构建方法，它将 AI 模型直接集成到应用架构中，而非将其视为外部 API 调用。它将重点从简单的提示工程（Prompt Engineering）转向构建“复合系统”——即多个 AI 智能体、工具和数据源在反馈循环中交互的架构。与标准封装器不同，该方法强调状态管理、工具使用编排和迭代优化，使开发者能够构建复杂的自主工作流，以更高的可靠性和更低的错误率处理多步推理任务。

Compound Engineering 的核心功能

多智能体编排

超越单一提示词交互，通过协调多个专业智能体来完成任务。通过委派任务（例如一个智能体负责研究，另一个负责综合），该系统相比单一模型可降低 40% 的幻觉率。此架构允许在更大的流水线中对单个智能体性能进行模块化测试。

状态化执行循环

在多轮对话中保持持久状态，使智能体能够记忆之前的上下文和工具结果。这对于需要迭代优化的复杂工作流（如代码生成或数据分析）至关重要，系统必须根据之前的执行错误进行“自我纠正”。

确定性工具集成

利用确定性代码执行封装非确定性的 LLM 输出。通过强制智能体使用结构化函数调用 (JSON schema)，开发者确保 AI 输出能直接映射到 API 端点或数据库查询，有效弥合自然语言意图与可靠软件执行之间的鸿沟。

自动化反馈验证

对智能体输出实施程序化检查。如果智能体生成 SQL 查询，系统会在执行前根据模式验证语法。这种“人在回路”或“代码在回路”的方法可防止复杂链条中的级联故障，确保高保真结果。

模块化架构设计

鼓励模型逻辑与应用逻辑解耦。通过将模型视为可互换组件，开发者无需重写编排层即可将 GPT-4o 替换为 Claude 3.5 Sonnet 或本地 Llama 3 模型，从而根据特定任务需求优化成本和延迟。

如何使用 Compound Engineering

将主要应用目标分解为子任务的有向无环图 (DAG)；2. 为每个节点定义专门的 AI 智能体，分配特定的系统提示词和工具访问权限；3. 使用 LangGraph 或 AutoGen 等框架实现编排层，以管理状态转换；4. 集成外部数据检索工具 (RAG) 为智能体提供实时上下文；5. 建立反馈循环，在继续执行前通过基于代码的断言验证智能体输出；6. 将复合系统部署到无服务器环境以处理异步智能体执行。

Compound Engineering 的使用场景