《Prompt / Context / Harness / Loop 四大AI工程详解》（PDF文件） -

《Prompt /Context/Harness /Loop四大AI工程详解》是致网科技模智空间推出的55页深度报告，系统提出Prompt、Context、Harness、Loop四大AI工程体系，覆盖从意图表达、信息供给、安全执行到自主循环的完整链路。报告提出AI工程正从单次问答向闭环执行演进，四层能力协同叠加非替代，缺一不可，并详解结构化Prompt模板、RAG检索增强、Agent沙箱安全、自动化工作循环与Skills沉淀等工程化落地方法。

扫码关注公众号，回复口令：20260619，免费领取PDF报告

从基础交互到自主循环——AI工程的演进

AI工程的关注重点已从生成准确答案转向闭环执行。
早期是单次问答模式，现在需要理解、检索、行动、验证、反馈组成的执行链。
提出四层演进架构：Prompt Engineering（表达）、Context Engineering（信息）、Harness Engineering（执行）、Loop Engineering（闭环）。
四层不是替代关系，而是协作叠加：Prompt定义任务，Context提供证据，Harness安全执行，Loop读取反馈。
反例警示：只有Prompt缺事实、只有Context不会行动、只有Harness缺目标、只有Loop易空转。

Prompt Engineering——意图的精确表达

核心目标：把模糊意图变成可执行任务，通过输入结构、任务指令、上下文边界、示例和输出协议调控模型行为。
五类核心要素：身份（限定视角）、任务（明确目标）、上下文（提供背景）、约束（划定边界）、输出（规定格式）。
提示技巧1——Few-Shot：用少量示例将隐含的业务标准、输出格式和边界案例具体化，适合规则难写全的任务。
提示技巧2——CoT与Self-Consistency：CoT让复杂任务按步骤拆解推导；Self-Consistency通过多路径推理投票，降低单次偏差。
控制条件与输出结构：同一任务可按角色（架构师/客服/产品经理）、受众（技术团队/普通用户/管理层）、场景（故障复盘/客户通知/决策汇报）输出不同结构。
工程化落地：建立模板库、示例库、版本管理与失败样本库，实现Prompt的可版本化、可评测、可回滚。

Context Engineering——知识与记忆的窗口

核心目标：让模型在正确时间看到正确资料，通过检索、筛选、排序、压缩、权限过滤、引用绑定生成上下文包。
上下文窗口管理：将原始文档、历史对话、工具返回按优先级整理为系统指令、当前任务、关键证据、近期对话、工具结果、工作状态六大区块。
RAG体系：离线索引完成文档采集、清洗切分、向量化与索引库构建；在线推理通过查询改写、召回、Rerank、上下文拼装、模型生成、引用输出完成答案生产。
Agentic RAG演进：从单次检索升级为模型主动判断是否需要改写查询、拆分子问题或持续检索。
上下文组装器：对输入材料进行优先级排序、去重、冲突检测、权限过滤、格式化，输出可用上下文包。
长文档处理：通过去重裁剪、摘要压缩、证据定位、关键片段提取，配合摘要写入与证据检索，支撑长周期任务。
多模态处理：统一处理文本、图片、表格、代码、日志、网页截图，经区域定位、表格结构化、代码语义、日志聚合、截图识别后生成统一上下文包。

Harness Engineering——系统的安全护栏

背景：2025年Agent能力爆发，但可靠性不足，存在死循环、忘事、无视规则、低级错误等问题。
系统类比：模型像CPU提供算力，上下文像内存存放信息，Harness像操作系统负责调度，Agent像应用程序完成任务。
ETCLOVG框架：执行环境（E）、工具接口（T）、上下文与记忆（C）、生命周期与编排（L）、可观测性（O）、验证与评估（V）、治理与安全（G）。
执行环境：通过沙箱实现安全隔离（代码/命令/网络限制）、可复现性（一键重置、初始状态一致）与自主性提升（减少人工授权）。

工具接口：通过MCP（Model Context Protocol）与A2A（Agent-to-Agent）标准化协议，解决模型无法直接操作软件界面、API、命令行的问题。
记忆管理：构建短期上下文（工作内存）、中期会话记忆（会话级缓存）、长期持久记忆（向量/图数据库）三层体系。
生命周期编排：单智能体循环（ReAct：思考-行动-观察-反思）、多智能体编排（规划者-执行者-评审者分工）、全流程管线（GitHub Issue→开发→测试→PR）。
可观测性：链路追踪（模型/工具/上下文变化）、成本与性能监控（Token消耗、推理延迟）、故障运维（循环调用、环境异常、推理失效）。
验证与评估：从只看最终分数升级为全过程质检，涵盖任务定义、运行前校验、链路采集、多维度评判（结果/工具合理性/效率/合规）、回归迭代。
治理与安全：权限管控（文件/网络/工具精细授权）、执行钩子（前后检查点、拦截违规）、组件加固（防沙箱逃逸、防提示注入）、审计与合规。
三元悖论：质量、速度、成本三者此消彼长，需按场景取舍。

Loop Engineering——循环的设计与自主执行

核心转变：从人不断手动驱动智能体演进为人设计循环，循环自动驱动智能体。
外循环与内循环：外循环决定要不要启动下一轮，内循环负责这一轮里怎么做。
六大组件：
- Automations：定时触发、扫描状态、总结失败。
- Worktrees：隔离并行任务，避免多智能体文件覆盖与代码冲突。
- Skills：通过SKILL.md沉淀项目知识（规范、流程、踩坑），一次配置持续复用。
- Plugins & Connectors：通过MCP连接工单系统、数据库、Slack、CI、API等真实环境。
- Sub-Agents：角色拆分（探索、开发、审核、校验），解决自审盲区，实现交叉验证。
- Memory：外部持久化记忆（Markdown/任务看板/状态文件），解决重启后遗忘，实现跨循环无缝延续。
自动化任务：对比单次AI执行，Loop支持按频率重复（/loop）或直到满足条件（/goal），配合独立校验模型确保结果可信。
实践映射：Codex内置Worktree支持多线程并行；Claude Code支持独立工作目录、子智能体隔离与任务后自动清理。

总结与未来展望

四大工程一句话总结：Prompt解决怎么问，Context解决让AI看到什么，Harness解决AI在什么环境里工作，Loop解决AI做完一步后怎么办。
三阶段演进：阶段1指令驱动（Prompt Engineering，简单/单轮/静态）→阶段2信息驱动（Context+Harness，多轮对话/工具调用，仍需人工干预）→阶段3系统驱动（Loop Engineering，长周期/多步骤/自主迭代）。
本质：从给模型写指令，到给模型提供信息与环境，再到搭建一套会自己运行的系统。