Human-in-the-Loop:Agent 什么时候应该停下来问你
Agent 不是越自动越好。本文系统分析 Human-in-the-Loop 的三种介入强度、触发逻辑、工程实现与常见陷阱,帮你在自主性与安全性之间找到合理的平衡点。
持久记忆实战:让 Agent 跨会话记住用户
前面所有实战教程的 Agent 一关就忘。这篇构建一个带持久记忆的 Agent:会话结束时自动提取关键事件存入情景记忆,从交互中累积用户画像存入语义记忆,下次启动时检索注入——让 Agent 跨会话保持连续性。
Skill 实战:教 Agent 写你风格的博客
前面所有 Agent 的领域知识都写在 System Prompt 里。这篇展示一种更好的方式:把领域知识抽离成独立的 Skill 文件,Agent 根据任务动态加载——改 Skill 文件就能改变 Agent 行为,不用动一行代码。
MCP 集成实战:让 Agent 连接真实服务
前面所有实战教程的工具都是硬编码注册的。这篇展示一种完全不同的方式:Agent 启动时不知道有哪些工具,运行时通过 MCP 协议动态发现、注册和调用——连接文件系统、GitHub 和 SQLite 三个真实的 MCP Server。
Multi-Agent 实战:用 Supervisor 模式构建代码审查系统
不只是多个 Agent 跑在一起——这篇文章的核心在于 Supervisor 编排模式的工程落地:任务分发策略、Agent 间上下文隔离、并行执行、交叉审查(Reflection 的多Agent 形态)、矛盾仲裁和结构化报告输出。
调试 Agent:当你不知道它为什么做了那件事
补完评测-调试-修复闭环:Agent 评测告诉你出了问题,可观测性告诉你问题在哪、为什么出问题。涵盖 Trace 设计、结构化日志、关键指标、Replay 复现、常见调试模式和工具链选型。
文件管理 Agent 实战:当操作不可逆时,Guardrails 怎么落地
不只是文件操作——这篇文章的核心是展示 Guardrails 如何在有不可逆操作的 Agent 系统中落地:四级权限工具、Dry-run 预览、用户审批流程、Undo 日志和回滚,以及这些机制如何与 ReAct 循环无缝集成。
Research Agent 实战:从 RAG 到自主研究
不只是造一个 RAG 问答系统——这篇文章构建一个能自主研究的 Agent:研究规划、多轮 Agentic RAG 检索、信息质量审查、矛盾处理,以及带来源引用的结构化报告输出。
Guardrails:如何约束 Agent 不做错事
系统分析 Agent 安全护栏的三层架构——输入防护、执行防护、输出防护——涵盖 Prompt Injection 防御、权限分级、沙箱隔离、敏感信息过滤,以及真实产品中的 Guardrails 设计。
记忆的四种形态:Agent 如何在不同时间尺度上保住它知道的事
区分 in-context、情景、语义与程序记忆;说明压缩、检索、更新策略与协作架构,以及常见设计错误与选型问题,可与上下文状态管理与 RAG 两篇对照阅读。