Guardrails:如何约束 Agent 不做错事系统分析 Agent 安全护栏的三层架构——输入防护、执行防护、输出防护——涵盖 Prompt Injection 防御、权限分级、沙箱隔离、敏感信息过滤,以及真实产品中的 Guardrails 设计。