调试 Agent:当你不知道它为什么做了那件事补完评测-调试-修复闭环:Agent 评测告诉你出了问题,可观测性告诉你问题在哪、为什么出问题。涵盖 Trace 设计、结构化日志、关键指标、Replay 复现、常见调试模式和工具链选型。