Reflections 是 Gumloop 的 Agent 自主学习系统——Agent 定期回顾自身历史对话,自动识别跨对话的模式、错误和优化机会,并生成具体的改进建议。
五步反思流程:
四种改进类型:
Apply 行为:Review Queue(默认,所有建议需人工确认后生效,推荐生产/面向客户的 Agent)或 Auto-Apply Eligible Reflections(低风险、证据充分建议自动应用,推荐内部助手)。
调度:通过 Cron 表达式配置,默认每日 UTC 22:00。建议高频 Agent 每日运行,低频 Agent 每 2-3 天或每周。
报告投递:支持 Email 报告和 Slack DM 报告(均默认关闭,需显式开启)。
与 Self-Improve Instructions 和 Skill Editing 的关系:三者构成 Agent 学习体系——Self-Improve Instructions(对话中实时更新 Prompt)和 Skill Editing(对话中创建/修改 Skills)是反应式的;Reflections 是主动的,发现用户自己可能没注意到的跨对话模式。
Queue and Steer 改变了 Agent 交互的基本范式。此前用户必须等 Agent 执行完才能发送下一条消息,现在是"实时协作式"交互。
消息排队机制:
用户可执行的操作:排队多条消息(Agent 响应期间持续添加)、附加文件/图片到排队消息、点击消息编辑文本(在投递前修改)、拖拽重新排序队列、删除未投递的消息、重试发送失败的消息。
Steering(引导)能力:在 Agent 执行到自然断点(工具调用完成)时注入方向调整——"聚焦 Q3 数据"、"截止日期是周五"、"更简洁"、"先做 A 再做 B"——任何引导指令。Steering 消息成为对话历史的一部分,Agent 维护完整上下文。
MCP Artifacts 将 Agent Artifacts 系统与 MCP 协议打通。具体能力:
架构上,Artifacts 的 HTML 沙箱通过 Gumloop 的安全代理 (fetch('/gumloop/data/...')) 与 MCP 服务器通信——安全代理自动剥离敏感请求头,确保沙箱不直接访问外部网络。
帮助中心暂无独立 "MCP Artifacts" 页面;以上基于 Agent Artifacts(Interactive HTML / Live Data Scripts)+ Custom MCP Servers 两份文档的交叉验证。
Subagent 执行时长从 15 分钟提升至 1 小时——4 倍提升。根据官方文档,Subagent 拥有约父 Agent 一半的执行预算。1 小时上限意味着父 Agent 可能拥有更长执行窗口。
文档中的超时处理:Subagent 超出时间限制时,系统先发送优雅中断信号(graceful abort),若仍不停止则强制取消。
此次升级使 Subagent 可覆盖的场景从"轻量并行任务"扩展到"深度分析/批量处理":大规模数据集分析(此前 15 分钟限制使大文件处理不可行)、竞争对手全面调研(跨多个数据源的长链搜索+分析)、批量文档生成/处理、复杂的多步骤代码审查。
与 v9.0.0 Subagents 原始发布的关系:v9.0.0 建立了多 Agent 架构(并行、广播、Worktree 隔离),v9.7.0 大幅扩展了每个 Agent 的执行深度。两者结合——并行 + 深度——让 Agent 协作从"分头做小事"升级为"分头做大事"。
此前 Agent 启动时将所有工具的定义(名称、描述、参数 Schema)一次性加载到上下文窗口。对于连接了大量 MCP 工具的 Agent,工具定义本身可消耗数千 token。Lazy Tool Loading 改为按需加载——Agent 只在实际需要调用某个工具时才加载其详细定义。
收益:
官方文档中无独立的 "Lazy Tool Loading" 页面,功能逻辑基于 changelog 描述推断。
Agent Chat 新增语音输入。录音或上传音频文件后,Gumloop 在服务端转录,Agent 只收到文本转录结果,原始音频不传递。
支持格式:MP3、MP4、MPEG、MPGA、M4A、WAV、WebM。最大文件 25 MB。
转录模型:OpenAI Whisper(广泛语言支持)、GPT-4o Transcribe(高准确率、口音/噪音处理更好)、GPT-4o Mini Transcribe(更快/更便宜)。系统自动选择最佳模型。使用 BYOK 时转录消耗用户自己的 API Key(含 50% credit 折扣)。
GitLab MCP 提供了完整的 GitLab DevOps 工具集。Agent 可通过 MCP 协议直接操作仓库、分支、提交、合并请求、Issue 和 CI/CD 流水线。这是 GitLab 作为独立 MCP 服务器(而非通用代码工具)的首次完整集成。
v9.7.0 "Port Hope" 是 Gumloop 2026 年 Q2 最具雄心的版本。四个字概括:Agent 成熟化。三个维度同时推进:
1. 智能深度(Reflections):Agent 从"执行者"进化为"学习者"。如果说 v9.0.0 Subagents 实现了 Agent 的"横向扩展"(多 Agent 并行),Reflections 实现了 Agent 的"纵向进化"(随时间变聪明)。这是学习飞轮的开启——Agent 使用越多,越理解用户,迁移成本越高,构成长期竞争壁垒。
2. 交互质量(Queue & Steer):Chat UI 的"回合制"交互是 Agent 体验的最大瓶颈之一。Queue and Steer 将其变为"实时协作式"——你可以边看 Agent 工作边调整方向。这更接近真实人类协作模式,也是 Agent UX 从 Chatbot 向 Co-pilot 过渡的标志。
3. 能力边界(MCP Artifacts + Longer Subagents):Agent 不再只是"生成内容",而是"通过外部服务发布内容"。加上 Subagent 时长 4 倍提升,Agent 的能力边界从"内部工具"扩展到"生产级系统"。
Reflections 是当前 Gumloop 最强的差异化能力。在 Agent 领域,"学习能力"是区分"玩具"和"工具"的分水岭。Gumloop 通过 Reflections 建立的"使用→学习→更好地服务→更多使用"循环,将产生强大的用户粘性。如果我方尚无类似机制,需要评估自建还是等待开源方案。
Queue and Steer 体现了一个重要的产品判断:Agent 交互不应该只是 Chat。它的 "steering" 概念暗示 Gumloop 认为未来的 Agent 交互是"人在回路中的协作"而非"人发指令→Agent 执行"的单向模式。这个方向即使我方不直接复制,也值得在产品路线图中考虑。
MCP Artifacts 的战略意义不在于技术复杂度,而在于生态扩展性——通过 MCP 协议,任何外部服务都可以成为 Artifacts 的数据源或输出目标。这是一个"连接一个协议,获得所有服务"的杠杆效应。
v9.7.0 是 Q2 最重要的版本——在 7 项功能中,有 4 个 ≥8 分的 SPEC 候选,其中 Reflections 满分 13/13。这不是一个"功能多了"的版本,而是一个"平台升级"的版本。
推荐关注度:里程碑版本——开启 Agent 学习飞轮,改变竞争格局
Reflections — Agent 的"元认知"层
Reflections 不只是一个"自动优化"功能——它是 Agent 架构中缺失的"元认知"层。传统 Agent 架构是"感知→推理→行动"的三层模型,Reflections 在上面加了第四层:"观察自身→发现模式→自我改进"。
为什么这是竞争壁垒?
需关注的风险:
Queue and Steer — 从"发令枪"到"方向盘"的交互范式升级
Queue and Steer 的技术实现并不复杂——消息队列加延迟投递——但它的产品洞察非常深刻:人类协作不是回合制的。当你说"帮我分析这个数据集"时,你不需要等 Agent 分析完才能说"对了,重点关注 Q3 数据"。
这种"人在回路中的实时协作"是 Agent 从"工具"到"同事"的关键一步。如果未来 Gumloop 加入"Agent 主动追问"(Agent 在执行中不确定时向用户提澄清问题),Queue and Steer 的架构将自然支持——因为排队机制本身就是双向的。