功能详情

1. Introducing Reflections(Agent 反思学习)已有深度分析 →

新功能
"Agents now automatically learn from past interactions. Reflections surface patterns and suggestions, helping your agents improve over time."

Reflections 是 Gumloop 的 Agent 自主学习系统——Agent 定期回顾自身历史对话,自动识别跨对话的模式、错误和优化机会,并生成具体的改进建议。

五步反思流程:

  1. Gather Recent Activity — Agent 聚合自上次反思以来的所有操作:工具调用、对话记录、错误日志
  2. Mine for Patterns — 自动检测重复请求类型、持续错误、低效工具序列、重复抓取的数据。每个候选模式附带置信度分数和支持交互计数
  3. Validate with Transcripts — Agent 阅读真实对话记录验证每个候选模式是否为"真实的、跨交互一致的、值得修复的"。一次性事件、已解决的问题、任务固有模式被丢弃
  4. Check Existing Knowledge — Agent 检查当前 Instructions 和 Skills 确保建议的修改尚未被覆盖,同时检查之前的 Reflections 是否已处理过
  5. Propose Improvements — 对每个验证过的模式,Agent 选择合适的改进类别并撰写详细建议

四种改进类型:

  • New Skill:发现≥3 步的重复工作流模式(如"Jira 搜索→筛选→格式化"模式出现 8 次)
  • Skill Fix:现有 Skill 能处理但遗漏边缘情况
  • Instruction Update:行为规则或领域知识(如"始终用 UTC 时间"、"用户偏好蓝色主题")
  • Tool Access:Agent 在用 hack 方式绕过缺失的集成(如用 sandbox curl 替代 API 工具)

Apply 行为:Review Queue(默认,所有建议需人工确认后生效,推荐生产/面向客户的 Agent)或 Auto-Apply Eligible Reflections(低风险、证据充分建议自动应用,推荐内部助手)。

调度:通过 Cron 表达式配置,默认每日 UTC 22:00。建议高频 Agent 每日运行,低频 Agent 每 2-3 天或每周。

报告投递:支持 Email 报告和 Slack DM 报告(均默认关闭,需显式开启)。

与 Self-Improve Instructions 和 Skill Editing 的关系:三者构成 Agent 学习体系——Self-Improve Instructions(对话中实时更新 Prompt)和 Skill Editing(对话中创建/修改 Skills)是反应式的;Reflections 是主动的,发现用户自己可能没注意到的跨对话模式。

应用场景:(1) 长期运行的 Agent 越用越懂用户偏好,减少反复纠正——迁移成本随使用时间递增 (2) 团队 Agent 自动发现并固化最佳实践 (3) 批量自动化改进——一次审批替代数十次手动调整
"Agents now support queued follow-up messages while an agent is still working, so you can add steering instructions mid-chat and have them sent in order."

Queue and Steer 改变了 Agent 交互的基本范式。此前用户必须等 Agent 执行完才能发送下一条消息,现在是"实时协作式"交互。

消息排队机制:

  • Agent 运行期间,用户可在输入框上方看到排队消息列表
  • 系统在 Agent 完成当前步骤后(如处理完一个工具调用)自动投递队列中下一条消息
  • Agent 将排队消息视为"在那一刻发送的"——保持完整的对话上下文
  • 如果 Agent 在消息投递前已完成响应,消息转为普通后续消息

用户可执行的操作:排队多条消息(Agent 响应期间持续添加)、附加文件/图片到排队消息、点击消息编辑文本(在投递前修改)、拖拽重新排序队列、删除未投递的消息、重试发送失败的消息。

Steering(引导)能力:在 Agent 执行到自然断点(工具调用完成)时注入方向调整——"聚焦 Q3 数据"、"截止日期是周五"、"更简洁"、"先做 A 再做 B"——任何引导指令。Steering 消息成为对话历史的一部分,Agent 维护完整上下文。

应用场景:(1) 长任务执行中想到补充信息,排队发送而不打断 (2) Agent 方向偏差时实时纠正,不丢失已有进度 (3) 一次性堆叠多个独立任务,Agent 逐个执行

3. MCP Artifacts(MCP 交付物集成)已有深度分析 →

新功能
"Artifacts can now connect to external services through MCP, enabling interactive dashboards, reports, and forms that read from and write to tools like Slack, Google Calendar, and GitLab."

MCP Artifacts 将 Agent Artifacts 系统与 MCP 协议打通。具体能力:

  • 交互式仪表盘:HTML Artifacts 可通过 MCP 实时拉取外部服务数据(如通过 Slack MCP 拉取频道消息、通过 Google Calendar MCP 获取日程),渲染为实时仪表盘
  • 交互式表单:HTML Artifacts 不仅展示数据,还可以通过 MCP 写回外部服务——如用户填写表单后 Agent 通过 MCP 工具创建 Jira Issue、发送 Slack 消息、或提交 GitLab MR
  • 打通「生成→发布」管道:Agent 生成内容(报告、图表、代码)后,通过 MCP 直接推送到外部服务——不再需要用户手动导出再上传

架构上,Artifacts 的 HTML 沙箱通过 Gumloop 的安全代理 (fetch('/gumloop/data/...')) 与 MCP 服务器通信——安全代理自动剥离敏感请求头,确保沙箱不直接访问外部网络。

帮助中心暂无独立 "MCP Artifacts" 页面;以上基于 Agent Artifacts(Interactive HTML / Live Data Scripts)+ Custom MCP Servers 两份文档的交叉验证。

应用场景:(1) 生成实时销售仪表盘,数据通过 MCP 从 Salesforce/Google Sheets 拉取 (2) Agent 生成代码审查报告,通过 MCP 自动提交 GitLab MR (3) 创建交互式审批表单——用户填写后 Agent 通过 MCP 执行审批操作

4. Longer-Running Subagents(长时子代理)

改进
"Subagents can now keep working for up to 1 hour, instead of the previous 15-minute execution window."

Subagent 执行时长从 15 分钟提升至 1 小时——4 倍提升。根据官方文档,Subagent 拥有约父 Agent 一半的执行预算。1 小时上限意味着父 Agent 可能拥有更长执行窗口。

文档中的超时处理:Subagent 超出时间限制时,系统先发送优雅中断信号(graceful abort),若仍不停止则强制取消。

此次升级使 Subagent 可覆盖的场景从"轻量并行任务"扩展到"深度分析/批量处理":大规模数据集分析(此前 15 分钟限制使大文件处理不可行)、竞争对手全面调研(跨多个数据源的长链搜索+分析)、批量文档生成/处理、复杂的多步骤代码审查。

与 v9.0.0 Subagents 原始发布的关系:v9.0.0 建立了多 Agent 架构(并行、广播、Worktree 隔离),v9.7.0 大幅扩展了每个 Agent 的执行深度。两者结合——并行 + 深度——让 Agent 协作从"分头做小事"升级为"分头做大事"。

应用场景:Agent 启动 3 个子 Agent 各花 40-50 分钟分别分析不同竞品的财报、产品更新和市场策略,主 Agent 聚合结果生成综合报告。

5. Lazy Tool Loading for Agents(工具按需加载)

新功能
"Agents with large MCP toolsets can now load tool details into context only when needed, freeing up more of the context window for the task itself and reducing unnecessary token costs."

此前 Agent 启动时将所有工具的定义(名称、描述、参数 Schema)一次性加载到上下文窗口。对于连接了大量 MCP 工具的 Agent,工具定义本身可消耗数千 token。Lazy Tool Loading 改为按需加载——Agent 只在实际需要调用某个工具时才加载其详细定义。

收益:

  • 上下文窗口释放:工具定义从"常驻开销"变为"即时加载",为实际任务释放更多 token
  • Token 成本降低:不需要为每次对话加载全部工具定义
  • 启动速度提升:Agent 初始化时无需等待所有工具 Schema 加载

官方文档中无独立的 "Lazy Tool Loading" 页面,功能逻辑基于 changelog 描述推断。

应用场景:连接了 50+ MCP 工具的重度 Agent 用户——节省大量上下文空间用于实际推理。

6. Speech-to-Text for Agent Chats(语音输入)

新功能
"Agent chats now support speech-to-text input, letting you dictate prompts directly into the composer before sending."

Agent Chat 新增语音输入。录音或上传音频文件后,Gumloop 在服务端转录,Agent 只收到文本转录结果,原始音频不传递。

支持格式:MP3、MP4、MPEG、MPGA、M4A、WAV、WebM。最大文件 25 MB。

转录模型:OpenAI Whisper(广泛语言支持)、GPT-4o Transcribe(高准确率、口音/噪音处理更好)、GPT-4o Mini Transcribe(更快/更便宜)。系统自动选择最佳模型。使用 BYOK 时转录消耗用户自己的 API Key(含 50% credit 折扣)。

应用场景:(1) 移动端快速输入 (2) 会议中实时向 Agent 提问 (3) 多任务场景免提操作。

7. GitLab MCP(集成)

集成
"Added tools for repositories, branches, commits, merge requests, issues, project work, and CI/CD."

GitLab MCP 提供了完整的 GitLab DevOps 工具集。Agent 可通过 MCP 协议直接操作仓库、分支、提交、合并请求、Issue 和 CI/CD 流水线。这是 GitLab 作为独立 MCP 服务器(而非通用代码工具)的首次完整集成。

应用场景:Agent 自动创建 MR、运行 CI/CD、管理 Issue 生命周期。

竞品分析

战略方向判断

v9.7.0 "Port Hope" 是 Gumloop 2026 年 Q2 最具雄心的版本。四个字概括:Agent 成熟化。三个维度同时推进:

1. 智能深度(Reflections):Agent 从"执行者"进化为"学习者"。如果说 v9.0.0 Subagents 实现了 Agent 的"横向扩展"(多 Agent 并行),Reflections 实现了 Agent 的"纵向进化"(随时间变聪明)。这是学习飞轮的开启——Agent 使用越多,越理解用户,迁移成本越高,构成长期竞争壁垒。

2. 交互质量(Queue & Steer):Chat UI 的"回合制"交互是 Agent 体验的最大瓶颈之一。Queue and Steer 将其变为"实时协作式"——你可以边看 Agent 工作边调整方向。这更接近真实人类协作模式,也是 Agent UX 从 Chatbot 向 Co-pilot 过渡的标志。

3. 能力边界(MCP Artifacts + Longer Subagents):Agent 不再只是"生成内容",而是"通过外部服务发布内容"。加上 Subagent 时长 4 倍提升,Agent 的能力边界从"内部工具"扩展到"生产级系统"。

与我方对比

Reflections 是当前 Gumloop 最强的差异化能力。在 Agent 领域,"学习能力"是区分"玩具"和"工具"的分水岭。Gumloop 通过 Reflections 建立的"使用→学习→更好地服务→更多使用"循环,将产生强大的用户粘性。如果我方尚无类似机制,需要评估自建还是等待开源方案。

Queue and Steer 体现了一个重要的产品判断:Agent 交互不应该只是 Chat。它的 "steering" 概念暗示 Gumloop 认为未来的 Agent 交互是"人在回路中的协作"而非"人发指令→Agent 执行"的单向模式。这个方向即使我方不直接复制,也值得在产品路线图中考虑。

MCP Artifacts 的战略意义不在于技术复杂度,而在于生态扩展性——通过 MCP 协议,任何外部服务都可以成为 Artifacts 的数据源或输出目标。这是一个"连接一个协议,获得所有服务"的杠杆效应。

⭐⭐⭐⭐⭐

v9.7.0 是 Q2 最重要的版本——在 7 项功能中,有 4 个 ≥8 分的 SPEC 候选,其中 Reflections 满分 13/13。这不是一个"功能多了"的版本,而是一个"平台升级"的版本。

推荐关注度:里程碑版本——开启 Agent 学习飞轮,改变竞争格局

关键功能深度点评

Reflections — Agent 的"元认知"层

Reflections 不只是一个"自动优化"功能——它是 Agent 架构中缺失的"元认知"层。传统 Agent 架构是"感知→推理→行动"的三层模型,Reflections 在上面加了第四层:"观察自身→发现模式→自我改进"。

为什么这是竞争壁垒?

  • 数据飞轮:更多使用→更多反思数据→更好 Agent→更多使用
  • 锁定效应:一个经过 6 个月 Reflections 训练的 Agent 包含了大量组织隐性知识(偏好、工作流、惯用工具),迁移成本远超技术迁移本身
  • 竞品差距:ChatGPT Memory 是被动记忆,Claude Projects 是静态知识库。两者都不是"主动从历史中学习并自我改进"——Reflections 在范式上领先一代

需关注的风险:

  • 错误学习放大:如果 Agent 学到错误模式(如"Q2 报表总是要手工修正某个数据"但实际上那是数据源的 bug),自动化反而放大错误。v9.8.0 的 Reflection Reports(Slack/Email 定期报告)显示 Gumloop 在建立透明度机制——但仍需观察用户审查和回滚能力
  • "过度泛化":Agent 可能从一两次偶然情况中推断出不适用的"规律"

Queue and Steer — 从"发令枪"到"方向盘"的交互范式升级

Queue and Steer 的技术实现并不复杂——消息队列加延迟投递——但它的产品洞察非常深刻:人类协作不是回合制的。当你说"帮我分析这个数据集"时,你不需要等 Agent 分析完才能说"对了,重点关注 Q3 数据"。

这种"人在回路中的实时协作"是 Agent 从"工具"到"同事"的关键一步。如果未来 Gumloop 加入"Agent 主动追问"(Agent 在执行中不确定时向用户提澄清问题),Queue and Steer 的架构将自然支持——因为排队机制本身就是双向的。