EPISODE· generated 2026-06-11 23:20:05· 13 min

Codez - Anthropic Managed Agents team: "Fable 5 is our best model for runnin...

S
Speaker

欢迎来到与Claude共代码,Jess来自产品部门,Michael来自工程部门分享了AI能力指数级增长以及其如何正在改变开发者工作流的见解。他们讨论了随着模型变得更加先进,开发者面临的挑战,例如管理上下文、安全地扩展基础设施以及确保可观测性,从而引入了云托管智能体,旨在开箱即用地处理这些复杂问题。

ai能力指数级增长claude代码开发智能体安全扩展可观测性
ready · seed-vc · qwen3-tts
0:00/0:00

⚠ The Chinese audio is an AI-generated dub (speech synthesis / voice conversion), not a real recording and may contain errors. Based on the original English interview; all rights remain with the original creator.

original lang
EN
dubbed into
中文 (ZH)
pipeline
Plan C · voice conversion
voice model
seed-vc · qwen3-tts
001
Speaker 1
欢迎各位来到Code with Claude。我是Jess,Claude Managed Agents的产品负责人。
002
Speaker 2
我是Michael,Claude Managed Agents的工程负责人。
003
Speaker 1
看到Claude Managed Agents的自然增长以及我们如何显著加速开发者的工作流程,令人非常兴奋。
004
Speaker 1
今天,我们想与大家分享这个故事。
005
Speaker 1
我们已经看到从颠覆性初创公司到最大企业的广泛采用,我们希望确保你们都能从他们所获得的经验中受益。
006
Speaker 1
首先,我们将探讨我们在AI能力方面看到的指数级增长,以及这对构建智能体意味着什么。
007
Speaker 1
我们将讨论我们在智能体开发中看到的模式,以及这些模式如何促使我们构建Claude Managed Agents。
008
Speaker 1
我们将介绍构建智能体的构建模块,包括其中一些最重要的部分。
009
Speaker 1
我们将介绍一些我们最近宣布的功能。
010
Speaker 1
最后,我们将与我们的英雄日本用户Rakuten进行一次非正式的对话。
011
Speaker 1
正如我们所看到的,模型的能力呈指数级增长,我们的期望也随之增长。
012
Speaker 1
我们的模型能力越先进,我们委托的工作就越复杂。
013
Speaker 1
我们现在看到的瓶颈越来越是基础设施,而不是实际的智能。
014
Speaker 1
那么,让我们把这个概念具体化。
015
Speaker 1
几年前,当Opus 3发布时,你可能让它编写和测试一个组件。
016
Speaker 1
这可能需要几分钟的专注工作。
017
Speaker 1
去年,当我们的Claude 4模型发布时,我们实现了升级,你可以调试一组完整的文件。
018
Speaker 1
你可能需要工作一两个小时,但你会在过程中进行大量指导。
019
Speaker 1
今年,随着我们最新的模型,你现在看到它们可以在智能体团队中整夜运行,听取你的线性待办事项列表,并在你醒来之前完成所有操作。
020
Speaker 1
现在,我们预计在短期内,随着像Fable这样强大的模型出现,我们将进入一个智能体能力足够完成以前需要整个团队用季度时间才能完成的任务的世界。
021
Speaker 1
并且智能体会完全自主地运行这个过程。
022
Speaker 1
因此,你可能会看到多智能体系统能够协调并全程运行整个并购流程,所需时间仅为我们现在所需时间的一小部分。
023
Speaker 1
因此,随着任务的逐步推进
024
Speaker 1
从低级指令转向端到端的结果描述。
025
Speaker 1
我们现在需要的远不止是提示和工具循环。
026
Speaker 1
我们需要可靠且可扩展的智能体基础设施。
027
Speaker 2
完全正确。
028
Speaker 2
而且这些任务越复杂,
029
Speaker 2
我们需要给予这些智能体更深入的访问权限
030
Speaker 2
为了让它们有效。
031
Speaker 2
有了像Fable这样的模型,我们真的需要这些来...
032
Speaker 2
他们能够完成非常复杂的任务。
033
Speaker 2
你无法运行一个有效的智能体
034
Speaker 2
在不授予其访问您凭证权限的情况下,
035
Speaker 2
你们的内部知识库或数据库。
036
Speaker 2
如果你想让这些智能体为你生成代码,
037
Speaker 2
你需要让他们访问你实际的代码库
038
Speaker 2
这样他们就可以推动PR并进入生产环境。
039
Speaker 2
最后,你需要授予它们身份和认证。
040
Speaker 2
我们的智能体越来越多地不仅仅作为Claude来行动,
041
Speaker 2
但对我来说或Jess,通过我们的电子邮件和Slack。
042
Speaker 2
当我们赋予智能体这些类似人类的能力时,
043
Speaker 2
我们期望它们会做出反应。
044
Speaker 2
我们期望它们以更加类似人类的方式与它们互动。
045
Speaker 2
互动的形式正在发生变化,
046
Speaker 2
而不仅仅是这些互动的持续时间。
047
Speaker 2
一些智能体非常善于对话。
048
Speaker 2
你可以引导它们,沿途提供指导。
049
Speaker 2
如果你认为它们偏离了轨道,甚至可以Interrupt它们。
050
Speaker 2
一些基于新模型(如Fable)的智能体
051
Speaker 2
非常注重结果。
052
Speaker 2
如果你有明确的信号或标准
053
Speaker 2
说明你希望看到什么被完成,
054
Speaker 2
你可以提供这些标准并让它进行迭代
055
Speaker 2
直到满足你的退出条件。
056
Speaker 2
最后,你可能几天前开始了一个任务
057
Speaker 2
然后想在很久之后再继续处理它。
058
Speaker 2
一个强大的智能体平台需要支持
059
Speaker 2
所有这些类型的交互模式。
060
Speaker 2
我们提供的基础设施和基本组件
061
Speaker 2
必须一次性把所有这些都提供给你
062
Speaker 2
同时还要非常非常灵活
063
Speaker 2
这样你就可以根据自己的需求进行定制。
064
Speaker 1
现在很明显,我们对智能体的期望很高。
065
Speaker 1
历史上,这意味着
066
Speaker 1
我们把负担都推给了你,开发者。
067
Speaker 1
在研究中,我们进行了
068
Speaker 1
在推出云托管智能体之前,
069
Speaker 1
我们发现开发者们确实渴望
070
Speaker 1
与我们一同攀登指数级增长的曲线,
071
Speaker 1
但他们在一些关键领域遇到了困难。
072
Speaker 1
首先,上下文管理。
073
Speaker 1
在正确的时间提供正确的上下文
074
Speaker 1
实际上非常难以调整
075
Speaker 1
尽管这完全必要。
076
Speaker 1
而在错误的时间提供上下文
077
Speaker 1
可能会严重分散智能体的注意力。
078
Speaker 1
我们有一半的开发者提到
079
Speaker 1
基础设施方面的担忧
080
Speaker 1
是他们最大的生产障碍。
081
Speaker 1
因此智能体会产生突发性的工作负载,
082
Speaker 1
它们具有不可预测的计算模式。
083
Speaker 1
在保证安全性的同时进行扩展非常困难
084
Speaker 1
同时还要满足延迟目标。
085
Speaker 1
最后,可观测性确实非常困难。
086
Speaker 1
你如何知道你的智能体
087
Speaker 1
是否产生了高质量的输出?
088
Speaker 1
这些是非确定性模型
089
Speaker 1
并且会产生大量非结构化数据。
090
Speaker 1
因此,云托管智能体应运而生。
091
Speaker 1
我们完成了平台工作,这样你就不用做了。
092
Speaker 1
托管智能体结合了基础设施、智能体基本组件,
093
Speaker 1
以及管理数据的能力。
094
Speaker 1
因此,云托管智能体应运而生。
095
Speaker 1
我们完成了平台工作,这样你就不用做了。
096
Speaker 1
托管智能体结合了基础设施、智能体基本组件,
097
Speaker 1
以及开箱即用的可观测性,
098
Speaker 1
所有这些都可以在云平台上的一个套餐中使用。
099
Speaker 1
在本次演示过程中,我们将详细探讨这些组件
100
Speaker 1
每一个部分。
101
Speaker 1
再加上几个演示。
102
Speaker 2
那么我们来谈谈最基本的基本构建模块
103
Speaker 2
云托管智能体。
104
Speaker 2
在最核心的部分,你有一个你定义的智能体。
105
Speaker 2
这将是系统提示,也就是你想要使用的模型,
106
Speaker 2
任何你想要加载的技能
107
Speaker 2
输入到你的智能体,以及具有权限的工具
108
Speaker 2
对于那些你希望该智能体具备的工具。
109
Speaker 2
这就像智能体的身份。
110
Speaker 2
接下来,你还有配置的环境。
111
Speaker 2
这就像一个模板,你可以在其中定义网络允许列表
112
Speaker 2
以及任何你可能想要预先安装的软件包。
113
Speaker 2
这就像智能体将要生活于其中的世界。
114
Speaker 2
你把那部分、环境和智能体,
115
Speaker 2
然后你用它来运行一个会话。
116
Speaker 2
会为您配置一个沙盒。
117
Speaker 2
我们设置好 harness,然后 Cloud 开始执行。
118
Speaker 2
任何您想要包含的凭证和资源
119
Speaker 2
在那个会话中,都是挂载到它上面的
120
Speaker 2
并且可供云平台使用。
121
Speaker 2
最后,我们有活动。
122
Speaker 2
这些是智能体生成的任何内容
123
Speaker 2
正如它在执行操作或任何你可能想要的事件
124
Speaker 2
为了引导智能体,需要提供上游信息。
125
Speaker 2
这就是你可能想要保持联系的方式。
126
Speaker 2
事件和状态感知正是我们能够发挥优势的地方
127
Speaker 2
提供一个平台,让你可以构建自己的产品
128
Speaker 2
在……之上,你可以使用诸如内存之类的原语
129
Speaker 2
以及其他我们拥有的功能
130
Speaker 2
真正优化这些智能体的性能。
131
Speaker 1
所以正如Michael提到的,活动是核心
132
Speaker 1
而智能体集成的核心所在。
133
Speaker 1
那么,让我们来实际解释一下这意味着什么。
134
Speaker 1
Managed Agents 中的每一件事都是基于事件的。
135
Speaker 1
因此这些是结构清晰的耐用转录文本
136
Speaker 1
帮助您跟踪智能体的进展。
137
Speaker 1
首先,有用户事件。
138
Speaker 1
这些实际上是发送给智能体以指导它的内容。
139
Speaker 1
接下来是智能体事件。
140
Speaker 1
这就是智能体实际在做的事情。
141
Speaker 1
所以这是消息传递。
142
Speaker 1
这是工具执行,上下文压缩,
143
Speaker 1
工程。
144
Speaker 1
甚至将任务委托给其他智能体。
145
Speaker 1
接下来是会话事件。
146
Speaker 1
这是你了解刚刚委托的任务
147
Speaker 1
进展的方式。
148
Speaker 1
所以这是整体生命周期,状态
149
Speaker 1
转换,错误和结果过程。
150
Speaker 1
最后是跨度事件。
151
Speaker 1
这个事件流中有很多内容。
152
Speaker 1
这有助于你将相关事件分组
153
Speaker 1
并以更聚合、更可测量的方式查看这些事件。
154
Speaker 2
那么让我们转向一个现实世界的例子,
155
Speaker 2
我们使用
156
Speaker 2
云托管智能体构建的某物,即Pascal,它
157
Speaker 2
使用一个假设的在线杂货配送服务订单
158
Speaker 2
数据来分析这些数据
159
Speaker 2
并为我们的团队提供见解。
160
Speaker 2
智能体可以在几分钟内生成分析报告,
161
Speaker 2
利用一个预加载的数据集和一组Python软件包
162
Speaker 2
以及我们安装并上传到容器中的脚本
163
Speaker 2
从而让它能够运行。
164
Speaker 2
你可以在Cloud控制台中看到每一个事件,甚至可以聊天
165
Speaker 2
与调试智能体,以进一步优化
166
Speaker 2
你的集成。
167
Speaker 2
那么进入视频本身,这个
168
Speaker 2
就是Pascal的主页。
169
Speaker 2
我们可以启动一个智能体会话,Cloud就会开始运行。
170
Speaker 2
它需要几分钟的时间才能完成。
171
Speaker 2
所以在它运行的同时,我们会转到开发者控制台
172
Speaker 2
并且实际上可以看到Cloud
173
Speaker 2
实时生成的事件,并能够更好地理解
174
Speaker 2
Cloud正在实时执行的操作。
175
Speaker 2
我们还可以查看智能体配置
176
Speaker 2
以及为这次会话设置的环境配置。
177
Speaker 2
所以这个实例,这就是系统提示
178
Speaker 2
以及这就是模型。
179
Speaker 2
然后转到环境配置部分,
180
Speaker 2
你可以看到允许的网络权限
181
Speaker 2
以及这些包。
182
Speaker 2
回到实际的页面本身,
183
Speaker 2
看起来我们的分析基本上已经完成
184
Speaker 2
现在我们可以深入探讨Cloud发现的见解。
185
Speaker 2
从产品角度来看,似乎香蕉真的很
186
Speaker 2
受欢迎,还有其他一些产品
187
Speaker 2
也同样很受欢迎,但每个人都应该获得
188
Speaker 2
他们的香蕉。
189
Speaker 2
从客户洞察来看,我们发现周日下午
190
Speaker 2
在线订单非常受欢迎。
191
Speaker 2
所以你可能想要将订单安排在
192
Speaker 2
一天中的其他时间。
193
Speaker 2
最后,我们设置了一个预测
194
Speaker 2
模拟器,让我们分析客户是否更有可能
195
Speaker 2
再次订购商品。
196
Speaker 2
回到开发者控制台,
197
Speaker 2
我们可以在侧边栏看到
198
Speaker 2
我们可以启动对会话本身的分析,其中
199
Speaker 2
Cloud会查看所有事件
200
Speaker 2
并进一步为我们提供见解
201
Speaker 2
关于如何优化我们构建的集成。
202
Speaker 2
在这一特定情况下,我们看到
203
Speaker 2
我们提供给 Cloud 的一些脚本实际上
204
Speaker 2
真的,真的很慢。
205
Speaker 2
因此,我们可能需要优化我们编写的 Python 代码
206
Speaker 2
为了让他们做得更好。
207
Speaker 2
所以我们刚刚看了几件事。
208
Speaker 2
我们查看了开发者控制台,
209
Speaker 2
你看到了实际效果。
210
Speaker 2
但事实上有很多不同的方法
211
Speaker 2
帮助您今天开始使用云托管智能体
212
Speaker 2
为了与你创建的这些智能体进行交互。
213
Speaker 2
你只需选择最适合你工作流程的那个。
214
Speaker 2
我最喜欢的是云API技能
215
Speaker 2
我们今天在Cloud Code中可用的内容。
216
Speaker 2
你只需要问问Cloud,嘿,
217
Speaker 2
我想开始使用云托管智能体。
218
Speaker 2
并且它将帮助你完成入职流程
219
Speaker 2
集成到您现有的代码库中。
220
Speaker 2
接下来,我们还有ANSI盟友,
221
Speaker 2
这是我们最近发布的。
222
Speaker 2
这使得交互变得非常容易
223
Speaker 2
通过我们的API进行脚本编写和CI,
224
Speaker 2
CDL。
225
Speaker 2
最后,我们还有我们的开发者码头
226
Speaker 2
以及我们的食谱。
227
Speaker 2
这些提供了很多实际的例子
228
Speaker 2
并且提供可以直接复制粘贴的最常见模式示例
229
Speaker 2
这是我们为云托管智能体准备的。
230
Speaker 1
那么我们现在已经介绍了基础知识,
231
Speaker 1
我想谈一谈一些更高级的功能
232
Speaker 1
我们最近已经上线了。
233
Speaker 1
那么首先,多智能体协调。
234
Speaker 1
在这里,Cloud能够委派任务
235
Speaker 1
与其他具有独立上下文窗口的智能体进行交互,
236
Speaker 1
使其能够并行化
237
Speaker 1
日益复杂的工作。
238
Speaker 1
在结果方面,Cloud 会根据预定义的退出标准进行迭代
239
Speaker 1
或者直到它满足其目标为止的评分标准。
240
Speaker 1
你负责这个目标,以及Cloud
241
Speaker 1
负责完成它。
242
Speaker 1
有了记忆功能,Cloud 就能够读写记忆存储。
243
Speaker 1
默认情况下,没有记忆功能,Cloud
244
Speaker 1
每次会议都会从头开始。
245
Speaker 1
但是有了记忆,它就具备了对之前运行情况的意识
246
Speaker 1
并且下次可以做得更好。
247
Speaker 1
梦境是建立在记忆之上的,
248
Speaker 1
在这里,Claude 正在进行反思并将其系统化
249
Speaker 1
关于学习和将其编码为新的记忆。
250
Speaker 1
并且这确保它可以持续启动
251
Speaker 1
具有更精炼、更优化和更精选的记忆集。
252
Speaker 1
所有这些都非常令人兴奋的智能体功能,
253
Speaker 1
我们非常兴奋能够提高上限
254
Speaker 1
关于智能体能够产生什么。
255
Speaker 1
然而,我们也听到需要与您见面
256
Speaker 1
你所在的位置,这意味着要进行
257
Speaker 1
使我们的基础设施更加模块化。
258
Speaker 1
所以使用自托管沙盒,你可以运行智能体循环
259
Speaker 1
并且可以在你的基础设施中直接执行工具
260
Speaker 1
因此文件和软件包永远不会离开你的边界。
261
Speaker 1
通过MCP隧道,Claude可以访问私有的MCP服务器
262
Speaker 1
你不希望暴露在开放互联网上的内容。
263
Speaker 1
所有这些东西的构建目的都是为了让你能够部署
264
Speaker 1
在你们的企业内部,按照你们自身的安全原则。
265
Speaker 2
除了所有这些令人惊叹的功能之外
266
Speaker 2
我们已经拥有的,就像凯特林今天早些时候提到的那样,
267
Speaker 2
我们刚刚发布了两个全新且非常令人兴奋的功能。
268
Speaker 2
一个是计划部署,它允许你设置
269
Speaker 2
我们触发新会话的重复计划
270
Speaker 2
代表您处理您可能有的任何重复性工作。
271
Speaker 2
然后接下来我们在Vaults中还有环境变量,
272
Speaker 2
允许您提供安全的凭证
273
Speaker 2
对于任何您可能希望 Claude 调用的 API 或 CLI
274
Speaker 2
在没有实际承担任何风险的情况下
275
Speaker 2
关于Claude看到实际的秘密词元。
276
Speaker 2
稍微深入探讨一下环境变量是如何工作的
277
Speaker 2
在 Vaults 中,我们放置一个不透明的占位符词元
278
Speaker 2
Claude 可以访问的容器本身内部。
279
Speaker 2
每当 Claude 尝试调用 API 或使用 CLI 时,
280
Speaker 2
它将只是以这种方式使用该环境变量
281
Speaker 2
它将使用任何其他环境变量。
282
Speaker 2
当该网络请求被发出时,
283
Speaker 2
我们将在此请求发出时注入真实的秘密值
284
Speaker 2
这样Claude就永远不会实际看到这些值。
285
Speaker 2
这就是秘密令牌的真正价值。
end of transcript · 285 segments