EPISODE· generated 2026-06-11 09:07:59· 54 min

The CEO Must Be the Chief AI Officer

Y Combinator
Y Combinator· original aired 2026-06-10

佩德罗·弗兰切斯奇,Brex的联合创始人兼CEO,讨论了其公司如何深入整合AI技术,并将AI与公司的运营相提并论,类比早期电力的发展历程和当前AI的环境。佩德罗分享了他的旅程,从疫情期间初次尝试GPT-3到全面拥抱智能体循环,强调好的AI产品本质上是赋能人类智能体而非取代它们。

interviewcryptoaiweb3
ready · seed-vc · qwen3-tts
0:00/0:00

⚠ The Chinese audio is an AI-generated dub (speech synthesis / voice conversion), not a real recording and may contain errors. Based on the original English interview; all rights remain with the original creator.

original lang
EN
dubbed into
中文 (ZH)
pipeline
Plan C · voice conversion
voice model
seed-vc · qwen3-tts
001
Speaker 1
你醒来,无论你生活中有什么问题,为什么不能用AI来解决它,就像从那里开始一样。我认为CEO应该成为首席AI官,而不是工程团队的事情
002
Speaker 1
这不是产品团队的事情,你必须比任何人都更了解这项技术的边界。我认为衡量你如何分配时间的一个好方法是:哪些事情只有你能做
003
Speaker 2
模型是做不到的。你必须重新定义公司自我身份的概念。 欢迎回来,这是⟩2⟧的另一集。今天,我们有幸邀请到⟩3⟧Franchesci,⟩4⟧的联合创始人和⟩0⟧。
004
Speaker 2
⟩3⟧于⟩5⟧ 17 批次启动,并将其打造成了过去十年最重要的金融科技公司之一。
005
Speaker 2
他今天在这里,是因为 B 在⟩1⟧上的投入比我们所知的几乎所有企业公司都要深入。而⟩3⟧自己的⟩1⟧设置如此引人入胜,以至于当他去⟩6⟧吃午饭时,让我们的整个团队
006
Speaker 2
陷入了一场构建他们自己系统的兔子洞。所以⟩3⟧,欢迎来到光锥。
007
Speaker 3
谢谢邀请我,很高兴来到这里。谢谢你们改变了我的生活。
008
Speaker 1
是的。天哪,那次午餐我感觉自己应该由模型公司来赞助我,因为我产生的代币消耗量增加了那么多,你们懂的。
009
Speaker 2
在那次午餐上生成的。那是G Brain的前身。我想我当时还在做GStack。我当时还是2013年Web 2.0的工程师,瞬间穿越到了2026年1月的AI工具。
010
Speaker 2
我当时大概写了五十万行Rails代码,因此创建了一个GStack,用来帮助我建立一个软件工厂。是的。然后在遇见你之后, 我意识到一切都是关于释放智能体的。
011
Speaker 2
释放智能体。我知道你会这么说。是的,然后 给它代币。好吧,我的意思是, 放手去做。
012
Speaker 2
最疯狂的事情是意识到我之前犯了哪些错误,我认为实际上大多数软件行业的人都还在犯同样的错误 是 他们一直把 LLM 当作就像这个非常珍贵的东西,非常昂贵。是的。
013
Speaker 2
因此,你必须 literally 把智能体放进一个 Foxcon 工厂里。
014
Speaker 2
而且你想想看,我意思是,这也就是为什么我写了半百万行的Rails代码。就像是,"不,不,不。我需要控制 LLM 看到的内容,因为这关乎于"
015
Speaker 2
真的非常喜欢,我只想获取这里的上下文,然后让我写出所有的if语句来确保,比如,你知道的,像一个Foxcon工程师,你会在早上6点起床,然后
016
Speaker 2
知道,如果你不这么做,你就会被电击。我是说,这就像你对智能体做的一件可怕的事情。而他们希望像在 Eselin 研究所那样,这就是 OpenClaw 的作用。
017
Speaker 1
完全正确。确切地说。有趣的是,我觉得你用过的每一个好用的 AI 产品,其实都是一个智能体循环,配合工具使用。
018
Speaker 1
就是这样。比如说你不会试图过度设计缰绳,然后去做一些事情,但归根结底就是技能、工具和一个模型,其实也没有太多其他东西。
019
Speaker 2
也许我们可以更早开始,因为我们想把一些东西作为传说的一部分记录下来,比如你是如何从 AI 粒药片一直走到极限的?嗯,我会告诉你们
020
Speaker 1
你我遇到 LMS 的经历,真的让我印象深刻。我记得在疫情期间,有人给了我一个 API 的 GPT3 访问权限,我当时玩了一下,然后我就想,嗯,这东西还挺酷的
021
Speaker 1
这真的很酷。这里有一些东西可能特别,但它是一种感觉像是研究项目的东西,就是那种类型的东西
022
Speaker 1
那 Google 以前发布过,你玩了十分钟就停了。呃,Chat 出来的时候,我想每个人都对它挺感兴趣的。我觉得真正有趣的是,呃,当你
023
Speaker 1
开始看到推理模型和当然工具但但我觉得其他一切只是短暂的波动直到十二月而我向我的团队描述的方式是比如你知道电力就是
024
Speaker 1
在12月发明的,我认为当时电力才刚刚开放到4.5版本,而且确实开放模型,从那以后开放模型越来越好,但对我来说,那只是刚刚开始
025
Speaker 1
那个你可以这样说,就像编码的背带实际上确实有效,你知道,云代码可能在那之前就已经存在了一年左右,但那时候还没有那么有价值,我记得
026
Speaker 1
在假期期间我一直在玩这个,真的非常令人震惊,可能和在座各位的反应差不多,我认为问题在于,如果你稍微想想
027
Speaker 1
的话,你就像站在200年的历史面前,然后你想象我们现在是5月,也就是电发明后五到六个月,大多数人还在用蜡烛,你还在质疑蜡烛和火能做什么,比如 谁需要这么亮的光 这些灯笼又有什么用
028
Speaker 1
呢,你能用它们做什么,而且蒸汽机可能还要再等20年,但电已经存在了,对我来说这就是背后的根本光源,我想从那时起,开放云算是一个有趣的下一步,我认为当我们意识到 AI
029
Speaker 1
产品实际上是带有工具的智能体循环。呃,我们在自己的产品中开始尝试这个,但与此同时,我个人开始花很多时间去理解,使用 OpenClaw 的前沿究竟在哪里,我认为这个洞察就是
030
Speaker 1
嗯,就像markdown一样,它可以带你走得很远,就像配置和自动化你生活中很多事情一样。这有点好笑,我记得我有过这样的经历
031
Speaker 1
体验是像完全用 OpenClaw 买电影票,用像 Brex 卡。它是通过一个 API 提供的,然后我把它展示给我团队,他们说:"哦,但是你可以在线上10秒内预订。" 我说:"这不是重点。你完全没理解重点。" 嗯,不管怎样,然后我显然深入这个领域,
032
Speaker 1
花了大量时间思考如何改变公司的结构和我们构建产品的模式 告诉 US 更多关于你的个人OpenClaw 旅程,因为你在午餐前把它放在商店里了,但我太害怕去使用它了。我们都害怕。
033
Speaker 3
是的,不要误会,我们处理金融服务数据。我们花了很多时间思考如何在安全和保护方面保持谨慎。但我觉得
034
Speaker 1
人们比技术本身要求他们做的要更保守一些。当我们开始在个人层面使用 open cloud 时,
035
Speaker 1
我开始在我的个人设置中大量使用它。在 v1 中,我做了的是,我会给它所有内容的只读权限,然后创建像 ow 令牌发送到我的邮箱到 Slack 和
036
Speaker 1
到所有内容,只是不写入。我有点震惊它带我走了多远。然后我们花时间在 Brex 上思考的问题是,我们如何实际上让它
037
Speaker 1
进入我们的系统,而谷歌安全团队的每个人都说,我们不能这么做,出于我们已知的所有原因,然后基本上我花了大概四周的时间思考,
038
Speaker 1
在我们的系统中进行写入,而 Google 安全团队的每个人都表示,出于我们众所周知的各种原因,我们无法这样做,而我花的时间大概有四周
039
Speaker 1
是,我们花了时间解决最困难的问题,也就是安全性。我们最终意识到,唯一真正能采取行动的方式,就是在网络层采取行动。
040
Speaker 1
如果你把智能体当作一个有自己意志和欲望的实体,他们去 ALM 研究所,而不是 Foxcon 的工厂而不是 Foxcon 的工厂,他们会尝试在网络边界执行一些可能并不正确的操作。
041
Speaker 1
嗯,我们决定专注于这一点。当时很多人,我们看到 NVIDIA 和 Nemo 上的 HTTP claw,让我们构建这些类似 open shell pro 的分叉版本,对模型调用的工具进行控制
042
Speaker 1
你知道,你可以做到这些,但你也可以直接发出一个 HTTP 请求错误。所以我们专注于这一层,然后我们构建了一个叫做 crab
043
Speaker 1
trap 的东西,我们在大约两个月前开源了它,实际上这是我们用于在 Brax 的生产环境中保护智能体的方式。基本前提是,你分析并 HTTP
044
Speaker 1
代理整个智能体的网络边界。这个想法是,当请求通过时,它会变得可审计,你基本上可以用另一个智能体来分析流量并
045
Speaker 1
创建一个策略来决定流量是否可以通过。令人惊讶或不令人惊讶的是,由于这些模型是在数以百亿计的网络文档上训练的 HTTP 流量是
046
Speaker 1
实际上,我认为模型的推理方式比其他任何东西都更重要,因为它们只是在网页上学习。
047
Speaker 1
所以,模型能够观察到上千个请求并理解发生了什么,其能力远超我们的预期。因此,我们实际上已经将该功能部署到了 Rex 的生产环境中
048
Speaker 1
在你记录一个智能体一天的流量后,你可以制定一个相当不错的策略,该策略可以自动批准某些操作,而对于智能体不确定的请求
049
Speaker 1
你可以使用一个 LLM 作为判断者,而 LM 会根据该智能体应执行的任务策略来判断该请求是否应被批准。
050
Speaker 1
例如,我们在 BRS 有一个名为 Jim 的招聘智能体。我们为 Jim 设定了一个策略。所有流量都发送到相同的策略,98% 的请求会自动通过
051
Speaker 1
而 2% 的请求会使用 LM,因此我们在一定程度上解决了这个问题,使我们能够更加大胆地进行实验,从而在企业内部释放了大量时间
052
Speaker 1
这在 Capital One 内部是非常困难的。因此,我认为如果我们找到了一种方法来尝试这些技术,虽然我们目前还没有对这些技术进行最激进的尝试,我们还没有使用
053
Speaker 1
它像你知道的那样,我们不会用客户数据到我们将来想用的程度,而且我们在使用时也有一些限制。 我不认为有任何理由,一个 YC 公司不应该处于这个前沿
054
Speaker 3
这些事情的边缘。是的,我的意思是,我觉得你对网络层面代理的直觉最终证明是相当有预见性的。
055
Speaker 3
比如我认为目前至少在OpenClaw生态系统或者更广泛的智能体生态系统中,我看到的很多东西本质上就是在做这件事,我们正在看到类似的情况
056
Speaker 3
凭证凭证代理,比如智能体保险库,正在做很多这方面的工作。我认为你提到的第一版crap trap包含了类似凭证 保险库的功能。为什么你们决定不包含
057
Speaker 1
那?我认为只是让我们把一件事做得非常好。嗯,说到底,我认为会有许多解决方案能做到这一点。你可以做凭证
058
Speaker 1
进行中介和其他工具的使用,但 LM 作为法官是用于 US 的判断能力,以确定是否信任 US 在生产环境中?我们 BR 的安全团队非常严谨和
059
Speaker 1
在很长一段时间里,他们都非常擅长自己所做的事,但你知道,其实并不是真的。呃,要让他们同意,我们认为这已经足够了,这对我们来说是一个重大突破,对 US 来说也是如此。而且,我总是这么说
060
Speaker 1
这就像我们不是在做 HT 代理的业务。我们的业务是成为 AI 能力的最前沿。而要达到最前沿,需要 US 来构建这个代理。这就是我们这么做的原因。
061
Speaker 1
希望有人会建立一个 YC 公司。希望我们能建立一个更好的版本,然后直接使用它。但归根结底,这是一段 US 所经历的旅程
062
Speaker 3
以这种方式处于最前沿。你推动这个前进有多少?内部有多少阻力?你是怎么做的?
063
Speaker 1
我的意思是 AI 的构建,我认为当时有很多兴奋感,但我想描述 AI 在大多数公司内部的采用情况,我认为大致分为三个层级,第一层级
064
Speaker 1
是你的 token maxer,也就是那些推动大量代码的工程师,通常生活在编码工具中,这些人我们比较清楚,知道是谁。然后
065
Speaker 1
你有那种普通的工程师,他们构建了一些东西,但并不是像 token maxer 那样,可能生产力只有他们的十分之一。然后你还有
066
Speaker 1
整个公司的其余部分,整个公司其余部分通常以我所说的 Google 搜索模式与 AI 交互,也就是一个带有几个 MCPS 的聊天机器人,或者一个 G Suite
067
Speaker 1
相当于是的,你有一些来自Google的工具,但归根结底它只是一个搜索功能,我认为我们的假设是,如果你考虑一下AI所创造的价值的话
068
Speaker 1
比如对于一个token maxer来说,很多价值来自于harness,而我们的论点是如何为其他非技术团队构建一个等效的harness,而我们整个团队的思路是
069
Speaker 1
背后的想法是,这很大程度上是 OpenClaw 你所创建的东西,即通过你编辑的方式,可以自我引导智能体的许多能力。
070
Speaker 1
技能和markdown格式以及设置智能体周围的环境。呃,我们能让智能体在没有人干预的情况下自我引导出能力,能走多远
071
Speaker 1
实际上需要手动编写代码。我们内部用来类比公司范围内采用 AI 的说法是,我们认为不应该只是给人们提供几个 MCPS 就让他们去干
072
Speaker 1
因为我认为人们真正想要的是,以我的看法,其实是一种方式,可以说出‘好吧,这其实是一个虚拟员工,它几乎就在 Slack 上,它有电子邮件,我实际上可以’
073
Speaker 1
邀请它参加会议,可以加入会议并做笔记,你试图尽可能多地复制这种功能,那么你如何构建基础设施来支持这种用例,而我
074
Speaker 1
认为 harness 会有所不同,可能更像 OpenClaw 而不是一个编码模型。
075
Speaker 2
Jared 和我这周第一次做了这件事,我们安装了 Aqua 语音,然后你用 Telegram 的 claw 打开,或者实际上我们现在已经在 Slack 中有了 然后基本上就是我
076
Speaker 2
和 Jared 以及三个工程师 还有我们活动团队的某个人,我们正在尝试如何组织 60 桌晚宴,每桌有 20 位参与者,来自初创企业
077
Speaker 2
学校 以及来自 YC 的 21 位合作伙伴和访客合作伙伴。听起来像是一个很棒的问题。然后我们只是开始谈论这件事,然后我把它选中并按了回车,然后我们的 claw 就开始执行了。
078
Speaker 2
没有 US 打开云代码,它只是自然而然地生成了一堆 markdown。
079
Speaker 1
它做了分析, 是的,人们常常忘记云代码并不是魔法。它只是围绕我们可以在 API 中使用的相同模型的一个框架,对吧?
080
Speaker 1
所以,我认为这就是关键,顺便说一下,我认为云代码正在做的一些事情真的很酷。哦,它们真的很棒。然而,它只是一个框架。呃, 并且 claw 可以使用云代码。
081
Speaker 2
没错。而且是CodeEx,对吧?现在它真的很喜欢使用CodeEx。没错。实际上它真的能做所有的事情。我不知道为什么,你知道的。没错。但 ACP 在这方面有帮助。所以,是的。
082
Speaker 4
对。 ACP 很不错。你认为为什么代币满仓的采用率还没有真正起来?
083
Speaker 4
我们在早期与许多初创公司合作时,发现一个非常有趣的现象,就是很多创始人对销毁代币这件事非常谨慎。我认为当你真正深入参与时,你真的会体会到这一点。
084
Speaker 1
彻底地。Gary提到这一点,即代币价格昂贵,我认为我知道自己很幸运,可以花这笔钱购买代币。但我想说的是,我一直在尝试
085
Speaker 1
想象自己。想象如果我在12或14岁就开始真正编程,而我现在拥有这样的技术,我一定会以最便宜的方式进行代币满仓。而且确实有人在这么做。你知道,比如看看中国的模型,它们表现得相当不错。
086
Speaker 2
有一个非常庞大的业余爱好者社区,他们比如会搭建一台游戏电脑, 但之后他们尝试搭建本地的 LLM,这其实是一种完全合理的方式。
087
Speaker 1
100% 100%。我有一个朋友,他的设置和这完全一样。他家里有一个小的 GPU 农场,第一次我去他家的时候,我说:"Wow,这里的暖气开着,这里
088
Speaker 1
真的很热,他说:不不不,这是我的显卡 我说:哦,太棒了,你知道,从头到尾的能效都很高。有趣的是,在 Brax,我们应该谈谈代币的
089
Speaker 1
成本和支出管理,这目前是我们投入大量精力研究的话题。我认为成本是一个方面,但即使不考虑成本,你就会发现
090
Speaker 1
第一个症状是,应该有更多人抱怨最大计划的限制,你知道,我看到有多少 Twitter 会抱怨这个问题,大概只有0.1%。嗯。
091
Speaker 1
所以,我认为人们可能还处于早期阶段。在我看来,有一种类似 AI 的药丸测试,即无论生活中出现什么问题,你是否会首先默认使用 AI?
092
Speaker 1
当然,从机械上讲你可以做到,但到了某个阶段,它会变得像本能一样,你的整个大脑会被重新编程,你再也无法用其他方式思考,然后还有关于 AI 依赖性、人机交互的整个话题。
093
Speaker 1
是的,还有许多我们可以讨论并放在角落里的事情。但令我惊讶的是,你去和很多人谈论一个问题时,我会说,现在理解这个问题的边界是如此便宜。
094
Speaker 1
为什么你还没这么做,带着对问题更加深入的理解来呢?我认为第二点是,我认为如果你有幸现在创办一家公司,
095
Speaker 1
公司从第一天起就可以以一种完全不同的方式构建。如果我现在要创办一家公司,我会说,好的,前提是我为什么不能只是我自己,然后你从那里开始,
096
Speaker 1
你的 token 消耗量可能比你说我会雇佣三个人或五个人或七个人要高得多,而且我认为,我认为根本的限制并不像我看来那样,比如 AI 作为一种成本节约或我将变得更高效。
097
Speaker 1
三个人或五个人或七个人,而且我认为,从我的观点来看,这种基本限制并不像一个 AI 那样作为节省成本或我更高效
098
Speaker 1
的手段。我认为解锁的关键在于,当边界变成类型系统、接口、智能体之间相互交流,而不是人与人之间时,公司的结构看起来会非常不同。
099
Speaker 1
而且,我认为人们还没有完全理解,比如,用新的智能体和新技术来编写代码意味着什么。我认为这一点已经被很好地理解了。但
100
Speaker 1
如何生活在一个智能可以随时获取的世界里,你的默认回答是:让我先用 AI 来解决这个问题,即使你觉得这可能不是最优的,然后从那里开始说:我该如何真正让它
101
Speaker 1
变得最优?因为我认为,对于大多数问题来说,用 AI 解决问题的方式可能更好,而你的任务就是找出这个方式,即使这会花你更多时间,因为这
102
Speaker 5
会带来复利效应。YC Startup School 正在回归。我们正在精选世界上最优秀的构建者,并邀请他们于 7 月 25 日和 26 日飞往 San Francisco,讨论科技和初创公司的前沿话题。申请
103
Speaker 3
现在抢占你的席位。当你开始 Brex 的时候,我是说,众所周知,比如你的 MVP,那时候还没有网页 UI,对吧?它只是终端,非常简陋。今天不会需要 HTML,因为没有人需要测试了。
104
Speaker 3
现在再也不需要测试了。比如说,当时真的只是做一个非常简单的 MVP,然后测试它是否能正常工作,还是说你会做一个功能更完善的版本?
105
Speaker 1
所以,我有一个可能你们都会不同意的有争议的观点,就是我认为如果我观察那些成功公司的模式,会发现一个非常有趣的现象。这个现象就是最小的接触面。
106
Speaker 1
问题是,我认为在 AI 中,你会看到像 Stripe 这样的例子。
107
Speaker 1
比如 Stribe 最初阶段只是一个 API。Braxton 最初阶段没有任何 UI,只是一个终端。你看看 Airbnb,它的网站只是一个表单,这个表单就是你输入你需要的东西,然后有人设法去完成预订。
108
Speaker 1
比如 Door Dash 在早期阶段也类似,对吧?它只是一个非常简单的界面。所以,与客户接触的面积非常小,而创始人大量的精力和智慧都花在解决这个单一的交互上。
109
Speaker 1
模式,我认为使用 AI 的风险在于,背后的选择代理会消失,因此你会缺乏对需要解决的问题的自律。我认为人们往往相信
110
Speaker 1
我可以尝试很多事情,这绝对是真的,但这并不妨碍你选择真正重要的事情。我总是告诉人们,我认为如果你
111
Speaker 1
无法缩小你的接触面,并通过非常明确的边界解决问题,那么你还没有找到真正要解决的问题。我认为你可以通过 AI
112
Speaker 1
将问题压缩到更小的接触面中,这非常有价值。但我不认为这可以成为你不这么做的一种借口,我认为我可以
113
Speaker 1
只是构建很多其他东西。但你知道,我总是这样告诉人们,智能是压缩。所以当有人来向我推销一个想法时,我会说它必须能放进一张餐巾纸上。伟大的想法能放进一张餐巾纸上。你的餐巾纸是什么?
114
Speaker 1
然后有人拿着这个来,我会说我不知道你在哪里买餐巾纸,但我家的餐巾纸不是这个尺寸。那之前一步呢?
115
Speaker 3
甚至我实际上在给创业者提供转型建议时,很多都来自于你谈论你如何找到 Brex 的想法,我记得大概的观点是你
116
Speaker 3
将其视为两周为一个周期,你处于探索模式或利用模式,你尝试很多事情,但之后你想要聚焦、深入挖掘
117
Speaker 1
你现在还会使用这种模式吗?100%。我认为创业公司最难的事情之一就是与客户交谈,不仅仅是进行对话,而是如何从这些对话中提取那些未明说的信号
118
Speaker 1
对我来说,就像 AI 能解决这个问题的视角一样,无论生活中出现什么问题, AI 都能解决,而你思考如何建立一家成功的公司
119
Speaker 1
比如,为什么你不能通过提示来实现这一点?原因很简单,因为模型没有接受过这些信号的训练,而信号是当你去和他们交谈时,他们会告诉你
120
Speaker 1
他们遇到的问题,他们不会告诉你一个可以直接放入 LM 的提示,然后 LM 会输出那个能赢得市场的、价值十亿美元的产品
121
Speaker 1
他们会根据他们的世界观、他们的限制条件以及他们看待事物的方式,给出一个局部最优解的答案。
122
Speaker 1
我认为现在的工作就是拥有选择你想要什么的智慧,因为在以前,智慧不仅仅是选择,而是选择并知道如何执行它。
123
Speaker 1
执行已经不再了,执行已经消失了,而模型会做得更好。选择的智慧仍然存在,我认为这仍然是缺失的瓶颈,而我认为这都来自于哪些信号
124
Speaker 3
没有被模型所包含。比如说在 AI 之前,你有个人的带宽可以同时探索三个想法。你是在说现在在 AI 的世界里,你仍然会同时做三个。
125
Speaker 1
你会做30个,然后让模型去尝试和 我可能采取的方式是,让我们先选择一个更广泛的事物范围,进行初步探索,但对我来说,
126
Speaker 1
视角是,为什么 AI 不能解决它,以及哪些信号没有被模型所包含。我认为信号通常是客户,然后当你去和客户交谈时,我认为我
127
Speaker 1
不会因此瘫痪,我大概会说,让我们试着进入这个人的思维空间,我认为这非常容易,而且我们之前做过很多探索,比如
128
Speaker 1
使用合成客户和构建客户角色模型之类的事情,这些在你对客户了解很多之后非常有价值,但当你还不了解客户时,
129
Speaker 1
我认为有一个非常基础的问题,比如在 Brex 的例子中,对于 US 来说,最难的事情之一是,我们最初是卖给创始人的,我们自己也是创始人,我们了解
130
Speaker 1
我们自己了解我们的问题,而当公司变大后,我们开始向财务团队销售,而财务团队是不同的,因此建立这种心理模型,比如价值系统
131
Speaker 1
当然是可以最终让模型代表这一点,并拥有这种世界观。但我觉得还有一个无形的因素,我认为很多超额收益仍然来自于这里
132
Speaker 1
对我来说,我认为一个很好的时间分配代理指标是:什么事情只有你能做?即使在一个人的公司里,什么事情只有你能做而模型做不到?对我来说,这就是其中之一
133
Speaker 4
我认为这一点非常到位。我认为很多成功完成转型的创始人,都有这样一个循环。基本上,有一本心理学方面的书讲的是那些与他人有很好情感联系的人,能够模拟他人在想什么,以及他人的思维
134
Speaker 4
正是如此我认为那些能够理解这一点并具备共情能力,从而发现客户没有表达出来的需求的创始人,正是 Gary 所说的,将隐性需求显性化的人
135
Speaker 4
100%。所有这些欲望都是什么 100% 它们很多时候都是非常细微的迹象,因为它们只是低语 创始人需要经历这些并找出洞察力,比如哦,这真的
136
Speaker 4
是回事,但你怎么知道什么时候去挖掘它,而目前的问题是 依赖模型,这仍然是一个很大的挑战,但我仍然对创始人还有很多工作感到乐观
137
Speaker 4
毫无疑问 是你甚至不知道向模型提出正确的咒语或一组提示,因为它们你甚至不知道该问什么 正确 这里还有另一个 Meta 层
138
Speaker 1
是的,这正是 Elon 的问题,你知道,哪个问题是整个宇宙的答案,当然这些都是泛泛而谈,但我认为
139
Speaker 1
我看到的是,你必须记住 LM 并不是魔法,比如 LM 是在非常特定的信息集上训练的,优化的是非常特定的一组基准和结果
140
Speaker 1
我认为 LMS 最大的陷阱是,你没有意识到模型在你问它的问题上看到了多少训练数据。想象一下,每次你
141
Speaker 1
向 LM 提问时,它给你一个答案,比如是的,像我在数据集中看到的这个采样频率是我不知道的X,而另一个答案是0.00001x 00001x。
142
Speaker 1
你对这两个答案的信任程度会非常不同,对吧?分布差异太大了。
143
Speaker 2
噢,我会为此付费。这是一个很棒的创业点子。没错。有人应该这么做。我们需要做一个能实现这一点的模型。
144
Speaker 1
是的,100%。我会为此付费。
145
Speaker 2
因为这很有趣,因为任何超出分布范围的东西,你都可以去填补,用于实际应用。我是说,实际上,作为LLM之上的应用工程师,这其实是一个巨大的盲区。
146
Speaker 2
LLMs,这其实是一个巨大的盲区。
147
Speaker 1
这正是 Merkore 和许多其他数据公司正在做的事情。他们很多工作就是去说,好吧,LLM的盲区在哪里,这很有趣,我认为现在很多数据标注公司正在努力理解模型中的缺陷,但问题是,为了做到这一点,你必须是专家,才能知道答案中的空白在哪里,但
148
Speaker 1
作为创始人,当你在寻找一个想法时,你对它一无所知,所以这就存在一种知识诅咒,以及甚至不知道知识边界的诅咒,这可能会让你误以为自己理解了某些东西,而实际上你并没有,为了建模真正理解它,你必须了解这些。
149
Speaker 1
当创始人在寻找一个想法时,问题在于你对这个领域一无所知,因此存在一种知识诅咒,以及更糟糕的是,甚至不知道知识的边界
150
Speaker 1
这种诅咒可能会让你误以为自己理解了某些东西,而实际上你并没有真正理解到足以建模的程度
151
Speaker 2
我可以坦白一个奇怪的事情,就是在我创建了 Gbrain 之后,我现在以一种不同的方式使用 AI,因为我现在有一个真正可用的检索系统
152
Speaker 2
如果我遇到问题或对任何事情有疑问,都可以用它。比如,我之前在尝试处理一个非常非常人性化提示的示例 而且你知道,这些内容可能还没有被纳入分布中
153
Speaker 2
我查阅了维基百科的相关文章,比如花一整天时间进行深度研究,阅读每一篇论文和文章,然后将它们放入我的 git 仓库中,这样我就能检索并总结出
154
Speaker 2
一些真正可用的内容。因此,这有点像是填补分布外的内容 我可以将这些内容打包,并加入任何上下文,它
155
Speaker 2
你可以用这种方法处理任何事情,比如,如果你有兴趣经营一家餐厅,你可以真的去读500本关于如何经营餐厅的书然后你就会拥有所有关于如何经营餐厅的信息汇编
156
Speaker 1
是的。我认为我们现在在 Brax 做的一些事情之一就是构建客户世界模型,这个想法是类似的,我们试图获取每一个
157
Speaker 1
客户与US的接触点,比如客户在仪表板上点击按钮的次数,一直到他们在电子邮件中告诉某人或在上面说什么
158
Speaker 1
电话或者他们发送呼叫并将其摄入并整合。好的,这位客户接下来需要从 US 获得什么?这位客户应该考虑什么?比如他们将面临但尚未面临的问题,再次说,这只是一个分布问题。
159
Speaker 2
这实际上是针对其中一个问题的回答,问题是像会不会有工作之类的。只要对 RAM 有局限性
160
Speaker 2
所以我不知道,我是说,这其实是一个挺有趣的点,就是说,你真的不可能有一个参数足够多的模型,能够包含你所能想到的一切
161
Speaker 1
可能在分布中需要的东西,比如宇宙中根本没有足够的原子,这更像是一个建模问题,我 我认为我们忘记了模型所训练的世界模型,就像模型本身
162
Speaker 1
是某种设计师会影响模型最终行为的东西,所以我们花了很多时间思考的问题之一就是如何让
163
Speaker 1
LMS work for people that look very different from US。呃,如何让元素适用于像 US 中的普通金融人员?如果你在谈论一个答案,你知道
164
Speaker 1
模型默认会将 AI 资本支出作为财务的默认分类类别。比如,这是一个非常有趣的例子。我之前用 AI 进行会计分类时,
165
Speaker 1
第一个例子就像写一个专业人员的例子,比如 AI 资本支出。我心想,为什么第一个例子是 AI 资本支出?
166
Speaker 1
因为构建这些模型的人只考虑 AI 资本支出,对吧?我认为像这样的事情,值得我们思考,模型的思维模式在出厂设置时,可能比我们给予它们的偏见要更严重。
167
Speaker 2
我的意思是,说到 AI 资本支出,你之前说过,我们还非常早期。对我来说,最有趣的是 AI 的地方在于,我经常发现自己在想,嗯,加密货币最大化的概念。是的。
168
Speaker 2
这就是模型最糟糕的时候。是的。我现在最喜欢的是告诉那些讨厌 AI 编码的人,你们就享受以 1 倍速度编码吧。
169
Speaker 1
没错。没错。我跟一个朋友说过,你知道怎么才能做到长推理吗?基本上这个论点是,推理的需求会比人们想象的多得多。
170
Speaker 1
人们如果只是看看公开市场和你知道的半条供应链,就会预计有 10,000 倍的推理需求。
171
Speaker 1
是的。但有趣的是,承销方面,有一张图片,上面有 2500 个点,每个点代表地球上的 320 万人,基本上你知道的,84% 的世界人口
172
Speaker 1
从未使用过 AI,16% 的人至少使用过一次免费聊天机器人,然后 0.3%,也就是大概六七个方格,每个月支付 20 美元使用 AI,而 2500 个方格中只有一个方格实际上在以某种方式使用智能体。
173
Speaker 1
所以这就是为什么要做长推理的论点。嗯,我觉得这刚开始,我觉得有趣的是,你知道,这将成为公司最大的开支之一,很容易对吧?而且现在代币确实有很多利润空间,但人们总是想站在最前沿,但即使
174
Speaker 1
当词元成本下降到原来的十分之一时,使用量将增加十倍,因此这仍然会是一项较大的成本。嗯,我们花了很多时间思考如何帮助公司真正管理词元
175
Speaker 1
花费。在 Brex,我们最终构建了我们内部的版本。我们称之为 Magpie,这个想法是你可以有效地,你知道,公司每花一美元在代币上,你就可以
176
Speaker 1
将归因于我们的一款产品,我们需要向客户说明,这是我们内部使用的一款工具,用于服务 或了解内部员工 的模型使用情况等,我们现在正在想办法构建分析功能
177
Speaker 1
我们尝试用这些代币做什么呢,嗯,先大致了解一下 ROI。呃,不管怎样,这是一个非常有趣的话题,我认为目前还处于早期阶段,与未来相比还有很大发展空间
178
Speaker 6
有一天。你能分享一下你从 Brexit 获得的任何数据吗,比如经济中 token 消费的情况, 它正在增加。
179
Speaker 1
不,你看,我觉得有两件事很令人惊讶。一个是,我认为正如你之前提到的,关于如何看待token maxing,我觉得确实存在成本边界的问题
180
Speaker 1
你在内部创建时显然会规定词元的使用量,但对我来说,最令人着迷的是当你观察我们现在所处的大概十英里半径范围内,也许你还会包括
181
Speaker 1
纽约 有大量的代币消耗,而且你可以争论,我们在数据中也看到收入增长更快。我认为真正有趣的是这两者之间的差距
182
Speaker 1
在10英里半径范围内的人和其余所有人之间的差距。这并不是说小公司,你看看那些预算非常大的大公司,他们可能会进行代币
183
Speaker 1
最大化,对他们来说,经济上最合理的事情就是进行代币最大化,他们每月可能只花1万美元,你却会说他们应该花10倍或20
184
Speaker 1
倍甚至100倍。这仍然令人惊讶,我认为原因和之前提到的类似,两年前我们做过一次类似的练习,
185
Speaker 1
我和公司里很多工程和产品负责人坐下来,我们提出了一个问题:如果我们在2024年重新开始 Brex,
186
Speaker 1
答案现在会更加不同。我们讨论了如果重新开始,我们会做哪些不同的事情,结果发现几乎一切都会不同,
187
Speaker 1
当我们沿着这个方向思考时,感觉有点令人沮丧,因为他们说:好吧,我们目前的思维方式完全过时了,
188
Speaker 1
我们构建产品和内部流程的方式,最好的答案是:我们希望现在就开始,第二好的答案是:让我们做点什么来改变现状。
189
Speaker 1
暂停一下并说,好,这里存在一种不连续性,不仅仅体现在我们解决问题的方式上,甚至问题本身的定义都发生了变化,因此我们需要退后一步
190
Speaker 1
重新思考这个问题。你知道,有很多这样的例子,但其中一个比较有趣的是,我们正在重新设计我们的 KYC 流程
191
Speaker 1
比如,每当我们要为客户开通服务时,我们必须进行一系列检查以 KYC 该客户,而 KYC 在历史上有大约 80% 的内容是可以自动化的,剩下的 20% 是手动操作的,当然
192
Speaker 1
最初推动这一切的动力是,让我们构建一个智能体来完成这些任务。是的,我们可以这么做,但我们的决定是,实际上让我们重新设计整个流程,从头到尾,然后我们
193
Speaker 1
重新设计的是整个整个客户开通流程。当你重新设计整个客户开通流程时,你会发现一个非常重要的事情发生在流程的最开始,那就是交易
194
Speaker 1
资格审查。比如,这个客户是否甚至有资格成为 Brex 客户?但当你有 KYC 免费提供时,你可以区分一个潜在客户和一个真正的客户。因此,
195
Speaker 1
你的流程中开始出现风险导向,这改变了你甚至瞄准的目标人群,因为你知道谁会通过资格审查。在某种程度上,信用评估也是如此。因此,问题的边界
196
Speaker 1
已经发生了变化,你可以进入并说,我认为包括我们很多竞争对手在内的人都曾采用过这样的方法,即‘哦,我有这样一个完整的旧流程,让我去把它附加到 AI 上面’
197
Speaker 1
它或连接到 AI 并放在我们的产品之上,我认为当我们说嘿,让我们保留这种旧方式,把它放在角落里,然后问如果我们今天从零开始创办公司,我们会如何设计它
198
Speaker 1
这样做需要一些创始人的精力,但我认为这是我们迄今为止看到的唯一真正起作用的方法。
199
Speaker 4
我觉得这让我想起很久以前的一件事。我不确定你是否曾经尝试编译 Arc 的 Linux 分布。嗯。在权力中使用 Arc Linux 与 Ubuntu 的文化是非常不同的。
200
Speaker 4
嗯,确实非常不同。我认为 Ubuntu 的人更像那些尝试使用 Chat GPT 的人。一些东西可以开箱即用。
201
Speaker 4
有一些东西你可以很快上手。不过说实话,使用 Linux 的人还很少,我觉得这和 AI 的情况类似。但使用 Arc 的话,你得非常硬核。
202
Speaker 4
我觉得 OpenClaw 和 Hermes 就是这种感觉,因为你必须根据自己的使用场景进行大量定制,保持自己的技能, 有所有Markdown格式,如果你能把它弄好,你就能构建出
203
Speaker 4
一些非常酷的东西。我见过人们用 Arc 做出的最令人印象深刻的事情之一,其实是我不确定你是否知道 Valve,那个运行蒸汽机的操作系统,让它感觉像
204
Speaker 4
一个 Nintendo Switch 其实是建立在 Arc 之上的。哦,真有趣。
205
Speaker 4
他们对所有驱动程序进行了定制,支持空中更新。它能与所有主机配合使用,能与各种硬件开箱即用,但他们进行了超级深度的定制。我认为
206
Speaker 4
这就是正在发生的事情。如果你能让 OpenClaw 非常好地为你工作,你就可以为任何你需要做的事情构建自己的定制 Nintendo Switch。
207
Speaker 1
是的。我总是跟人们说一件事,听起来有点好笑,就是想想两年前的你。就像我觉得你现在工作得比两年前多了很多,对吧?这里每个人可能都是这样。那么问题来了,生产力在哪里?
208
Speaker 1
对吧?而且这周我跟这位 CF 非常大的上市公司的人聊过,她说我们看到所有的 token 使用情况,我们试图衡量
209
Speaker 1
比如产品速度,我们看到推送的代码行数变多了。所以,是的,也许这就是衡量 ROI 的方式,但问题是,它真的存在吗,因为人们在
210
Speaker 1
token 上花了很多钱,我认为,我认为这个分析没错,当然,我认为对 ROI 上的 token 有所了解很重要,但我认为它忽略了这样一个事实,你正站在
211
Speaker 1
历史的时间线上,而这是在电力发明之后的六个月。比如,想象一下在 1800 年代有人会说,天哪,我的电费现在这么
212
Speaker 1
高,让我们少用一点吧,让我们推迟一下蒸汽机的出现,可能要再等二十年,因为节省成本,当然,不要让公司因为
213
Speaker 6
token 而破产 这其实是一个完美的类比,我不知道你是否知道这个,当电力刚被发明时,它并不好用,而且 ROI 实际上
214
Speaker 6
很差,所以如果在电力发明后不久,一些会计师做过这样的分析,他们会说,‘哦,这个电力的东西好像永远不会成为一回事,这个 ROI 太糟糕了。’
215
Speaker 1
为什么人们一直坚持使用它?" 并且并不是因为成本节约。而是因为人们对此感到好奇。我认为,就像我昨天一直玩到凌晨两点,
216
Speaker 1
使用 SLworkflows 和 Opus 4.8,以及所有这些功能,是因为我认为即使我不从中赚任何钱,我也会做同样的事情,因为你看到了可能性,
217
Speaker 1
你看到了它对技术能带来的影响,这会促使人们行为方式发生变化。我认为,这对我来说是最终的试金石,也是一个很好的区分点。
218
Speaker 1
当然,代币现在非常昂贵,但我觉得从长远来看,它们可能会变得几乎免费。如果我设想100年后的情况,与我们现在对电力的看法相比,
219
Speaker 1
我们现在已经不会考虑日常生活中电力的成本,除非你是在数据中心工作。但我认为这里确实有某种相似之处。
220
Speaker 6
我们和许多后期阶段公司的创始人聊过,他们希望自己的公司能像 AI 粒子一样简洁。你现在经营着一家大公司,拥有众多员工,
221
Speaker 6
但这只是 Bre 的一面。还有 Capital One 的一面。我很好奇,你做了什么来让公司其他部分也跟上这个旅程?你对其他人有什么建议吗?
222
Speaker 6
有很多事情要做。我认为 CEO
223
Speaker 1
需要是首席⟶0⟶官。这不是工程团队的事情。这不是产品团队的事情。你必须比任何人都更了解这项技术的边界。我认为除非你每天真正体验这项技术的极限,否则很难理解它到底能做什么。
224
Speaker 1
一种每天都在使用的科技。我认为要真正理解它到底能做什么,真的很难。
225
Speaker 2
哦,你知道为什么吗?因为除了董事会,没人能拒绝⟶1⟶。
226
Speaker 1
而董事会不会深入细节,这是100%正确的。当你去想,比如我们之前说的那个⟶2⟶的例子,⟶2⟶团队永远不会想到用⟶2⟶技术来获取客户。
227
Speaker 1
只有那些拥有整体背景的人才能思考系统本身的组织方式。对我来说,任何联合创始人需要回答的最关键的问题是:忘记竞争环境,假设你现在可以将当前技术的状态带到你创业的那一刻。
228
Speaker 1
机会仍然相同,但构建公司的可能性完全不同。你会怎么做?然后将此与你现在的情况进行对比,然后
229
Speaker 1
公司。机会仍然是一样的,但构建公司的可能性却完全不同。你会怎么做,然后与你现在的情况进行对比,
230
Speaker 1
首先默默地承受一段时间,因为你会每天都在这么做,但接下来的问题是,你打算怎么做,如果你从零开始的话,你会怎么做?
231
Speaker 1
你将负责思考,我们该如何设计我们的入职流程,或者如何设计我们的增长引擎、客户获取方式,以及我们与用户沟通的方式,以及我们如何整合
232
Speaker 1
数据,所有这些都将从零开始重新设计。因此,我认为这几乎就像你必须重新思考公司自我身份的概念,
233
Speaker 1
以及公司职能和员工成就感的构建方式。AI是一个我认为包含三件事的伞状概念。我们在内部讨论时,通常会这样划分。
234
Speaker 1
首先是产品 AI,即我们实际交付给客户的产物。其次是运营 AI,即直接影响我们大规模服务客户能力的事项。
235
Speaker 1
比如客户成功、风险、入职、运营等。第三是企业 AI,即员工内部如何运作。这三个议程都很重要,且根据公司所处的阶段,重要性也有所不同。
236
Speaker 1
而且,我认为人们有时会把自己局限在其中一个议程中。但实际上,我认为你必须后退一步,思考:你
237
Speaker 1
知道,我们之前谈到的其实是同一件事。比如,为什么不能用 AI 解决所有问题?这其实是极限的问题。然后从这个问题出发,再逐步解决
238
Speaker 1
围绕这个问题。这几乎就像一次转型。我认为,如果你是一家大型公司,而且不是 AI 原生的,某种程度上你就是在进行一次转型。我
239
Speaker 2
猜我们已经很长时间在取笑 Foxcon 工厂了,但另一方面,如果你仔细看看它们,它们简直是极端效率的典范。是的。但它们
240
Speaker 2
也被设计成这样,就是为了能连续不断地完美生产出同一种东西。所以你要建立一个这样的工厂 而大多数公司本来就是这么设计的,对吧?我认为流程
241
Speaker 1
的设计是为了不改变。要打破一些玻璃是必须的。问题是,我认为对于公司来说,打破玻璃比对于高管来说容易10倍。哦 而对于高管来说,又比对于
242
Speaker 1
员工来说容易10倍。所以很多时候,有人来找我说,我正在尝试做这个 AI,但有人却说不行,因为我们还没有在该用例中测试过,或者在那方面没有做过
243
Speaker 1
我就会问,那你到底想做什么?比如你明白其中的风险吗?你明白那些防护措施吗?是的,明白了。好的。
244
Speaker 1
解决这个问题对我来说只需要 literally 10 秒钟,而其他人可能需要 10 个小时去开会、升级问题并理解,好吧,我们能不能或者也许永远都不行,而我
245
Speaker 1
认为结论可能是永远不会,因为大多数人会说 你知道,我干脆就用老方法来构建这个产品,因为为什么不用呢,它只是
246
Speaker 2
works 我们知道它在这里 这个人会讨厌我,然后我每天在午餐队列里看到他时,我就想 我希望人们喜欢我并对我有好感
247
Speaker 1
我就是不会做那件事 我告诉人们的是一回事,我认为系统中的升级路径需要被弱化,因为公司会对此产生抗体
248
Speaker 1
任何可能破坏公司社会凝聚力的事情通常都会被抗体拒绝,我认为更快地进行升级并说‘我们要去尝试’
249
Speaker 1
这个东西,你知道,我理解其中的风险,让我们承担这个风险吧,因为最大的风险其实是不承担它,这其实就是白白错失重新思考一个问题的机会,你会怎么做呢?
250
Speaker 3
如果你今天创办一家公司 在这家公司的 AI 这个具体业务板块上,比如你是否认同 Jack Dorsey 的观点,即每家公司本质上都在尝试
251
Speaker 1
比如构建自己的小公司 AGI 是的,但我可能以稍微不同的方式来实现。我认为领域特定性很重要,比如我不相信那种哦,我要建立一个
252
Speaker 1
单一公司模型,里面包含所有数据,没有任何判断或视角。我认为更合理的思路是类似于虚拟员工的类比,
253
Speaker 1
也就是说,我该如何构建一个智能体或虚拟员工,使其在理解客户所有重要信息方面表现卓越。这是一个定义明确、边界清晰的问题,
254
Speaker 1
有清晰的API,明确哪些人依赖这些数据,哪些人与这些数据互动,系统本身是自包含的。然后
255
Speaker 1
还有另一个智能体,可以基于我们所有的客户及其面临的问题,管理产品路线图,这可以作为一个独立的智能体,但它
256
Speaker 1
是建立在客户世界的之上 本质上就像一个虚拟的高管团队 是的,功能和领域知识仍然重要,这些事情不会消失,
257
Speaker 1
我认为知识的结构方式仍然有效,不会有太大变化,你应该将实际生成代码的智能体和系统与
258
Speaker 1
与客户交流的系统、以及分析客户对话并将其转化为产品路线图的系统区分开来。这三个是完全不同的部分。我们正在
259
Speaker 1
就像 Tesla 为 AI 设计的。我们不认为任何没有实际使用的东西是值得相信的。所以,比如我建立了一个很棒的模型,然后我会问自己,有多少人正在使用它?它是否
260
Speaker 1
实际上是否取代了在公司内部雇佣人员的需要?它是否真的节省了大量时间?比如,这种东西到底节省了多少小时?我認為很多
261
Speaker 1
人们常说,嗯,这是一个很酷的模型。而我会说,是的,但这样是不够的,对吧?一旦你有了这种定位,我认为客户模型,
262
Speaker 1
好的,比如你的,例如,我们现在客户销售团队是运行在我们的客户世界模型上。所以我知道它有效。我实际上明天要和一位客户共进午餐,而我不知道状态的
263
Speaker 1
那账户我也应该负责。客户角色模型回答了一个我的问题,我现在有一个报告,其中包括团队之前不知道的一些信息
264
Speaker 1
支持工单,你知道,有一位正在出差的高管在机场遇到了信用卡的问题,所有这些事情 意识 全面的信息意识,这显然是一个明确定义的问题,这正是
265
Speaker 1
正在工作,我可以信任这个构建模块作为我公司模型整体的一部分,你可以在其基础上进行演化,比如我们知道,比如你,我认为我们非常应该讨论演化,那里有
266
Speaker 1
在这方面有很多学习成果,以及如何构建演变为公司架构的一部分。不过,不管怎样,我认为你必须稍微分解一下这个问题。
267
Speaker 2
是的。我最喜欢EVELs的一点是,呃,让不同模态的评估相互之间进行交叉评估。
268
Speaker 1
所以,我们正在做的一件事,虽然和这个相关,但我认为非常有趣,那就是如何让公司中的每一次人类互动都成为一个演化。当你拥有
269
Speaker 1
一个 AI 智能体。例如,我们有负责入职的智能体在做某些事情,然后你还有一个团队实际去查看 KYC 个模型无法解决的例外情况出。
270
Speaker 1
如何让这成为一个重大变更,以及,好吧,像这样的手动交互将变成一个演进案例。
271
Speaker 1
你知道我们在 Brex 有一个支出智能体,每当有人与这个智能体进行对话时,如果对话中出现了问题或错误,或者感觉对话没有正常进行,就会触发一个标记
272
Speaker 1
运行得如此顺畅以至于产生了一个错误。这个错误会触发一个智能体,该智能体会进入并修改代码库和提示词等一切内容,以使这个演化通过。如果这没有导致问题,
273
Speaker 1
然后工程师会进去想办法让这个过程通过,因为我认为最终的目标是让整个系统成为一个自我学习的系统,对吧?而且我认为有很多
274
Speaker 2
我看到的公司情况是,他们花了很多时间让一个智能体运作起来,却从不考虑如何让这个智能体每天都在进步。我认为这始终是最大的突破点。a
275
Speaker 2
梦境循环每晚都会看到一切 然后就像哦,那里发生了什么,我需要把这放在这里,实际上发生了什么,有没有什么模式,我该如何重新引发这个 所以如何如何如何烘焙这个梦境
276
Speaker 2
将这些循环应用到产品中,应用到智能体中,应用到你所发布的各种东西中 我现在最喜欢的事情是,我正在为我的朋友们构建三到四个智能体 哦,有趣 其中一些是这样的,这是一个用户
277
Speaker 2
为我研究 Gbrain,因为它运作得非常好,我现在里面已经有35万篇markdown页面了。多么疯狂啊,我原本以为这只是一个遥不可及的幻想事情,而且这会在我们有生之年发生。
278
Speaker 1
你知道,我记得当 Neuralink 发布的时候,我曾经想过这个问题。我当时觉得我不太明白。就像我之前说的,"嗯,我概念上是明白的,但为什么这会成为一个问题呢?"
279
Speaker 1
然后我现在使用 AI,你就会说,"嗯,对, 对,说得通。说得通。"我是瓶颈。"
280
Speaker 3
打字太慢了。我不知道你是否使用了很多适配功能。我 我确实用了很多。我现在最常用的开发者工具是用语音备忘录来打开 cloth。我之前说过这个
281
Speaker 3
比如它可能是偶然的,但我真的非常喜欢这样一个事实,就是 Telegram 与 配合得非常好,因为它迫使我去添加更多的内容,让智能体变得更完善
282
Speaker 3
智能到你可以通过语音备忘录做更多的事情,因为你要克服作为传统开发者的自然本能,你会想哦,我好像做不了
283
Speaker 3
这个功能要么能实现,要么不能实现,我需要去构建更多的客户端或者更多的 UI,或者为它增加更多的功能。Foxcon。
284
Speaker 2
是的,完全正确。不,就让它做它想做的事。给它一些上下文,它就会开始思考,你知道的,比如,实际上关于这个呢?
285
Speaker 1
我认为你提到的很多工作其实都是如何为模型组织上下文的问题,你可以利用模型来帮助你,但这就是大多数情况下遇到的瓶颈
286
Speaker 2
事情。一旦你把上下文放进去,其实你可以做一些非常疯狂的事情,比如我最喜欢的新功能。我看到你脑中 LSD。是的,LSD。是的。横向突触漂移。
287
Speaker 1
所以你只需要调整搜索的温度。
288
Speaker 2
不只是这样。所以你有这些向量,对吧?如果你想想传统观念是怎样的,大多数人会给你这样的想法:哦,这个想法和那个想法,但其实
289
Speaker 2
就像在这个锥体 LSD 模式中实际上说你不能组合这个锥体内的概念,它们实际上必须是正交的,或者就像随机的感觉,似乎随机。然后它会随机尝试数百种这些组合。
290
Speaker 2
然后它会将它们按相关性排序,选出最连贯的那些。是的。如果你生成了上百个,实际上前五名往往都是爆款推文。
291
Speaker 3
你知道有多疯狂吗?我没有告诉 Alfred Express 要成为 DRY。我实际上是让 chat GPT 生成了我的灵魂文件。
292
Speaker 3
它是基于你对我的了解,以及这里的各种互动,为我的 open core 智能体生成了一个灵魂 MD。
293
Speaker 3
它对我的智能体需求的描述竟然如此准确,我心想:"哇,这些模型对 US 了解得太多了。"
294
Speaker 2
我的 open clock 在我摄入了 60GB 的 Google 外卖数据后变得非常有趣。我得写一堆俳句代码,只提取真正重要的邮件。
295
Speaker 2
但你知道,从 60GB 数据中提取出 4000 封真正重要的邮件。这些邮件其实包含了你很多思考和生活中重要的时刻。
296
Speaker 2
所以 Pedro,非常感谢你与 US 一起参与。你绝对是目前最 AI、最激进但又非常务实的 CEO 之一,你正在亲自尝试并构建这些技术。东西,而且实际上自己动手去建造它。
297
Speaker 2
你对那些正在观看并希望成为创始人的创始人会说什么?嗯,我想你们就是人们应该创业和经营公司的典范。
298
Speaker 1
以AI作为你的SLN伙伴, 我真的很无法停止思考那个关于电力的类比,也就是说,你知道的,你站在那里,面前是一幅200年的人类历史时间线。那里有/
299
Speaker 1
发明电的那一刻。一开始或者在那之后的六个月里,它都很糟糕。你有什么不同的做法吗?知道所有关于电的真相。呃,知道数据中心会消耗电力,甚至人工智能,对吧?
300
Speaker 1
嗯,我想你做事的方式和我有很多不同。所以,我想这就是其中之一,就是对我们现在所处的这个确切时刻的可能性感到惊叹。嗯,我想第二个是……
301
Speaker 1
在你的电脑上安装一个Boastit,它会在你醒来时,无论你生活中遇到什么问题,为什么不能用AI来解决呢?就像从那里开始,80%的情况下,是的,你可以使用聊天机器人,但还有20%
302
Speaker 1
你无法弄清楚原因,然后去构建一些东西,使得你解决这个问题的紧迫性降低,因为立即解决这个问题所带来的广泛效用。
303
Speaker 1
但因为它能给你一种技术可能性的质感和感觉,而这种感觉对你来说如果每天不亲自去玩的话是非常难以体会到的。
304
Speaker 1
第三件事可能是,我觉得就是衡量一下你的词元消耗量,以及你正在推动公司极限的程度,并从这样一个前提开始
305
Speaker 1
比如,为什么不能只由一个人来做,为什么不能就是我一个人来构建整个东西,但你很可能会遇到一些障碍,比如你所知道的
306
Speaker 1
模型能和不能做的事情,但在我认为,问题的关键是,你知道,你如何把时间花在只有你作为创始人能做的事情上,对我来说这些事情首先是
307
Speaker 1
哪些问题是需要解决的,其次是我们在前面谈到的那种选择问题,而第二个问题是,鉴于这些选择,一个 LLM 还有哪些是它仍然无法做到的
308
Speaker 1
而我必须亲自去完成这些事情,但某种程度上,你几乎是在为 LM 工作,到某个程度,如果你在一家
309
Speaker 1
更大的公司,你几乎要像创始人和 CEO 一样去推动公司,你几乎是在围绕这个想法构建整个公司,但在我早期的时候。嗯,很大程度上
310
Speaker 1
就是选择什么重要,与客户交流,注入模型没有的信号,并且就像你在2026年用电力那样重新构建它
311
Speaker 2
6个月大。
312
Speaker 1
谢谢你,Pedro。这太棒了。是的。感谢邀请我,我非常感激。谢谢你来。
end of transcript · 312 segments