CEO 必须成为首席 AI 官:重构公司身份
Pedro Franchesci 作为 Brex 的联合创始人兼 CEO,提出了一个核心观点:CEO 必须成为公司的首席 AI 官。他认为,AI 不仅仅是工程团队或产品团队的任务,而是需要最高领导者深刻理解技术的边界。在 AI 时代,CEO 的时间分配应聚焦于只有人类能做、而模型无法替代的工作。这要求领导者重新定义公司的自我身份(company self-identity),因为传统的职能划分在 AI 原生企业中已不再适用。Franchesci 指出,理解技术的局限性比掌握技术本身更重要,CEO 需要站在战略高度,将 AI 融入企业的核心基因,而非仅仅作为辅助工具。
从 Web2 到 AI 原生:打破“精密仪器”思维
Franchesci 回顾了自己从 Web2 工程师向 AI 原生思维转变的过程。早期,他像大多数软件工程师一样,将大语言模型(LLM)视为一种昂贵且需要严格控制的精密仪器。他花费大量时间编写数十万行 Rails 代码,构建复杂的“围栏”(harness),试图限制 LLM 的输入上下文,确保其输出符合预期。这种思维类似于工厂流水线上的严格管控,将 AI 代理(Agent)视为需要被束缚的对象。然而,这种过度工程化的做法不仅效率低下,还违背了 AI 的自然特性。Franchesci 意识到,真正的 AI 产品核心在于“技能、工具和模型”的简单循环,而非复杂的控制逻辑。他批评这种将 AI 关在“笼子”里的做法,认为这限制了 AI 的潜力,并提出了“释放爪子”(Free the Claw)的理念,让 AI 在受控但灵活的环境中自主运作。
电力时刻:OpenAI o1 与推理模型的突破
Franchesci 将 AI 发展的关键转折点比作1880 年12月电力的发明。他认为,虽然 GPT-3 在疫情期间引起了兴趣,但当时它更像是一个研究项目,缺乏实际应用的持久价值。直到 OpenAI o1 等推理模型(Reasoning Models)的推出,AI 才真正具备了改变行业的潜力。Franchesci 用了一个生动的比喻:在电力发明后不久,大多数人仍在纠结于蜡烛和灯笼的改进,质疑“谁需要这么亮的光”,而忽视了电力带来的根本性变革。o1 模型的发布标志着 AI 从“聊天工具”向“推理引擎”的跨越,使得代码生成和复杂任务处理变得真正可行。这一时刻让 Franchesci 确信,AI 不再仅仅是锦上添花,而是基础设施级别的变革,企业必须立即行动,否则将在新一轮技术革命中落后。
个人实践与团队恐惧:OpenClaw 的深度应用
在个人层面,Franchesci 深入探索了 OpenClaw 等 AI 代理工具的应用。他分享了一个典型案例:完全通过 OpenClaw 和 Brex 卡 API 购买电影票。当团队成员质疑“在线预订只需10秒”时,Franchesci 强调重点不在于速度,而在于自动化流程的无缝集成与数据控制的自主权。然而,他也指出,Brex 团队在初期对 AI 应用存在显著的风险规避心理。尽管处理金融数据需要高度谨慎,但团队往往比技术实际所需的风险容忍度更低。Franchesci 鼓励团队克服这种恐惧,通过小规模实验逐步建立信任。他认为,AI 的潜力远超当前企业的想象,关键在于领导者能否推动文化转变,从“害怕失控”转向“拥抱智能代理”。这种个人实践不仅提升了效率,也为公司层面的 AI 转型提供了可复制的路径。
从只读权限到网络层安全的演进
Brex 在推进 AI 代理(Agent)落地时,最初采取了极简策略:赋予代理对邮件、Slack 等系统的只读访问权限,并生成仅用于读取的 Token。这种“不写入”的策略让 CEO 惊讶于其带来的效率提升,但也引发了新的问题:如何让代理安全地写入系统?Google 安全团队明确表示无法为所有场景提供通用写入支持。面对这一僵局,Brex 团队将精力集中在解决最核心的网络安全问题上。他们意识到,传统的模型层控制(如限制模型调用的工具)存在漏洞,因为代理仍可能通过错误的 HTTP 请求绕过限制。
"We ended up realizing that the only way to actually do something about it was to do something in the network layer."
团队决定不再纠结于模型内部的指令遵循,而是转向网络边界的控制。他们观察到,许多开源项目试图通过 Fork 代码来限制模型行为,但这无法防止代理发起恶意的网络请求。因此,Brex 决定构建一个位于网络层的代理,将其视为具有自身“意志”的实体,并在网络边界进行严格管控,从而从根本上解决安全性问题。
Crab Trap:基于 HTTP 代理的安全架构
为了解决上述安全问题,Brex 开源了一款名为 Crab Trap 的工具,这也是其在生产环境中保障 AI 代理安全的核心方案。Crab Trap 的基本原理是作为一个 HTTP 代理,拦截并分析代理发出的所有网络流量。由于大语言模型(LLM)是在海量网页文档上训练而成的,它们对 HTTP 流量的理解能力远超预期。团队发现,让另一个 AI 代理来监控和分析这些流量,能够极其准确地识别出异常行为。
具体流程是:首先记录代理一天的正常操作流量,据此生成安全策略;随后,当新请求通过时,系统会判断该请求是否符合策略。如果符合,则自动放行;如果存在疑虑,则交由 LLM 作为“裁判”进行决策。这种机制使得 98% 的请求能够自动通过,仅 2% 的请求需要 LLM 介入审核。这一突破让 Brex 的安全团队从最初的怀疑转变为信任,从而允许业务部门更激进地实验 AI 应用,尽管目前仍避免将此类高权限代理用于敏感的客户数据。
聚焦核心能力:为何剥离凭证管理
在 Crab Trap 的早期版本中,团队曾尝试集成凭证管理(Credential Vault)功能,但最终决定将其剥离。CEO 解释称,这是因为团队希望“只做一件事,并把它做到极致”。虽然市场上已有许多优秀的凭证代理工具,但 Brex 的核心创新点在于利用 LLM 作为裁判来判定请求的可信度。这一“LLM 作为裁判”的能力是说服内部严谨的安全团队批准生产环境部署的关键解锁点。
"We are not in the business of building HT proxies. We are in business of being at the bleeding edge of what it can do with AI."
CEO 强调,Brex 并非旨在成为 HTTP 代理厂商,而是致力于站在 AI 应用的前沿。构建代理是为了实现这一目标的手段,而非目的。他们希望未来能有专门的 YC 公司或更优秀的版本出现,供 Brex 直接使用。这种专注核心价值的策略,使得团队能够迅速突破内部阻力,将 AI 从单纯的技术实验推向企业级应用。
AI 采纳的三层架构与非技术团队赋能
Brex 将公司内部对 AI 的采纳程度划分为三个层级:第一层是“Token 最大化者”,通常是工程师,他们利用编码助手大幅提升生产力;第二层是普通工程师,生产力提升约为第一层的十分之一;第三层则是公司其余所有非技术团队,他们目前仅以类似“Google 搜索”的方式使用聊天机器人,效率提升有限。
Brex 的核心论点是:如果能为非技术团队构建类似工程师使用的“编码助手式”工作流,将释放巨大的价值。他们借鉴 OpenClaw 的理念,通过编辑 Markdown 技能文件来自我引导(Self-bootstrap)代理能力,而无需手动编码。这种模式允许非技术人员通过自然语言配置代理,使其具备执行复杂任务的能力,从而打破技术壁垒,实现全公司的 AI 生产力跃升。
构建虚拟员工:从工具到基础设施的范式转移
在推动公司范围内AI采用的过程中,核心挑战并非简单地提供几个模型调用凭证(MCPS),而是构建能够支持虚拟员工形态的基础设施。这种AI代理应当具备类似真实员工的交互能力,例如集成在Slack中、拥有独立邮箱、能够被邀请参加会议并自动记录笔记。为了实现这一愿景,技术栈的选择至关重要。以Claw为例,其架构设计更接近于开放式的协作平台,而非传统的编码模型。这种设计使得AI能够无缝融入工作流,通过自然语言交互完成复杂任务,如协调数百人的活动安排,而无需人工干预代码编写过程。
"People forget that cloud code isn't magic. It's just literally a harness around the same models we can use in an API."
这种“封装层”理念揭示了当前AI工具的本质:它并非魔法,而是对现有API模型的高效封装。通过Claw等工具,用户只需描述需求(如安排60场晚宴,每场20人,涉及21位合作伙伴),AI即可自动生成Markdown文档、进行分析并执行任务。这种自动化工作流不仅提升了效率,更重新定义了人机协作的边界,使AI从辅助工具转变为能够独立承担职责的虚拟同事。
Token成本焦虑与本地化部署的兴起
尽管AI能力强大,但Token消耗成本仍是许多初创公司创始人面临的心理障碍。许多人对“烧钱”使用Token感到羞怯,倾向于保守使用。然而,随着技术发展,本地化部署成为一种极具吸引力的替代方案。特别是在中国,存在一个庞大的爱好者社区,他们通过构建高性能游戏主机或小型GPU农场来运行本地大语言模型(LLM)。这种做法不仅成本可控,还解决了数据隐私和延迟问题。
| 部署方式 | 硬件需求 | 成本结构 | 适用场景 | 优势 | 劣势 |
|---|---|---|---|---|---|
| 云端API调用 | 无本地硬件 | 按Token付费,单价较高 | 快速原型、高并发需求 | 无需维护硬件,弹性扩展 | 长期成本高,数据隐私顾虑 |
| 本地GPU部署 | 高性能GPU(如RTX 4090集群) | 一次性硬件投入,电费 | 数据敏感、高频低延迟需求 | 数据完全私有,长期边际成本低 | 初始投入大,需自行维护硬件 |
这种本地化趋势反映了用户对成本控制的精细化追求。正如一位拥有家庭GPU农场的开发者所言,虽然硬件运行会产生大量热量,但这种能源效率的权衡对于重度用户而言是合理的。此外,管理Token支出已成为Brex等公司重点关注的领域,表明支出管理正成为AI基础设施的重要组成部分。
AI依赖与“AI优先”的思维重构
真正的AI采用不仅仅是技术集成,更是思维模式的重构。作者提出了一个“AI药丸测试”(AI Pill Test)的概念:当生活中出现问题时,你的第一反应是否是“用AI解决”?这种默认优先的思维转变意味着大脑被重新布线,AI成为解决问题的本能路径。尽管目前抱怨API限制的用户比例极低(约0.1%),但这表明大多数用户仍处于早期阶段,尚未完全内化这一思维。
"The fabric of the company just looks very different when the boundaries become type systems, interfaces, agents talking to each other versus people."
这种思维重构带来了公司架构的根本性变化。未来的公司可能不再以人为中心,而是以智能体(Agents)之间的交互为核心。边界不再是人与人之间的沟通,而是类型系统、接口和智能体之间的对话。这种架构允许单人创始人以极低的边际成本扩展业务,因为Token消耗的增加并不伴随线性的人力成本增长。这种“AI优先”的策略要求创业者即使在不确定的情况下,也先尝试用AI解决,再逐步优化,从而获得复利效应。
最小表面积原则与AI时代的MVP
回顾Brex的早期发展,其MVP(最小可行产品)甚至没有Web UI,完全基于终端命令行。这种极简主义策略在AI时代依然具有指导意义。作者提出“最小表面积”(Minimal Surface Area)原则,认为成功公司往往具备极小的交互界面,从而降低用户认知负担和开发复杂度。在AI辅助下,这种原则被进一步强化:无需构建复杂的HTML界面,只需通过自然语言交互即可验证核心价值。
这种“无UI”或“低UI”趋势意味着,未来的MVP可能完全由AI代理驱动。创业者可以从“为什么不能只有我一个人”出发,利用AI填补所有职能缺口。这种架构重构不仅降低了启动门槛,还使得公司在早期就能实现高度自动化和智能化。通过最小化交互表面积,公司能够更快速地迭代和验证假设,从而在激烈的市场竞争中获得先发优势。
早期产品的极简主义与AI时代的纪律性
回顾Stripe、Brex和Airbnb等科技巨头的早期形态,可以发现一个共同特征:极简的用户界面与极高的专注度。Stripe最初本质上只是一个API,Brex早期甚至没有图形用户界面(UI),仅通过终端(Terminal)进行操作;Airbnb的网站最初只是一个表单,用户填写需求后,由创始人手动完成预订流程;DoorDash在早期也遵循类似的逻辑。这种策略的核心在于将产品与客户的接触面(Surface Area)压缩到最小,从而让创始人的全部精力和带宽都集中在打磨单一的核心交互模式上。
然而,AI的普及带来了一个潜在风险:选择背后的能动性(Agency)正在消失。许多创业者误以为AI允许他们无限制地尝试各种想法,从而放弃了“选择什么才是真正重要问题”的纪律性。如果无法将问题压缩到极小的接触面并设定清晰的边界,说明尚未找到正确的解决方向。 AI的价值在于帮助我们将问题压缩得更小,而非作为不聚焦的借口。
"Intelligence is compression. Great ideas fit in a napkin."(智慧即压缩。伟大的想法能写在餐巾纸上。)
从探索到利用:创始人决策的迭代逻辑
在创业过程中,探索(Exploration)与利用(Exploitation)的循环至关重要。以Brex为例,创始人曾采用两周为一个周期的迭代模式:在探索期尝试多种可能性,在利用期则聚焦于已验证的方向。这种模式在AI时代依然有效,但需要调整重心。核心难点不在于与客户的对话,而在于从对话中提取“未言明的信号”(Unspoken Signal)。
许多创业者试图通过提示词(Prompt)直接让AI生成解决方案,但这往往行不通。因为大语言模型(LLM)的训练数据中缺失了关键的隐性信号。当客户描述问题时,他们提供的往往是基于自身世界观和约束条件的“局部最优解”,而非塑造产品的终极答案。因此,创始人的核心能力不再是单纯的执行,而是在模型无法触及的领域做出明智的选择。
"The wisdom to choose is still the missing bottleneck... it comes from which signals are not in the models."
隐性信号与“心智模型”的构建
在AI辅助下,创业者可以并行探索更多想法,但关键仍在于识别哪些信号是模型所不具备的。这些信号通常来源于对客户的深度理解,尤其是那些无法被结构化或量化的部分。例如,Brex早期直接面向创始人销售,因为创始人自身就是用户,痛点清晰;但随着公司发展,目标客户转向财务团队,构建对财务团队价值观和思维模式的心智模型(Mental Model)变得极具挑战性。
虽然可以通过合成客户(Synthetic Customers)或角色模型进行初步探索,但在对目标用户了解不足时,模拟用户思维存在局限。真正的竞争优势(Alpha)来自于那些只有创始人能通过共情和直觉捕捉到的隐性需求。这种能力类似于心理学中的“心智理论”(Theory of Mind),即能够模拟他人思考过程的能力。创始人的核心价值在于将隐性的、微妙的客户欲望转化为显性的产品功能,这是当前AI模型难以替代的。
"What are things that only you can do? ... The models cannot do."
AI的局限性与创始人的不可替代性
尽管AI在生成和执行层面表现出色,但确定“正确的问题”依然依赖人类的直觉与判断。许多创业者陷入困境,是因为他们不知道应该向AI提出什么样的元问题(Meta Layer)。这就像埃隆·马斯克所言,关键在于知道宇宙在回答哪个问题,即明确问题的本质。
大语言模型并非魔法,它们基于特定的训练数据集合。因此,创始人的工作重心应从“如何执行”转向“如何定义问题”。在资源有限的情况下,创始人应专注于那些AI无法自动完成的任务,特别是涉及复杂人际互动、隐性信号捕捉和跨领域心智模型构建的工作。这种对“未言明信号”的敏感度,是AI时代创始人保持竞争力的关键壁垒。执行力的外包并不意味着决策力的退化,反而对决策的智慧提出了更高要求。
大模型的“数据分布盲区”与信任危机
当前大语言模型(LLM)的核心缺陷在于用户无法感知模型在回答特定问题时,其训练数据中相关样本的采样频率。这种信息不对称导致用户难以判断回答的可靠性。如果模型能像传统搜索引擎那样展示数据的分布情况,例如告知用户某个答案在数据集中出现的频率是X,而另一个答案仅为0.00001X,用户将能更准确地评估不同回答的可信度差异。这种对分布差异的感知缺失,是目前应用层开发者的巨大盲区。
"Imagine if like every time you asked an LM a question it gave you like yeah like I the the sampling frequency of this in my data set was I don't know X and on this other answer was 0.00001x. You would trust is very different, right? The distribution is so different."
为了解决这一问题,数据标注公司和像Merkore这样的数据服务商正致力于识别LLM的盲点。然而,这面临着一个“知识的诅咒”:只有专家才能识别答案中的漏洞,而普通创始人往往不知道自己不知道什么,从而误以为自己理解了模型的能力边界。这种认知偏差使得识别模型缺陷变得异常困难,也催生了通过外部数据补充来填补分布空白的创业机会。
检索增强:填补“分布外”知识的方案
针对模型训练数据中未覆盖的分布外(Out-of-Distribution, OOD)知识,有效的解决方案是构建专用的检索系统。演讲者分享了自己在使用Gbrain时的实践:当遇到缺乏公开维基百科文章或常见数据源的问题时,他会进行深度研究,阅读所有相关论文和文章,并将其存入Git仓库。通过这种方式,系统能够检索并总结这些非标准分布的信息,从而提供可用的上下文。
这种策略具有普适性。例如,若想深入了解“经营餐厅”这一领域,可以收集并数字化500本相关书籍,构建一个包含所有行业信息的综合知识库。在商业应用中,Brex正在构建类似的客户世界模型(Customer World Model),通过整合客户的所有触点和行为数据——从仪表盘点击次数到邮件和电话内容——来预测客户下一步的需求、思维状态以及潜在但未暴露的问题。这本质上是一个通过数据整合来解决分布问题的过程。
物理极限与模型偏见:为什么AI不会完全替代人类
尽管AI发展迅速,但物理极限决定了模型无法包含宇宙中所有可能的知识。正如演讲者所言,"literally you can't have a model that has enough parameters that could like have everything that you could possibly need in distribution like there aren't enough atoms in the universe"。这意味着,只要存在RAM限制和参数规模瓶颈,人类专家在识别和处理极端长尾问题上的价值将长期存在。
此外,模型的心智模型(Mental Models)往往带有开发者的偏见。例如,在会计分类任务中,模型倾向于将某些支出默认归类为"AI资本支出(AI Capex)",这反映了构建模型的人群主要关注AI领域,而缺乏对更广泛商业场景的理解。这种偏见表明,即使是最基础的模型默认行为,也深受训练者背景的影响,而非完全客观中立。
AI推理成本与采用率的现实数据
关于AI的未来,市场存在一种乐观预期,认为推理(Inference)需求将呈指数级增长。然而,当前的采用率数据揭示了巨大的增长空间。根据演讲者引用的市场数据,全球人口分布与AI使用情况如下表所示:
| 用户群体描述 | 全球人口占比 | 对应地球人口数量估算 | 备注 |
|---|---|---|---|
| 从未使用过AI的人 | 84% | 约67.2亿 | 基数最大,潜在增长空间 |
| 至少使用过一次免费聊天机器人的人 | 16% | 约12.8亿 | 初步接触者 |
| 每月支付20美元订阅AI服务的人 | 0.3% | 约2400万 | 付费核心用户 |
| 实际使用AI Agent的人群 | 极小比例 | 约1个“方块”代表 | 深度应用者 |
"The underwriting... 84% of the world never used AI 16% have used at least once a free chatbot then 0.3%... pay 20 bucks a month for AI and one box out of the 2500 actually use agents in whatever capacity."
尽管目前Token成本较高,但随着技术成熟,成本预计将下降10倍,但使用量预计将增加10倍,因此推理成本仍将是企业最大的支出之一。为了应对这一挑战,Brex开发了内部工具Magpie,旨在帮助企业追踪每一美元Token支出的归属,从而更有效地管理AI预算。这反映了当前企业从“盲目尝试”转向精细化成本管理的趋势。
重新定义问题:从自动化到彻底重构
Brex 在内部工具中追踪模型使用情况,并试图通过数据分析来理解代币(Token)消耗的投入产出比(ROI)。尽管目前仍处于早期阶段,但数据揭示了一个显著现象:高代币消耗与更快的收入增长之间存在正相关关系。特别是在以旧金山为核心的“10英里半径”区域内,包括纽约在内,大型公司往往存在严重的代币使用不足。数据显示,许多拥有庞大预算的企业每月仅花费约 10,000 美元,而实际上它们本应花费十倍、百倍甚至千倍于此的金额。
“我们最大的断层式进步在于,我们说‘好吧,把这个旧方式放在角落里,如果我们今天从零开始创办这家公司,我们会如何设计它?’”
这种差距并非因为小公司缺乏预算,而是源于思维模式的滞后。Brex 在两年半前曾与工程和产品领导层进行过一次复盘:如果今天重新创办 Brex,一切都会不同。这种认知促使他们不再简单地将 AI 附加在旧流程上,而是彻底重构业务流程。例如,在重新设计客户身份验证(KYC)流程时,他们没有仅仅构建一个自动化代理来处理那 80% 的自动化部分,而是重新设计了整个入职流程。由于 KYC 成本大幅降低,他们可以将风险控制前置到漏斗顶端,从而更精准地筛选合格客户,这从根本上改变了目标客户的定义和信用评估逻辑。
生产力悖论与历史视角
关于 AI 是否真正提高了生产力,外界常提出质疑:人们似乎比两年前工作更努力,但产出在哪里?Brex 向一家大型上市公司客户展示的数据表明,代码推送行数确实在增加,这可以作为衡量产品速度的一个指标。然而,单纯关注代币消耗的 ROI 分析可能忽略了更宏大的历史背景。
“想象一下,有人刚发明了电,六个月后就开始讨论电的投入产出比。”
这种视角的错位在于,当前正处于技术变革的早期阶段。就像电力发明初期,人们并未立即看到生产力的爆发式增长,而是经历了基础设施和思维模式的重塑。Brex 认为,关键在于认识到这种历史性的断层,并愿意投入资源去适应新的范式,而不是急于在旧框架下计算短期回报。这种长期主义视角是理解当前 AI 应用价值的关键。
开源与闭源:Arch Linux 与 Ubuntu 的隐喻
对话中引入了一个生动的类比:将当前的 AI 生态比作 Linux 发行版。Ubuntu 代表闭源 AI 工具(如 ChatGPT),其特点是开箱即用,用户无需深入底层即可快速上手,适合大多数追求效率的用户。而 Arch Linux 代表开源 AI 框架(如 OpenClaw 和 Hermes),虽然门槛极高,需要用户深度定制、维护技能树并处理复杂的配置,但一旦成功,其灵活性和强大程度令人惊叹。
“Valve 的 SteamOS……实际上是基于 Arch 构建的。他们定制了所有驱动程序……超级定制。”
Valve 的 SteamOS 是一个极致定制 Arch Linux 的典型案例,它通过深度定制实现了类似 Nintendo Switch 的用户体验,支持所有主机和硬件。这一类比说明,对于愿意投入精力深度定制的企业,开源 AI 框架能构建出极具竞争力的独特优势。虽然目前使用 Linux 的用户比例尚低,正如当前 AI 的普及程度一样,但那些能够驾驭复杂开源生态的企业,将建立起难以复制的技术护城河。这种“硬核”定制能力,正是未来 AI 应用差异化的核心所在。
电力类比与AI的长期价值
将当前AI发展的早期阶段与19世纪电力的普及进行类比,揭示了技术采纳中的认知偏差。在电力刚发明时,其投资回报率(ROI)实际上很差,且工作效率低下。如果当时的会计师仅基于短期成本节省进行理性分析,他们会得出“电力永远不会成为主流”的结论,因为初期电费高昂且能效比低。然而,人们坚持使用电力并非出于即时的成本节约,而是源于对技术可能性的强烈好奇心。这种好奇心驱动人们去探索技术的边界,正如演讲者本人即使在没有经济回报的情况下,也会通宵研究SLworkflows和Opus 4.8等工具,因为看到了技术对未来的重塑潜力。
"It wasn't the cost savings. It was just because people were curious about it."
从长远来看,随着技术成熟,AI令牌(tokens)的成本可能会变得几乎免费,就像今天人们不再日常关注电费一样。除非身处数据中心,否则电力成本已融入基础设施背景中。同理,AI的成本结构也将经历类似演变,从昂贵的实验性支出转变为像水电一样的基础资源。这种视角的转变是区分真正拥抱AI者与保守者的关键试金石,它要求领导者超越短期的财务核算,关注技术带来的范式转移。
风险权衡与CEO的AI领导责任
在推动企业级AI转型时,最大的风险并非尝试失败,而是错失重新定义问题的机会。许多领导者倾向于保守,但真正的战略视角应聚焦于“如果今天从零开始建立一家公司,你会如何设计它”。这种思维模式要求CEO必须成为首席AI官(Chief AI Officer),因为AI不仅仅是技术工具,更是重塑业务流程的核心驱动力。如果企业不主动拥抱这种变革,就会在竞争中落后,无法利用AI带来的效率跃迁。因此,决策层必须承担风险,将AI视为重构企业竞争力的关键杠杆,而非简单的辅助手段。
垂直领域模型与“虚拟员工”架构
针对Jack Dorsey提出的“每家公司都应构建自己的AGI”观点,演讲者持保留态度,认为领域特异性(Domain Specificity)至关重要。企业不应追求一个包含所有数据、缺乏判断力的单一通用模型,而应构建专注于特定领域的“虚拟员工”智能体(Agents)。例如,可以创建一个专门理解客户信息的智能体,其边界清晰,API明确,仅处理与客户相关的数据。另一个智能体则负责基于这些客户数据管理产品路线图。这种架构类似于虚拟执行团队,将功能知识和领域知识分离,确保每个智能体在其专业领域内达到极致表现,同时通过清晰的接口进行协作,避免数据混乱和上下文污染。
真实用例验证与“全知”信息感知
评估AI价值的核心标准是真实使用场景中的效率提升,而非模型本身的参数规模或技术炫酷程度。演讲者以Brex公司为例,指出其销售团队现在运行在“客户世界模型”之上。通过该模型,高管能够获取总信息感知(Total Information Awareness),包括支持工单中未被注意的细节或高管旅行中的突发问题。这种可信赖的基础模块使得企业内部信息流动更加透明和高效。演讲者强调,只有当AI能够替代人力工时或显著减少重复性劳动时,才具备真正的商业价值。因此,企业应优先部署那些能立即解决具体痛点、产生可量化节省的智能体,并在此基础上逐步扩展。
自我进化系统:将人工交互转化为测试用例
构建AI系统的最高境界是打造自我学习系统,即让每一次人工干预都成为系统进化的燃料。演讲者分享了Brex的经验:当AI智能体在处理KYC例外或费用报销遇到无法解决的复杂情况时,人工介入不仅解决问题,还自动触发一个“进化”流程。这个流程会将该案例转化为测试用例,自动修改代码库和提示词,直到智能体能独立处理该问题。这种机制确保了系统每天都在变强,而不是停留在初始状态。通过将人类互动转化为自动化回归测试,企业可以构建一个闭环的自我优化生态,极大降低长期维护成本并提升智能体的鲁棒性。
交互范式转变:从UI开发到语音上下文
随着AI能力的提升,人机交互的瓶颈正在从打字速度转向上下文组织。演讲者分享个人经验,目前最常用的开发者界面是语音备忘录配合Claude等模型。这种交互方式迫使开发者放弃传统的UI构建思维,转而专注于为模型提供高质量的上下文。通过Telegram等即时通讯工具与AI协作,开发者能够更自然地通过语音输入复杂指令,AI则通过推理能力自动补全逻辑。这种范式转变表明,未来的核心竞争力在于如何有效地组织和压缩上下文,而非开发复杂的客户端界面。企业应鼓励团队利用语音等低摩擦交互方式,激发AI的深度推理能力,从而释放更大的生产力。
突破常规:LSD模式与向量空间的创造性组合
在构建AI智能体时,传统的思维模式往往局限于概念间的线性关联,即“这个想法结合那个想法”。然而,更高级的应用需要引入侧向句法漂移(Lateral Syntactic Drift, LSD)模式。在这种模式下,系统被明确禁止将处于同一概念锥体内的想法进行组合,而是强制要求概念之间保持正交性或看似随机的独立性。通过这种机制,系统能够随机生成数百种看似不相关的概念组合,随后利用算法对这些组合进行排序,筛选出逻辑上最连贯的结果。这种方法的惊人之处在于其产出质量:当生成一百个这样的组合时,排名前五的结果往往能成为极具传播力的“爆款”推文。这证明了通过打破常规关联,AI能够挖掘出人类直觉难以触及的创意空间。
个人数据注入:从60GB数据中提炼“灵魂”
AI智能体的个性化程度取决于其训练数据的深度与广度。一个极具代表性的案例是将60GB的Google Takeout数据(包含电子邮件、文档等)注入到Open Core Agent中。这一过程并非简单的数据堆砌,而是需要编写复杂的Haiku代码来过滤噪音,最终从海量数据中提取出约4000封真正重要的邮件。这些邮件承载了用户生活中的关键决策时刻和深层思维模式。通过这种方式,AI不再是一个通用的聊天机器人,而是成为了一个深刻理解用户“灵魂”的代理。这种深度定制使得AI能够精准模拟用户的语气、偏好和决策逻辑,实现了从“工具”到“伙伴”的质变。
创业新范式:CEO即首席AI官
对于创始人而言,AI不仅是工具,更是重构企业架构的核心。Pedro提出,创始人应像6个月大的电力时代那样看待AI:虽然早期应用有限,但潜力巨大。他建议创始人采取以下策略:
- 每日反思:在电脑旁放置便签,每天问自己“为什么不能用AI解决这个问题?”即使80%的问题可以用现有聊天机器人解决,剩下的20%才是创新的机会。
- 构建闭环:针对那20%无法解决的问题,构建专门的解决方案。这不仅为了解决问题,更是为了获得对技术可能性的直观感受,这种手感无法通过旁观获得。
- 衡量Token消耗:将Token消耗作为衡量公司扩展性的指标。创始人的核心任务不再是执行所有细节,而是选择正确的问题以及识别LLM的局限性。在大型公司中,CEO的角色转变为将AI视为“创始人”,围绕AI的能力边界重新设计组织架构,注入模型无法获取的人类信号,并以2026年的视角重新构建业务。
“I think that you are sort of the model for the way people should start companies and run them. Um, with AI as your SLN buddy.”
“Have a boastit on your computer which is you wake up whatever problem you have in your life why can't you solve it with AI and just like start there.”
“Almost to some degree you're working for the LM to some point.”