开源权重模型能达到如此顶尖的能力水平并被主流认可,对许多人来说都是重大的进展。 开源模型迈向前沿性能,意味着你可以拥有自主可控的 AI,能针对特定工作流进行后训练,能针对不同任务优化成本,并能以更经济的方式实现更多 AI 功能(从而催生出全新的应用场景)。 这对 AI 应用层来说是巨大的胜利。
2026-06-19 · levie · 打开 ↗
这次更新有利于获取 Fable 的访问权限,同时也让我们窥见了未来 AI 监管的趋势。 政府将建立相关框架,对能力或算力达到一定阈值的模型发布进行管控。考虑到涉及的各方利益以及 AI 的经济和社会意义,这几乎是必然的。 这看似微小,实则影响深远。这意味着每一次模型更新都将经历漫长的审查、测试和反馈流程。在此过程中,许多团体都会对模型风险发表意见,而对于“什么是实际风险”或“风险被利用的可能性”这类问题,往往存在很大的主观性。 一种积极的未来图景是:模型进步依然巨大,但会以“大跨步”的形式出现——由于每次审查的成本和时间成本很高,实验室会将重大改进打包在一起发布。 另一方面,风险在于,一旦超过某个阈值,我们可能无法再看到习惯了的那种快速迭代的模型进步,而这种迭代的缺失可能会产生负面的连锁反应。希望结果是前者。
2026-06-19 · levie · 打开 ↗
过去几个月,我们可能正在见证规模化的“应用 AI 层”究竟是什么样子的。尽管最初有人批评这只是大模型(LLM)之上的一个简单包装层,但事实证明,在企业中驱动智能体(agentic)工作流要复杂得多。而任何存在复杂性的地方,通常都会随着时间的推移产生护城河和价值。 根据我们在编程、法律、医疗、客户支持、金融服务等领域观察到的案例,以下是构成这一套成功范式的几个核心组件: * **构建连接“智能”与“工作流”的功能。** 有些工作流只需通过通用界面即可实现自动化,但其他工作流则需要针对其增强或自动化的具体任务,设计定制化的界面和功能。它们需要专门的功能来捕获作为智能体上下文所需的数据,需要为智能体提供各种定制工具,并为“人机协同”的交互体验提供独特的界面。显然,仅仅展示输出的 Token 是远远不够的,做得越深入,其持续价值就越高。 * **充当模型路由,在顶尖智能模型与低成本模型之间取得平衡。** 任何“模型中立”平台都有一个天然优势:它可以根据业务逻辑,自然地调用完成自动化工作流所需的任何级别的智能。
2026-06-18 · levie · 打开 ↗
人工智能领域最大的悬念之一,在于开源权重模型与闭源模型之间的差距究竟有多大。如果开源模型仅落后3到6个月,还是会落后数年,这将决定完全不同的市场结构。 这一答案将决定芯片产业格局、推理能力的部署位置、主权AI的形态、AI应用层的发展、AI行业的利润结构,以及企业在AI上的投入规模等诸多因素。 目前来看,开源权重厂商表现稳健,能力水平正紧追前沿水平。后续的发展趋势非常值得期待。
2026-06-17 · levie · 打开 ↗
Cursor 的这笔交易具有重要的象征意义。它实际上是 AI 应用层迎来的第一个现象级成功。 他们有力地验证了以下价值主张:深耕垂直领域的重要性;作为“模型路由器”的角色;何时依赖前沿模型、何时训练自有模型;以及通过 AI 应用层的市场进入(GTM)与分发策略来把握市场机遇的关键作用。 他们业务的方方面面都经过精心打磨,旨在竞争激烈的赛道中开辟阵地并持续加码。这确实是规模化执行这套打法的首个范本。
2026-06-16 · levie · 打开 ↗
这篇核心帖揭示了 AI 未来的某种图景。 “AI 领域最引人注目的趋势并非单一模型的进化,而是智能正变得日益可定制。最终的赢家未必是拥有最大模型的公司,而是那些能将智能转化为自身独特优势的公司。” 将独特的数据、工作流,以及能将任务调度至最合适模型的智能路由层相结合,这显然就是未来的方向。
2026-06-16 · levie · 打开 ↗
说“我们需要一个AI版的FDA”或类似的政府机构很容易。但实际情况会是这样的: AI模型的能力组合近乎无限。要在每次模型发布前,在模型实验室、学术界和政府之间进行漫长的反复沟通、研究和辩论,并制定出一套能普遍适用的纯客观指标,这极其困难。 现在,想象一下,如果每次模型发布都要在全球每个开展业务的国家重复这一过程,再加上积压的数十个待发布模型,你很快就能看出,这最终会极大地拖慢AI的发展进程。 这就是为什么我们应该主要关注AI的应用端监管,因为风险真正出现在应用环节。
2026-06-15 · levie · 打开 ↗
开源将大获全胜。
2026-06-15 · levie · 打开 ↗
好文。那些能将独特的知识产权、组织经验和数据转化为特定格式与架构,从而充分捕捉 AI 进步红利的公司,将在未来占据最有利的位置。 “真正的机遇不在于挑选最好的模型,而在于在模型之上构建一个学习闭环,让人力资本与 Token 资本实现复利增长。你可以外包任务,甚至外包工作,但你永远无法外包学习。企业的未来在于能否实现人类与 AI 之间学习能力的复利叠加。 这需要一种全新的架构方法,让企业能够构建随时间不断进化的智能体系统,同时仍能掌控自己的知识产权。公司应当能够更换‘通用型’模型,而不丢失其学习系统中内置的‘资深员工’级专业知识。” 我们都在共同探索 AI 未来的正确架构。但显而易见的是,巨大的权力和价值将流向那些能最有效地利用 AI 系统来处理自身信息的地方。这也是为什么在未来几年,AI 应用层也将获得巨大的价值。
2026-06-14 · levie · 打开 ↗
这一切最终的大赢家将是开源权重模型。这对该领域而言是巨大的胜利,因为两天前还完全是理论上的风险(模型可能被撤回),现在已经有了先例。 美国应当高度重视其中的博弈论风险,即在模型层而非应用层监管 AI,会促使其他国家更有动力开发“主权 AI”。如果一个模型随时可能对某国的用户或企业停用,那么依赖特定国家的技术将构成切实存在的风险。 因此,这会迫使主要国家走上自己的 AI 发展道路,从而随时间推移削弱美国在该技术栈中的领导地位。其他国家最可能依赖的解决方案是开源权重模型,而目前这类模型大多并非来自美国。 美国在决定如何以及在技术栈的哪个环节监管 AI 时,应当考虑所有这些连锁反应。同时,我们也应当大幅增加开源创新。
2026-06-14 · levie · 打开 ↗
能够针对特定任务调度最佳 AI 模型的“路由层”,其价值将大幅提升。原因至少有三点: * **成本优化**:许多场景需要顶尖模型处理特定任务,而其他任务则只需廉价模型。即使是同一任务,也可以用顶尖模型进行规划和审核,而将大部分工作交给开源或更便宜的模型。未来,这将成为大规模工作的标准模式。 * **能力最大化**:尽管模型整体都在向更强的方向进化,但它们之间仍存在显著差异。有的擅长工具调用,有的擅长编程,有的则在特定领域表现更佳。能够根据需求在不同模型间灵活切换,将是一个巨大的优势。 * **风险规避**:虽然 Fable 事件带有黑天鹅性质,但我们可能正走向一个监管环境,政府可能会基于审批机制或新发现,随时限制某些模型。这意味着,为了降低风险,你需要具备在不同供应商之间灵活部署工作负载的能力。 最终,能够实现模型间高效路由,将成为 AI 应用层日益重要的战略优势。非常期待看到这一领域的演进。
2026-06-14 · levie · 打开 ↗
大家都觉得这背后有什么深谋远虑或阴谋。但尝试“越狱”AI模型是很常规的操作,而且既然合作的初衷就是如此,他们理所当然会向政府分享研究成果。我觉得亚马逊没料到下一步会是这样。
2026-06-14 · levie · 打开 ↗
此次事件再次证明,更多价值正向具备“模型路由”能力的应用AI层聚集。 从经济效益来看,模型中立性极具吸引力,因为可以根据具体场景在顶尖模型与廉价模型间灵活切换;而随着AI监管时代的到来,政府可能随时封锁特定模型,这为模型中立提供了另一个强有力的理由。 将数据、工作流与底层智能解耦,将成为AI软件栈的一项战略优势。其后续演变非常值得关注。
2026-06-13 · levie · 打开 ↗
如果你好奇 AI 监管实施后会是什么样子,按照目前的趋势,这基本上就是未来的图景。 如果政府掌控了模型的发布权,企业将不得不花上数月时间与政府反复拉锯,讨论模型在特定场景下的风险,并就如何规避风险达成共识。 许多人认为这种互动机制很健康(这倒也无妨!),但考虑到 AI 模型的能力极其广泛且难以穷尽,这可能导致模型在最终发布前陷入无休止的博弈。最终结果很可能是 AI 进步速度的放缓,因为这种延迟会累积到研究环节,并拖慢现实应用场景的反馈循环。 无论你是否愿意,我们都已经跨过了那条“卢比孔河”,无法回头了。
2026-06-13 · levie · 打开 ↗
Fable出口管制事件实际上对监管讨论具有积极意义。它让我们提前窥见了,如果监管是在模型层而非具体应用层大规模实施,AI监管会变成什么样。 届时,政府将根据其掌控的各种因素,拥有决定模型何时向公众发布的绝对裁量权。 根据现有报道,此案的风险在于模型可能被“越狱”以增强网络攻击能力。但问题在于,我们也需要模型具备网络防御能力;而且从Anthropic的回应来看,目前在其他模型上已经可以实现这些功能了。 因此,面临的挑战在于:每当有新模型发布,你都必须与政府进行长达数月的博弈,去争论这些模型究竟具备何种能力以及存在何种风险。这不仅在风险判定上具有高度主观性,还涉及许多决定风险是否具有现实意义的其他复杂因素。 最终结果将是AI发布陷入积压,市场进展大幅放缓,AI行业会变得像其他那些僵化的行业一样。如果这种模式在三年前AI浪潮开启时就存在,我们现在的智能水平可能还停留在GPT-4阶段。
2026-06-13 · levie · 打开 ↗
这是 AI 监管的一个重大转折点。 政府开始判定某些模型对于特定用途而言过于强大,这为未来的各种管控措施开创了先例。 我个人认为这并无必要,监管重点应当是 AI 的应用而非底层模型。但同样地,也有很多人更倾向于这种结果。 无论如何,我们都不太可能回到那个政府对 AI 发展速度几乎没有实质性干预的世界了。
2026-06-13 · levie · 打开 ↗
这也太酷了吧
2026-06-13 · levie · 打开 ↗
太不可思议了。祝贺 @elonmusk 和整个 SpaceX 团队,用 25 年的血汗铸就了这家定义世界的公司。有这样推动未来的榜样,真是太棒了。其带来的深远影响将是巨大的。
2026-06-12 · levie · 打开 ↗
Box 最近对美、日、欧三地的 1640 名 IT 负责人进行了关于智能体 AI(Agentic AI)应用情况的调研。结果有很多亮点,其中最引人注目的一点是:AI 应用程度最高的公司,其扩招计划也最为积极。 虽然解读这些数据时需要考虑多种变量,但逻辑其实很直观:生产力最高的公司往往更有能力(也更有意愿)将收益重新投入业务,以持续扩大成果。 “AI 取代工作”这种论调的前提是假设公司的业务规模是固定的。但实际情况是,AI 正促使公司启动更多工程项目、拓展更多客户、通过自动化流程释放更多时间,等等。这一切最终都会创造出更多需要人类去完成的工作。
2026-06-12 · levie · 打开 ↗
大量证据显示,Fable 在编程(及相关)任务中的能力有了巨大飞跃。在复杂的知识型工作任务中,其准确率和成功率也实现了大幅跃升。 在我们的 Box AI 复杂工作评估中,我们将该模型与 Opus 4.8 进行了对比,发现它在几乎所有行业都表现出巨大的提升。在评估过程中,我们让使用 Fable 的 Box AI Agent 处理一系列涉及企业文档的真实、高难度的知识型工作问题,并对其任务执行情况进行评分。 Fable 与 Opus 4.8 的主要区别在于:它在复杂推理时不会走捷径,能正确完成多步计算,且多次运行的一致性显著更高。我们在媒体与娱乐(78% vs 61%)、技术(81% vs 73%)、金融服务(89% vs 83%)和医疗保健(66% vs 60%)领域看到了最显著的跨越。 具体案例包括: * **法律并购尽职调查**:在根据一家半导体公司的合同政策审查 NDA(保密协议)条款的任务中,Fable 正确识别出共同所有权条款违反了排他性要求,而责任上限在“超级上限例外(Super Cap exception)”条款下是允许的。Fable 得分为 100%,而 Opus 为 78%。 * **医疗保健**:在对 12 份报告进行的临床放射学错误审计中,Fable 精确地按严重程度对每个错误进行了分类,并正确得出不存在 3 级错误的结论。而 Opus 在证据不足的情况下,过早地将一个案例判定为“需要立即进行部门审查的重大错误”——Fable 得分为 63%,Opus 为 41%。 * **媒体与娱乐**...
2026-06-11 · levie · 打开 ↗
如果你正在打造一家应用型 AI 公司,这篇文章非常值得一读。 “应用型产品之所以能在‘难以被模型训练替代’的领域站稳脚跟,靠的是做那些不显眼的工作:梳理企业的私有数据与现状以便模型处理,为模型提供执行工具,并协助客户改变其员工的工作模式。能够完成这种‘衔接’的公司很难被模仿,而且这种衔接永无止境。只要客户关系还在,集成与维护就会一直持续;而这正是那些能将领域专家工程师和工具直接交付给客户的团队所能赢得的。” 模型能力与将其应用于特定企业工作流之间,仍存在着巨大的鸿沟。其中一部分需要构建技术,很大一部分在于获取并格式化正确的数据,而更多的工作则在于变革管理和具体的落地实施(如前线部署工程师等),以确保 AI 能在特定的企业环境中真正发挥作用。 以下两点可以同时成立:前沿模型和实验室的能力将持续爆发式增长,同时也会涌现出庞大的软件和服务公司生态,将这些模型的能力带入真实的商业企业。这为新的基础设施提供商、各垂直领域的应用型 AI 公司、新一代系统集成商以及更多参与者腾出了空间。 各个领域都令人无比兴奋。
2026-06-10 · levie · 打开 ↗
如果你觉得 AI 进步在放缓,这就是最好的回应。各项能力正迎来巨大飞跃,这将显著提升几乎所有知识型工作领域中 AI Agent 的表现。
2026-06-09 · levie · 打开 ↗
写得好。模型性能很大程度上取决于推理时的计算量,这意味着基于计算量归一化的基准测试是唯一的逻辑出路。 但挑战在于,这比看起来要难得多。因为投入多少计算量具有主观性,导致模型在不同阈值下的表现各异(简单来说,模型 X 的最低思考量可能优于模型 Y,但在高计算量下情况会反转),且可选的阈值几乎是无限的。 不过无论如何,向这个方向迈进将有助于更好地理解 AI 的进步。
2026-06-09 · levie · 打开 ↗
无论AI模型集成多少智能,都无法取代对上下文的需求。对于任何足够通用的AI,你始终需要引导它走向预期的方向,因为它的可能性是无限的。 只要律师、工程师、金融分析师或医疗专业人员使用同一个模型,且只要你试图完成任何具有差异化或特定性的任务,那么指令、领域背景和私有数据就必须进入模型的上下文窗口,模型才能发挥作用。 这也是为什么AI自动化并非“免费午餐”,以及为什么不同群体从AI中获益的程度存在巨大差异。你必须投入真正的努力,才能获得真正的价值。 这也是应用型AI在市场中的优势之一。在原始智能之上,任何能显著提升效率、让你“快人一步”的抽象层,都将持续具备价值。
2026-06-09 · levie · 打开 ↗
虽然这里的数字可能有些夸张,但可以肯定的是,未来一两年内,应用场景将在不同模型家族之间出现分层。 市场将出现分化:前沿模型将用于高端任务,而更廉价的模型则承接那些可以被分流的海量高频工作。由于需求驱动,前沿模型的规模仍将远超现状,但低端市场也会大幅扩张。 这里最重要的变化是:能够将工作负载高效路由到合适模型的“中间层”将变得愈发值钱,因为这已成为 AI Agent 面临的新难题之一。那些既能确保任务成功,又能实现成本优化的 Agent 编排技术,将占据极具优势的地位。
2026-06-08 · levie · 打开 ↗
市场对“AI 将吞噬企业级软件”的理解有误。过去,开发优秀的软件非常困难。的确,AI 让开发变得容易了一些,但要做出具备良好审美、差异化、高质量且安全的产品,依然很难。 但即便如此,这仅仅是构建企业级平台的其中一个环节。大多数企业软件公司的成本大头其实在于市场开拓(GTM)。因为规模化之后,多数企业软件领域都极难切入,需要大量的顾问式销售,以及针对方案实施与集成的支持。 AI 并未降低这类需求,在很多情况下反而要求更高,因为市场环境变得愈发拥挤复杂,买家的决策难度也随之增加。当你让某件事变得更廉价、更丰富时(如软件开发),如何被发现以及如何实现市场差异化(即 GTM)就会成为最难的挑战。
2026-06-07 · levie · 打开 ↗
这种动态与“SaaS末日论”的讨论略有相关。过去,开发优质软件非常困难。AI 让这件事变得容易了一些,但要做出有品位、有差异化、高质量且安全的产品,依然很难。 但即便如此,这仅仅是构建企业级平台的一个环节。大多数企业级软件公司的成本大头其实在于市场开拓(GTM)。因为规模化之后,大多数企业软件领域都很难切入,需要大量的顾问式销售,以及在方案实施和集成方面的支持。 AI 并未降低这种需求,在很多情况下反而增加了需求,因为市场环境变得更加拥挤复杂,买家更难做出选择。 软件行业似乎遵循某种“质量守恒定律”:如果你让某件事变得廉价且充裕(如开发),那么随之而来的新问题——如何被发现以及如何实现市场差异化(即 GTM)——成本反而会更高。
2026-06-07 · levie · 打开 ↗
Box 现已支持网页端 Markdown 编辑器、全面的 CLI 支持、评论功能和完整的版本历史。Box Drive 还支持将任何桌面客户端连接为挂载盘,让你能直接在 Claude Cowork、Codex、Obsidian、Cursor 或任何其他应用中即时处理所有文件。 https://twitter.com/levie/status/2063649508681224367/video/1
2026-06-07 · levie · 打开 ↗
Token 成本正成为我目前接触的所有企业中最热门的话题之一。这对整个 AI 行业是重大利好,因为这意味着这些系统的使用规模已超出了此前的预期。 这也为应用 AI 层催生了另一种差异化竞争方式:模型路由(model routing)。 随着 Token 占据了特定工作流中很大一部分成本,企业必然会希望确保每一分钱都能用于针对特定任务的最有效 Token 使用。 在编程、法律与金融分析、医疗等高端任务
2026-06-06 · levie · 打开 ↗
编程几乎是 AI 自动化能力的巅峰,但为了让 AI 智能体发挥效用,仍需人类工程师进行监管。 AI 模型是在海量复杂的代码上训练出来的;用户技术过硬,能快速掌握新工具;工作内容是“可验证”的,因为应用可以测试;产出结果往往与代码质量脱钩(代码写得烂,应用照样能跑);此外,智能体所需的上下文通常已数字化并存在于代码库中。 这些优势让 AI 编程智能体如虎添翼。虽然其中一些优势也适用于知识型工作,但在那些需要全面审核才能产生价值、或数据数字化程度较低的领域,大部分优势并不适用。这使得 AI 在知识型工作中的应用变得更加复杂。 既然在如此高的自动化程度下,工程师的需求依然旺盛,那么其他知识型工作面临的风险可能比预想的要小。AI 智能体会让人能做更多事情,但人并不会消失。
2026-06-06 · levie · 打开 ↗
Anthropic 的这篇文章发人深省。我认为这段话指出了 AI 乐观前景的核心要素: “由于 Anthropic 的员工在使用能力极强的模型,新想法、新计划、新工具和新模拟正呈爆炸式增长——其数量远超我们的执行能力。组织识别并解决这些瓶颈的速度可能会随时间提升,并可能成为任何组织最重要的技能。” AI 大幅降低了门槛,让我们能做更多事。因此,我们的想法远多于执行力;而对于想要实施的想法,我们最终受限于处理执行这些想法所需的配套工作能力。无论 AI 如何进步,这一挑战都无法消除。 AI 将让我们开发更多软件、开展更多营销、研发更多药物等等。所有这些工作,即便有智能体(agents)加持,最终仍需要人类来管理。
2026-06-05 · levie · 打开 ↗
Token 成本正成为我接触的企业中最热门的话题之一。这对 AI 行业整体而言是重大利好,因为这意味着这些系统的使用规模已超出了此前的预期。 这也为应用 AI 层催生了另一种差异化竞争形式,即“模型路由”。 随着 Token 占据了特定工作流中很大一部分成本,企业必然会希望确保每一分钱都能在处理特定任务时,实现 Token 的最高效利用。 在编程、法律与金融分析、医疗等高端任务中,顶尖模型始终不可或缺。但随着时间推移,你可以将单个任务拆分给低成本模型,从而实现更高效的最终结果。 为了有效实现这一点,应用 AI 层需要比任何人都更深入地理解其领域的业务流,并能针对不同任务灵活搭配模型。例如,在进行文档提取时,你需要知道哪些模型处理特定类型的文档效果更好;在进行法律分析时,你需要知道哪些模型最擅长处理各类任务,以此类推。 随着时间的推移,这将成为核心的差异化竞争点。那些拥有最强评估能力、最出色的工作负载路由能力,以及商业模式能直接契合客户财务目标的公司的,将占据巨大的优势。
2026-06-05 · levie · 打开 ↗
持续发布的就业数据表明,情况正朝着与许多人预期截然相反的方向发展。 以工程领域为例,这是受 AI 影响最大(且被认为风险最高)的领域。由于 AI 的助力,大多数公司的软件项目比以往任何时候都多,而实际上只有工程师能完成这些工作。 非技术人员或许能暂时构建软件,但最终总得有人去理解构建出的成果、进行维护、修复安全漏洞、升级底层系统等等。而这些全都是工作岗位。 将这一逻辑推广到其他职能:AI 会促使公司增加销售人员的招聘,因为 AI 代理能处理更多线索并进行更多客户调研;AI 也会引发营销岗位的爆发,因为活动投放和精准获客变得更加高效。以此类推。 AI 对就业的影响,将与许多人的预想截然不同。
2026-06-04 · levie · 打开 ↗
即便设有企业预算限制,AI Token 的支出也远超历史上任何软件支出的规模。通常,企业为每名员工每月支付的软件授权费仅为 10 到 50 美元,但现在为了提升生产力,愿意在 Token 上投入数百甚至数千美元。这足以说明企业级“智能”市场的潜在规模(TAM)有多么庞大。随着时间的推移,AI 市场将极大地扩张传统软件市场的规模。
2026-06-03 · levie · 打开 ↗
随着 Token 成本在运营支出中的占比不断提升,模型路由将成为必然趋势。这也是 AI 应用层未来实现差异化的核心领域之一。 通过理解特定领域的工作模式并建立强大的评估体系,你将能够实现高效的性价比优化。 在可预见的未来,大多数用例可能仍需顶尖模型的性能;但很快,一旦任务质量达标,你就能将特定的用例拆分出来,交给更低成本的模型处理。 企业很难在大规模应用中自行解决这一问题,因此,能够将工作流智能路由到合适模型层级的产品,将具备聚合更多需求的强大优势。
2026-06-03 · levie · 打开 ↗
进入 AI Agent 时代,一个核心问题是:当竞争对手拥有和你一样的 AI 模型和智能时,你该如何建立竞争优势? 未来能保持领先的企业,必然是那些能将内部机构知识、现有数据资产以及特定领域的业务流程与 AI 深度结合,并能高效利用这些资源的。 企业是选择自建技术栈,还是利用各类顶尖工具,这固然是一个核心变量。但关键在于,企业如何能够长期捕捉并保护由其独特的数据、流程和专业知识所创造的价值。每个行业都有其独特的路径,竞争优势也将因垂直领域而异。 我们在 Box 身上正日益看到这种趋势:客户希望在利用自身机构知识的同时,能够灵活地随时将任何 AI 模型和智能应用于其数据。这种模式将日益成为未来战略的核心原则。
2026-06-02 · levie · 打开 ↗
AWS 在企业市场表现强劲,拥有大量大额长期合同。因此,此次合作不仅扩大了 OpenAI 模型的覆盖范围,还可能带动所有模型提供商的 Token 消耗总量增长。
2026-06-02 · levie · 打开 ↗
这实际上是企业级 AI Agent 面临的首要问题。 随着我们从“智能编程”(上下文大多在代码库中,且用户具备技术能力,能轻松为 Agent 提供信息)转向“知识工作 Agent”时代,上下文缺失的问题将变得愈发严峻。 我们在 Box 的客户身上每天都能看到这一点。现有的数字化知识往往碎片化地分布在旧系统中,这些系统与 Agent 并不兼容,且其权限控制也无法匹配实际工作需求,这为 Agent 获取必要的上下文设置了巨大障碍。因此,所有这些内容都必须迁移到现代、安全的云环境中。 此外,企业往往尚未捕捉并数字化 Agent 工作所需的关键上下文。决策、流程和工作流通常存在于员工脑中或作为“集体经验”,需要将其转化为 Agent 可用的非结构化数据。 这实际上是应用型 AI 公司的巨大机遇所在,因为它们可以专注于为 Agent 提供精准的信息和领域专业知识。这也是为什么前线部署工程师(FDE)和新型系统集成商目前大有可为的原因之一。 能够解决这一问题的公司,将在未来从 AI 中获得最大的收益。
2026-06-01 · levie · 打开 ↗
再次强调,这或许有些反直觉,但在我与大型企业 CIO、CTO 和 CEO 的大多数交流中,他们要么正因 AI 而扩张(例如新增 FDE、工程等岗位),要么至少正将效率提升带来的结余重新投入到业务的新领域(如销售、市场等)。 高盛 CEO 大卫·所罗门(David Solomon)上周在《纽约时报》的一篇评论文章中对此表达得非常透彻:AI 热潮既在 AI 系统的构建和跨行业应用中创造了全新的岗位,也释放了资金,使其能够投入到那些此前资金不足或因 AI 而需求激增的领域。 大多数企业此前都受限于诸多因素:给定成本下的软件产出量、销售代表的人数、营销活动的规模、能否进行足够个性化的主动客户成功拓展、能否发现并预防业务风险,以及数百个其他环节。 当 AI 让这些事情变得更高效、更具规模时,资金就会重新流回业务。从长远来看,那些能更好地服务客户的公司将赢得竞争,而那些仅仅试图通过 AI 削减成本的公司,最终表现反而会更差。
2026-05-31 · levie · 打开 ↗
没有比一家公司斥资5亿美元打造自己的应用层更完美的广告了。显然,标题无法涵盖其中的复杂细节,但这足以让你极度看好软件行业。
2026-05-30 · levie · 打开 ↗
Opus 4.8 正式发布。我们已通过 Box AI 智能体,针对企业文档中最复杂的真实知识工作任务对其进行了测试。 Opus 4.8 在企业最关心的生成与分析任务(如撰写报告、综合数据、审查各行业复杂文档)方面表现出显著提升。以下是其对比 Opus 4.7 的优势示例: * **报告撰写**:Opus 4.8 在多数报告撰写任务中表现更佳,生成的分析报告更完整、更准确。在工业品报告任务中,得分从 Opus 4.7 的 77%
2026-05-28 · levie · 打开 ↗
把你在企业 AI 部署领域预估的人力需求乘以 10,再乘以 10。 在与各规模、各行业的 CIO 交流时,一个反复出现的核心话题是:让 AI Agent 在大规模生产环境和核心业务中落地的“实施鸿沟”。 当任务从实现一个简单的“大模型+搜索”聊天系统,转向连接到真实的生产系统时,虽然生产力提升会更显著,但风险也随之大幅增加,这需要开展一套全新的工作。 你必须确保数据得到妥善保护、更新访问控制、将旧系统迁移到现代平台、实现对 Agent 行为的可观测性、建立新工作流、确定“人机协作”的关键环节、推动新工作流的变革管理等等。 紧接着,模型能力会突然升级,你不得不把上述步骤重做一遍。你做过的工作有一半会过时,另一半则需要升级以利用新能力。或者,当 Token 预算告急时,你不得不将部分工作负载转移到更具成本效益的低成本模型上,而这又得重新走一遍上述流程。 企业正在努力寻找合适的岗位配置,以便在组织内实施这些系统,以确保……
2026-05-28 · levie · 打开 ↗
我接触到的许多硅谷以外的企业,普遍在采用 AI Agent 的同时也在积极招聘。 企业内部对技术和工程人才的需求正迎来巨浪,无论是开发软件,还是担任 Agent 的前沿开发工程师(FDE)。随着 AI 提升了客户生命周期等环节的效率,公司正更加重视面向客户的岗位。 如果 AI 能在无需人类监督的情况下包揽一切,那我们的讨论或许会完全不同。但 AI 并非如此。 即使在自动化潜力最大的领域,Agent 自动化的也是任务而非整个岗位。随着任务被自动化,人们需要引导 Agent、审核其工作、整合输出结果等。这一切都需要人来完成。 而对于自动化潜力较小的领域,公司正利用从其他环节节省下来的成本来增加招聘。 的确,AI 可以自动处理一线支持工单,但企业并不会只是单纯地增加利润,而是会将资金投入到销售和客户成功等新领域,以提升服务的差异化。 企业并非一成不变。它们在可以自动化的环节实现自动化,从而腾出资金投入到下一个关键领域。
2026-05-27 · levie · 打开 ↗
高盛首席执行官对“AI会取代工作”的悲观论调持不同看法。 如果你对比几十年前的工作,看到即便在AI出现之前,生产同样的东西已经变得如此高效便捷,你肯定也会认为工作迟早会被耗尽。 但事实是,我们对万物的需求在不断提高。我们不再满足于通过自动化来降低成本并提供同等价值,而是期待产品或服务能提供更多功能。因为市场中总有人利用自动化提升效率,从而拉高了所有人的预期,导致跟不上节奏的人无法竞争。 分析师提供的金融分析更深入了;法律咨询变得更全面了;金融服务更个性化了;原本以为无法自动化的细分领域也出现了更好的软件;医疗服务提供了更多的检测和更深度的建议。这种趋势循环往复,永无止境。 只有当你不再认为世界是静止不变的,你才能更清晰地预见AI将如何推动职业演变。
2026-05-25 · levie · 打开 ↗
CEO们特别容易陷入“AI 认知偏差”,因为他们离 AI 创造核心价值所需的“最后一公里”落地工作太远了。 因此,当他们试用 AI 时,看到的只是理想化的演示结果,却往往忽略了要让智能体实现稳定产出,后续还需要处理的十来个环节。 “看,我做了一个超棒的产品原型。”没错,但你不需要在上线前审查代码并修复一堆 Bug。 “看,我生成了一份合同。”没错,但你不需要在发给对方前核对所有条款,也不需要处理与历史合同的对接。 作为 CEO,最好的做法是大量、深度地使用 AI,去摸清智能体在企业中的真实影响,从而既能看到它的潜力,也能意识到落地它所需的巨大工作量。
2026-05-24 · levie · 打开 ↗
这篇文章写得极好,深入探讨了为什么工作不会像某些人预言的那样消失。我们常犯一个错误,即把“AI完成某项任务”误认为“AI能取代整个岗位”。 即使我们可以将工作中的一项或多项任务自动化,工作的定义也几乎不可避免地会随之扩展:要么是处理更多同类任务,要么是提升任务质量,要么是转向尚未被自动化的新领域。 由于能够处理更多任务或提升交付质量,工作将以全新的方式展现价值,并且在许多情况下,还会触达全新的受众群体。 无论是编程、法律、销售还是营销,情况皆是如此。那些想要承接大型软件项目的小型企业或非技术型公司,现在终于具备了这种能力,并会为此招人。以前请不起营销机构的小企业,现在可以雇佣或外包给一名营销人员,凭借 AI 智能体,他一个人就能发挥出过去整个机构的效能。以此类推。 不要掉入“混淆任务与岗位”的陷阱。
2026-05-23 · levie · 打开 ↗
这是 mythos 更新中的核心观点。这恰恰说明了为什么工程师永远不会被取代。 我们让制造和发现安全漏洞变得容易了许多,这意味着新的瓶颈在于我们实际审查、响应和修复漏洞的能力。 AI 远非能神奇地解决所有问题,保护系统仍需要大量的人工分级处理和人类判断来完成后续工作。因此,我们将迎来安全工程师的需求爆发期。 这又是杰文斯悖论的重演。
2026-05-23 · levie · 打开 ↗
我们正经历从廉价、小上下文窗口的 AI 对话工具,向具备超大上下文窗口、能处理长期任务、且推理成本高出一个数量级的 AI Agent(智能体)的转变,因为后者的性能更强。 这种演进速度远超大多数人的预期(除非你去年年中或年末一直密切关注,这里的许多人确实如此),而且现在的资金流入也变得更加实实在在。 接下来,AI 能力将持续进化,首先会被编程、科学、金融、咨询等前沿应用场景所采用,随后,部分任务会分流给足以胜任工作的低成本模型。以前我们认为 AI 的成本可能会收敛到统一的低价,但现在很明显,根据任务需求,成本分层正在进一步扩大。 这将是 AI 广泛普及过程中必须解决的又一个问题。企业需要建立专门的项目、新的财务团队和技术方案来应对。那些能帮助客户针对具体任务实现成本优化的实验室和平台,将占据最有利的位置。
2026-05-22 · levie · 打开 ↗
关于 FDE 的文章写得很好。如果你对这个职业感兴趣,一定要读读。只要 AI 保持快速迭代(这几乎是必然的),这个岗位就会一直存在。 人们常问,为什么这不像过去部署云技术那样简单? 因为云技术的普及影响的是相对集中的用户群体(开发者和 IT 人员),且通常不需要改变员工的基础工作流就能获益。最多参加一次培训就搞定了。 但对于 AI Agent 来说,落地实施不仅技术门槛极高,还会直接影响人们参与的基础工作流。这意味着伴随而来的不仅是大量的技术工作,还有大量的变革管理。 此外,云技术的更迭速度远没有现在这么快,因此有充足的时间让最佳实践得以传播。而现在,每一次模型升级,要么意味着能实现以前做不到的新功能,要么意味着现有的某些架构已经过时或成了累赘。 这就是为什么即便有客户内部的支持,让拥有成百上千次落地经验的厂商或合作伙伴来协助工作,通常也会更高效。 所以,这个岗位短期内不会消失,对于许多技术人才(尤其是职场新人)来说,这将是一条极佳的发展路径。
2026-05-21 · levie · 打开 ↗
随着企业深入应用AI,Token成本将成为核心议题。刚参加完一场世界500强企业CIO的晚宴,这正是讨论最激烈的话题。 目前各家都在尝试各种策略,但基本没人觉得自己找到了完美的解决方案。做法不一,包括:根据任务优先级分配不同模型、按用户类型分配不同性能的智能体、为各团队设置不同的支出上限、要求团队根据使用场景论证AI价值,甚至有些公司干脆放开权限。 在底层技术和成本模型不断演变的当下,大家都在努力寻找一种相对可预测的管理模式。
2026-05-20 · levie · 打开 ↗
Prism is open source · ⭐ Star on GitHub · about