Token不是万能标尺:效率、任务与隐藏成本
在AI时代,token已成为衡量模型使用量和成本的核心单位,尤其在行业早期阶段,dollar per token被广泛用于评估商业回报。Freda将其类比为工业时代的dollar per kilowatt-hour——即能耗产出比,强调单位输入的经济效率。但必须清醒认识到:token本身极具误导性,关键在于token per task。例如,完成同一段编程任务,高效模型可能仅需一两百行精炼代码,而低效模型可能输出数千行冗余内容,token消耗差几十倍甚至上百倍。
此外,reasoning tokens(推理中间过程)和agent workflow(智能体任务链)进一步放大差异:前者是用户不可见的内部计算,后者则像一个放大器,使token消耗呈指数级增长。正因如此,当前许多公司误将token用量等同于员工活跃度或生产力提升,实则可能只是低效模型在“虚耗”。
“我连这个都装不上,我什么都跟不上,不是要被时代淘汰了?”
“token和token不是一回事,就是这个事实。”
Token大爆炸会自行消停吗?投入结构与未来演变
AI总投入可拆解为:用户数 × 每用户任务数 × token per task × dollar per token。其中,用户数与任务量必然大幅增长——从程序员扩展到白领,如Anthropic的CoWork展现出比早期Slack更陡峭的增长曲线。但后两项存在显著优化空间:一方面,更高效的模型将逐步胜出;另一方面,dollar per token的实际成本常被高估,如Atropi的opus模型名义报价为$5/$25 per million tokens,但因高缓存命中率(98%–99%)及adaptive workflow设计,实际成本可能低至$1。
Freda指出,当前处于“Tokenmaxxing”的浪费阶段,但这与token总量持续上升并不矛盾:效率提升 ≠ 总量下降,而是“总量涨得更快,但单位效率也涨”。未来收费模式将从按token转向按效果付费——如客服公司Sierra采用“解决才收费”机制,按问题复杂度与解决率分级计价,实现客户与服务商的利益高度一致。
“我现在看到的AI spend大概对应1%–2%的EBITDA,目前还算是可控的。”
Anthropic的壁垒:当AI开始训练AI
过去两年,模型领先优势常是“滚动式”的——今天领先者,几个月后可能被超越。但Freda认为,coding agent的成熟正在改变这一规则,催生一种递归自增强循环(recursive self improvement):更强的AI能辅助构建下一代更强的AI。这一闭环一旦启动,将极大加速迭代速度——从早期模型对工程师TPF提升5%→15%→20%+,到如今新模型月更,而非过去数月甚至一年一更。
正因如此,像Meta这样规模的公司愿斥资数十亿美元采购外部模型——不是为炫耀算力,而是为不被甩出迭代节奏。Freda判断,当前尚处该拐点的早期阶段(约始于2024年1月),虽未达“奇点”,但领先者若持续跑赢,追赶者将极难翻盘。他坦言:“现在的发展速度已经非常非常快了。”
XAI的商业策略:租用闲置算力的理性选择
XAI 将其数据中心之一租给 Atropac,并非如部分媒体所言“彻底放弃模型训练”,而是一项理性且高性价比的商业决策。XAI 实际拥有三个数据中心:Classes(基于 H100,主要用于推理)、Macro Hard 和 Macro Harder(均基于 Blackwell 芯片,用于训练)。其中 Classes 容量约 300 兆瓦(MW),仅占其整体算力的约 20%,但可带来 40–50 亿人民币级别的年收入,尤其面向当前最缺算力的 企业级客户。这一操作既盘活了低频资产,又未影响其核心训练能力。
“XAI 是有三个 data center 的,有什么 classes,有 Macro Hard,还有第三个它叫 Macro Harder……所以他实际上是把自己现在就是不太用的一个,然后租给就是最缺卡的 enterprise。”
“大概能租出就是四五十亿的收入,所以其实是一个非常 make sense 的一个一个商业决策。”
Meta的AI变现困局与组织效率新挑战
Meta 当前面临两大核心问题:一是年底冲击对标 Gemini 2.5 的 SOTA 模型;二是如何真正实现 AI 收入的突破。其可能路径包括:持续推广 Meta AI App、推出 Open Cloud 或“小龙虾助手”,以及探索将内部使用的 Cody 模型对外商业化。但关键在于:能否产生“额外”的 AI 收入,而非仅替代原有产品线。
更深层的冲击来自 AI 对传统软件公司组织逻辑的颠覆。以 Anthropic 为例:3000 人规模下,人均创收可达千万美元级,远超传统软件公司(如 Salesforce 人均约 50 万美元),且其产品(如 CoWork、Skills)对普通用户门槛高,却仍被广泛自发使用——这说明:用户对智能体的内在需求远超预期,销售驱动模式正被“自驱式采用”部分替代。
“Unprofit 其实也是一个 To B 的公司,它百分之八十都是企业的这个用户,员工就只有三千人……Anthropic每个员工应该能对应就是上千万美金的收入,就差了就是一个数量级。”
“你再看这个八万员工,就还是会觉得很神奇……就为什么这整个 Meta 团队……还都是比较忙碌的一个状态。”
AI重构软件本质:从UI到决策流的范式迁移
AI 对软件行业的冲击,核心在于它重新定义了“价值载体”:传统软件依赖高 UI 复杂度(如电子签、BI 工具、项目管理工具 Monday)最易被取代;而数据结构混乱、语义丰富的工具(如 Excel)反而更具韧性——并非因为功能不可替代,而是因为其“低结构化”天然构成护城河。
Office 套件短期内仍有价值,因其本质是一套协作流水线:只要其中任一环节需人工干预,人类仍偏好直接操作 PowerPoint/Excel;但若全程由 AI 编排、仅需审批,则其存在必要性将被重估。
更关键的机会在于:AI 可记录并复现企业决策过程。传统 CRM 记录“打了 25% 折扣”,却无法保存“为何是 25% 而非 30%”“CFO 有何顾虑”“谁说服了谁”等非结构化决策信息。AI 能直接处理原始对话、邮件、会议记录,使“决策日志”成为新软件核心——这将催生新一代 AI-native 决策支持系统。
此外,Agent 需要全新的交互基础设施:Slack 的 HTTP 协议对人类足够,但对 Agent 来说延迟高、状态难维持;而 Discord 的 WebSocket 架构更适配 Agent 的实时、持久、异步需求——未来或出现“为 Agent 重写”的通信协议,甚至被模型公司收购整合。
“AI 来了之后,我觉得挺值得思考,就是组织架构应该什么样子,然后以及一个公司到底需要多少人?”
“把电机塞进蒸汽机……一直是到流水线形成了,其实那个时代的这个就生产率才上去。”
生产力悖论与AI当前阶段
历史上曾多次出现技术普及初期与宏观生产率提升脱节的现象。例如在八十年代至九十年代初,计算机已在银行、办公室广泛部署,员工普遍感觉工作效率提升,但整体生产率却无明显增长——这一现象被经济学家称为“生产力悖论”。直到九十年代中后期,像沃尔玛、亚马逊等企业开始围绕计算机与网络重新设计业务流程,引入企业数据库、早期ERP系统及智能供应链管理,才真正释放出技术红利,推动生产率跃升。
这与当下AI的发展阶段高度相似:我们正处在“把电机塞进蒸汽机”的过渡期——人们将AI工具嵌入现有工作流,却尚未质疑流程本身为何如此设计。例如,为什么Meta需要八万人?为什么层级结构如此复杂?这些根本性问题仍未被重新审视。
“就像在不停的在解决问题打地鼠一样,就是我觉得实际上是整个流程都需要重新设计。”
“之前可能是一棒一棒的这种,就是接力赛吧,然后之后可能更像是一个小团体的这种……篮球赛。”
组织形态的底层逻辑与未来重构
公司层级常被理解为权力结构,但其深层功能实为信息传递机制:随着组织扩大,个体无法掌握全局,因此需通过管理层对信号进行收集、综合、提炼与翻译,实现上下双向的信息搬运。会议、进度同步、季度对齐等,本质上都是为降低人际沟通成本而生的制度设计。
AI的引入正逐步暴露各环节的翻译成本瓶颈:开发效率提升后,QA成为新瓶颈;QA精简后,PM设计环节拖慢节奏;最终GTM(上市策略)又成为制约点——整个流程如同“打地鼠”,局部优化无法替代系统性重构。
未来组织或将从“接力赛”转向“小队篮球赛”:3–5人跨职能小团队具备完整决策能力,仅重大问题才向上汇报;QA嵌入开发、PM更全能、角色边界模糊化将成为常态。尽管目前尚无广泛认可的成功转型案例,但趋势已清晰:企业将因AI获得“上帝视角”——通过整合客户交互、CRM历史、实时对话等数据,Agent可为员工提供精准决策支持,使组织更“活”、响应更敏捷。
“你就会发现这个前面的这个这个 P M 这个设计又成了新的 bottleneck,变成了最花时间的地方……所以就是……整个流程都需要重新设计。”
AI对投资行业的重塑
投资行业是典型的低效信息密集型领域:大量时间消耗于信息收集、数据清洗、预期比较与仓位判断。若向AI提供干净、结构化的目标定义(如持仓周期、收益目标、回撤容忍度、出手标准),理论上其表现将远超人类——当前未实现,主因是人类自身思维尚未被彻底解构。
主要挑战在于数据碎片化:财务数据看似标准化,实则需对接十几至二十家数据供应商才能拼凑完整视图;更关键的是对市场参与者行为逻辑的理解缺失。以美股为例:量化交易占60–70%,散户占30%,传统机构交易量占比极小;而真正影响方向的是散户与中频量化的互动。
散户行为存在明显规律:偏好低PE、高叙事张力(如创始人故事)、低绝对股价(如$8 vs $800),且本质是“追涨者”。未来,散户将更趋机构化,行为更复杂;市场将呈现风格化、主题化、叙事驱动化趋势——机构需向散户学习,而非单向教育。
AI将加速信息定价效率:事件驱动型交易(如合作公告、财报发布)的股价调整可能从“数日”缩至“瞬间”,Alpha来源将从“早发现”转向“深理解”;同时,跨行业研究能力将成为核心竞争力——中小盘、冷门赛道的Alpha将迅速被AI覆盖。
“我觉得未来不再是一个机构教育散户,而是说机构也要向散户学习……散户本来就是你价格形成的一部分。”
模型公司吞噬一切,应用公司的生存空间
当前AI基础设施层正经历剧烈整合:OpenAI与Anthropic等模型公司正快速向垂直领域渗透,不仅推出自有音频模型(如即将上线的Audio Model),还与多家私募基金合作,将模型直接部署至被投企业——这将引发一波大规模的企业级模型落地潮。在此背景下,应用层公司面临严峻挑战:模型公司‘四处开战’,正在系统性地‘吞噬’应用层价值。
部分应用公司试图通过行业壁垒(如法律领域的强监管、合规要求)或长尾场景(如客服中的‘拉 smile’需求)构建护城河。但这类策略存在局限性:仅依赖合规或处理边缘需求,无法捕获最大价值,长期利润率也难以提升。正如一位法律科技创业者所言:
‘律所会非常担心模型出这个hallucination,所以不能用今天的大模型直接去做应用。’
‘如果你只是依赖于一个合规,或者说你只是去处理,拉 smile的这个工作,其实你并不能吃到就是最大最肥的这块价值。’
VC新焦点:New Labs与Agent基础设施
VC投资主线已悄然转向:‘New Labs’——即从大模型实验室出走的研究员创办的新实验室——成为硅谷最热的投资主题。这一趋势背后是清晰的经济逻辑:OpenAI与Anthropic估值逼近万亿美元,投资人希望在更早期阶段博取更高回报;同时,硅谷长期存在的‘acquire hire’文化(优秀人才终将被顶级实验室挖走)为早期投资提供了良好退出路径。
从基金运作角度看,VC对New Labs采取分散押注策略:单家融资额较高(通常数千万美元),基金整体需覆盖4–5家,总投资额约2亿美元;若基金规模达数亿级,则具备系统性布局该赛道的能力。此外,推理优化与模型降本相关创业公司同样炙手可热,而另一条值得关注的主线是Agent基础设施:因Agent行为模式与人类不同(如高频调用Gmail API易被封禁),催生了Agent Mail、Agent Phone等专用工具,未来Email、支付、身份认证、合规等基础设施将被全面重构。
‘硅谷的那个投资主题变成了 new labs,这本身说明什么呀?’
‘你这一家你根本选不出来。所以我要放,大概是放,比如说啊,就四五家,然后每一家我如果放五千万,那我就是大概两个亿的这个总投资。’
Agent商业化的现实落点与系统性风险
Agent商业化路径正从To C向To B迁移:To C消费场景价值有限(用户愿为娱乐停留,AI代下单边际效用低),而To B高复杂度流程(如跨境电商采购)天然适配Agent——涉及定价、折扣、认证、合规、付款条款等多维变量,沟通成本极高,正是Agent发挥推理与协调能力的理想场景。
与此同时,自动驾驶与机器人领域进展不及预期:自动驾驶方面,英伟达开源模型AlphaMind若成功,或成为‘车厂的安卓系统’,推动行业快速普及;机器人则受限于缺乏清晰的scaling law(训练损失曲线不干净、跨任务泛化不足),硬件层面亦需反复迭代(厂商纷纷赴深圳取经),整体仍处‘feature强化’阶段。
更值得警惕的是系统性风险:云厂商自由现金流将在2027年前转负。当前全球AI资本开支已超万亿美元(仅表内),叠加长协订单与隐性支出,Capex曲线持续上修;尽管云厂商(如谷歌、亚马逊)已实现2年回本的投资回报,但云业务本身价值链正在稀释——上层软件毛利被模型公司截取,而OpenAI、XAI等新玩家加入更加剧竞争。芯片领域亦现战略转向:谷歌TPU开始对外商用,亚马逊自研芯片年收入已达2000亿美元量级,云厂商正从‘使用者’蜕变为‘硬件供应商’。
‘你按照今天的这个开拍,就是资本开支这个曲线走下去,到二七年。你几家就是大的厂商的这个叫我们叫现金流,就自由现金流都会转成是负的。’
‘云这个生意本身,我还是觉得是变差了的……价值的这概念……被模型公司是去拿走了的。’
IPO洪流与资金轮动
当前市场正迎来一波超大型IPO潮,包括SpaceX、Dropbox和OpenAI等,合计规模可能达到四万亿美元级别。按5%的融资比例估算,新增融资约两千亿美元,流通盘约四千亿美元。从市场容量角度看,全球主动型股票基金账上现金约一万亿美元,叠加散户、主权基金与对冲基金的资金,整体承接能力尚可。但真正挑战在于资金轮动:新IPO受捧可能挤压现有“七巨头”(Mac Seven)的估值空间;尤其当部分公司已进入负现金流阶段,市场对盈利可持续性的担忧将加剧。
“如果你抱听这个想法,你是arrogant,然后也不是open minded。”
“历史上人类真的经历了很多巨变。今天我们会觉得AI这种,对吧?很多不确定性,很大的压迫感。但如果真的和当年就工业化取代手工农业对农民的震撼相比,我觉得是不是一个量级的?”
裁员潮与就业焦虑的再审视
大规模裁员对每股收益(EPS)的提升作用有限——例如20%的裁员仅可能带来Mac Seven公司约5%-10%的EPS增长;但对人力密集型SaaS企业(如Salesforce),同等裁员可带来40%-50%的EPS跃升。这引发更深层的结构性焦虑:当AI驱动的效率提升无法快速转化为终端收入,市场将质疑“钱从哪里出”。尽管Anthropic等公司已展现良好收入,但其收入多来自B端生态,真正的AI原生收入尚未大规模显现。
“我倾向于觉得会变化会快很多。”
“所以这个平权会以一种非常就是痛苦,这个非常 painful 的方式,在这个社会中间去去实现。”
孤独时代的连接重构
技术迭代加速带来持续的信息过载焦虑:新模型、新工具、新API层出不穷,连安装OpenCloud都可能引发“是否被时代淘汰”的自我怀疑。这种焦虑并非个体特有,而是时代性特征——当不确定性成为常态,人对掌控感的渴求反而更强烈。有趣的是,AI正在掏空以信息交换为目的的对话价值:90%以上的事实性内容可由模型直接提供,且更高效。于是,人与人之间所剩的,只剩下情感连接——那些关于勇气、遗憾、在乎与闪光瞬间的对话,虽无信息增量,却构成最真实、最珍贵的体验。
“所以当这个剧情不管是按哪条路展开的时候,在心理上和这个组合上面都能准备好,都能快速调整。我觉得这个就是能做的事情了。”
当对话回归人味
在信息高度可预测的时代——比如会议前充分准备后,对方陈述的事实性内容往往可以被提前预判——真正稀缺的,反而是无预设、无功利目的的真诚对话。作者回忆起一次在 Paluto 与朋友的随意闲聊:本无明确议题,却自然延伸至“做事情的勇气”“人生遗憾”“我在乎什么”以及“有没有什么东西让我觉得有火花(spark)”。这次对话之所以珍贵,并非因其信息增量,而在于其‘人味’本身。它让作者意识到,自己已悄然划下一条清晰界限:涉及信息、知识与分析的任务,可放心交由 AI;而‘见人’这件事,反而需要回归最朴素的观察、倾听与袒露。若连倾诉尴尬、脆弱甚至羞于启齿的内容(如“装 Open Call 没有装上,然后痛哭”)都成为稀缺行为,那对话便失去了不可替代性——毕竟,“两个人都去跟 AI 聊一聊,会效果会更好”。
‘他没有给我任何信息上的增量,但就是比较有人味儿吧’ ‘我觉得这也是我们这档节目的初衷……希望能够和听众之间形成一些真实的、真诚的连接’
语言的双重使命
‘语言及世界工作室’这一名称,在初听时或许平淡无奇;但结合当下语境,它显露出深刻的时代隐喻:在 AI 时代,语言的‘信息翻译与传递’功能正被自动化接管,而‘建立人与人之间真实连接’的功能却愈发珍贵。作者判断,AI 将接管大量公开、结构化信息的处理,而人类语言中那些承载情感、脆弱性与主体性的部分——那些‘说出来会有点不好意思的东西’——将成为人与人之间不可被代理、不可被压缩的核心价值。这不仅是对播客初衷的重申,更是一种对语言本质的再确认:当世界被数据化,语言的温度反而成为我们抵抗异化的锚点。因此,工作室的命名本身,便是一声宣言:我们选择在‘语言’中重建‘世界’,而非仅传递它的副本。
‘今天社会很多时候语言都是被用来……翻译信息、传递信息的……AI会去做掉这部分的工作。但是,语言很多时候还会被用来就真正建立人与人之间的联系。我觉得这个是会越来越宝贵的这么一个东西。’