141. Freda的投资札记第2集：Tokenmaxxing、把电机塞进蒸汽机、接力赛变篮球赛、孤独、人的连接

Token不是万能标尺：效率、任务与隐藏成本

在AI时代，token已成为衡量模型使用量和成本的核心单位，尤其在行业早期阶段，dollar per token被广泛用于评估商业回报。Freda将其类比为工业时代的dollar per kilowatt-hour——即能耗产出比，强调单位输入的经济效率。但必须清醒认识到：token本身极具误导性，关键在于token per task。例如，完成同一段编程任务，高效模型可能仅需一两百行精炼代码，而低效模型可能输出数千行冗余内容，token消耗差几十倍甚至上百倍。

此外，reasoning tokens（推理中间过程）和agent workflow（智能体任务链）进一步放大差异：前者是用户不可见的内部计算，后者则像一个放大器，使token消耗呈指数级增长。正因如此，当前许多公司误将token用量等同于员工活跃度或生产力提升，实则可能只是低效模型在“虚耗”。

“我连这个都装不上，我什么都跟不上，不是要被时代淘汰了？”

“token和token不是一回事，就是这个事实。”

Token大爆炸会自行消停吗？投入结构与未来演变

AI总投入可拆解为：用户数 × 每用户任务数 × token per task × dollar per token。其中，用户数与任务量必然大幅增长——从程序员扩展到白领，如Anthropic的CoWork展现出比早期Slack更陡峭的增长曲线。但后两项存在显著优化空间：一方面，更高效的模型将逐步胜出；另一方面，dollar per token的实际成本常被高估，如Atropi的opus模型名义报价为$5/$25 per million tokens，但因高缓存命中率（98%–99%）及adaptive workflow设计，实际成本可能低至$1。

Freda指出，当前处于“Tokenmaxxing”的浪费阶段，但这与token总量持续上升并不矛盾：效率提升 ≠ 总量下降，而是“总量涨得更快，但单位效率也涨”。未来收费模式将从按token转向按效果付费——如客服公司Sierra采用“解决才收费”机制，按问题复杂度与解决率分级计价，实现客户与服务商的利益高度一致。

“我现在看到的AI spend大概对应1%–2%的EBITDA，目前还算是可控的。”

Anthropic的壁垒：当AI开始训练AI

过去两年，模型领先优势常是“滚动式”的——今天领先者，几个月后可能被超越。但Freda认为，coding agent的成熟正在改变这一规则，催生一种递归自增强循环（recursive self improvement）：更强的AI能辅助构建下一代更强的AI。这一闭环一旦启动，将极大加速迭代速度——从早期模型对工程师TPF提升5%→15%→20%+，到如今新模型月更，而非过去数月甚至一年一更。

正因如此，像Meta这样规模的公司愿斥资数十亿美元采购外部模型——不是为炫耀算力，而是为不被甩出迭代节奏。Freda判断，当前尚处该拐点的早期阶段（约始于2024年1月），虽未达“奇点”，但领先者若持续跑赢，追赶者将极难翻盘。他坦言：“现在的发展速度已经非常非常快了。”

XAI的商业策略：租用闲置算力的理性选择

XAI 将其数据中心之一租给 Atropac，并非如部分媒体所言“彻底放弃模型训练”，而是一项理性且高性价比的商业决策。XAI 实际拥有三个数据中心：Classes（基于 H100，主要用于推理）、Macro Hard 和 Macro Harder（均基于 Blackwell 芯片，用于训练）。其中 Classes 容量约 300 兆瓦（MW），仅占其整体算力的约 20%，但可带来 40–50 亿人民币级别的年收入，尤其面向当前最缺算力的 企业级客户。这一操作既盘活了低频资产，又未影响其核心训练能力。

“XAI 是有三个 data center 的，有什么 classes，有 Macro Hard，还有第三个它叫 Macro Harder……所以他实际上是把自己现在就是不太用的一个，然后租给就是最缺卡的 enterprise。”

“大概能租出就是四五十亿的收入，所以其实是一个非常 make sense 的一个一个商业决策。”

Meta的AI变现困局与组织效率新挑战

Meta 当前面临两大核心问题：一是年底冲击对标 Gemini 2.5 的 SOTA 模型；二是如何真正实现 AI 收入的突破。其可能路径包括：持续推广 Meta AI App、推出 Open Cloud 或“小龙虾助手”，以及探索将内部使用的 Cody 模型对外商业化。但关键在于：能否产生“额外”的 AI 收入，而非仅替代原有产品线。

更深层的冲击来自 AI 对传统软件公司组织逻辑的颠覆。以 Anthropic 为例：3000 人规模下，人均创收可达千万美元级，远超传统软件公司（如 Salesforce 人均约 50 万美元），且其产品（如 CoWork、Skills）对普通用户门槛高，却仍被广泛自发使用——这说明：用户对智能体的内在需求远超预期，销售驱动模式正被“自驱式采用”部分替代。

“Unprofit 其实也是一个 To B 的公司，它百分之八十都是企业的这个用户，员工就只有三千人……Anthropic每个员工应该能对应就是上千万美金的收入，就差了就是一个数量级。”

“你再看这个八万员工，就还是会觉得很神奇……就为什么这整个 Meta 团队……还都是比较忙碌的一个状态。”

AI重构软件本质：从UI到决策流的范式迁移

AI 对软件行业的冲击，核心在于它重新定义了“价值载体”：传统软件依赖高 UI 复杂度（如电子签、BI 工具、项目管理工具 Monday）最易被取代；而数据结构混乱、语义丰富的工具（如 Excel）反而更具韧性——并非因为功能不可替代，而是因为其“低结构化”天然构成护城河。

Office 套件短期内仍有价值，因其本质是一套协作流水线：只要其中任一环节需人工干预，人类仍偏好直接操作 PowerPoint/Excel；但若全程由 AI 编排、仅需审批，则其存在必要性将被重估。

更关键的机会在于：AI 可记录并复现企业决策过程。传统 CRM 记录“打了 25% 折扣”，却无法保存“为何是 25% 而非 30%”“CFO 有何顾虑”“谁说服了谁”等非结构化决策信息。AI 能直接处理原始对话、邮件、会议记录，使“决策日志”成为新软件核心——这将催生新一代 AI-native 决策支持系统。

此外，Agent 需要全新的交互基础设施：Slack 的 HTTP 协议对人类足够，但对 Agent 来说延迟高、状态难维持；而 Discord 的 WebSocket 架构更适配 Agent 的实时、持久、异步需求——未来或出现“为 Agent 重写”的通信协议，甚至被模型公司收购整合。

“AI 来了之后，我觉得挺值得思考，就是组织架构应该什么样子，然后以及一个公司到底需要多少人？”

“把电机塞进蒸汽机……一直是到流水线形成了，其实那个时代的这个就生产率才上去。”

生产力悖论与AI当前阶段

历史上曾多次出现技术普及初期与宏观生产率提升脱节的现象。例如在八十年代至九十年代初，计算机已在银行、办公室广泛部署，员工普遍感觉工作效率提升，但整体生产率却无明显增长——这一现象被经济学家称为“生产力悖论”。直到九十年代中后期，像沃尔玛、亚马逊等企业开始围绕计算机与网络重新设计业务流程，引入企业数据库、早期ERP系统及智能供应链管理，才真正释放出技术红利，推动生产率跃升。

这与当下AI的发展阶段高度相似：我们正处在“把电机塞进蒸汽机”的过渡期——人们将AI工具嵌入现有工作流，却尚未质疑流程本身为何如此设计。例如，为什么Meta需要八万人？为什么层级结构如此复杂？这些根本性问题仍未被重新审视。

“就像在不停的在解决问题打地鼠一样，就是我觉得实际上是整个流程都需要重新设计。”

“之前可能是一棒一棒的这种，就是接力赛吧，然后之后可能更像是一个小团体的这种……篮球赛。”

组织形态的底层逻辑与未来重构

公司层级常被理解为权力结构，但其深层功能实为信息传递机制：随着组织扩大，个体无法掌握全局，因此需通过管理层对信号进行收集、综合、提炼与翻译，实现上下双向的信息搬运。会议、进度同步、季度对齐等，本质上都是为降低人际沟通成本而生的制度设计。

AI的引入正逐步暴露各环节的翻译成本瓶颈：开发效率提升后，QA成为新瓶颈；QA精简后，PM设计环节拖慢节奏；最终GTM（上市策略）又成为制约点——整个流程如同“打地鼠”，局部优化无法替代系统性重构。

未来组织或将从“接力赛”转向“小队篮球赛”：3–5人跨职能小团队具备完整决策能力，仅重大问题才向上汇报；QA嵌入开发、PM更全能、角色边界模糊化将成为常态。尽管目前尚无广泛认可的成功转型案例，但趋势已清晰：企业将因AI获得“上帝视角”——通过整合客户交互、CRM历史、实时对话等数据，Agent可为员工提供精准决策支持，使组织更“活”、响应更敏捷。

“你就会发现这个前面的这个这个 P M 这个设计又成了新的 bottleneck，变成了最花时间的地方……所以就是……整个流程都需要重新设计。”

AI对投资行业的重塑

投资行业是典型的低效信息密集型领域：大量时间消耗于信息收集、数据清洗、预期比较与仓位判断。若向AI提供干净、结构化的目标定义（如持仓周期、收益目标、回撤容忍度、出手标准），理论上其表现将远超人类——当前未实现，主因是人类自身思维尚未被彻底解构。

主要挑战在于数据碎片化：财务数据看似标准化，实则需对接十几至二十家数据供应商才能拼凑完整视图；更关键的是对市场参与者行为逻辑的理解缺失。以美股为例：量化交易占60–70%，散户占30%，传统机构交易量占比极小；而真正影响方向的是散户与中频量化的互动。

散户行为存在明显规律：偏好低PE、高叙事张力（如创始人故事）、低绝对股价（如$8 vs $800），且本质是“追涨者”。未来，散户将更趋机构化，行为更复杂；市场将呈现风格化、主题化、叙事驱动化趋势——机构需向散户学习，而非单向教育。

AI将加速信息定价效率：事件驱动型交易（如合作公告、财报发布）的股价调整可能从“数日”缩至“瞬间”，Alpha来源将从“早发现”转向“深理解”；同时，跨行业研究能力将成为核心竞争力——中小盘、冷门赛道的Alpha将迅速被AI覆盖。

“我觉得未来不再是一个机构教育散户，而是说机构也要向散户学习……散户本来就是你价格形成的一部分。”

模型公司吞噬一切，应用公司的生存空间

当前AI基础设施层正经历剧烈整合：OpenAI与Anthropic等模型公司正快速向垂直领域渗透，不仅推出自有音频模型（如即将上线的Audio Model），还与多家私募基金合作，将模型直接部署至被投企业——这将引发一波大规模的企业级模型落地潮。在此背景下，应用层公司面临严峻挑战：模型公司‘四处开战’，正在系统性地‘吞噬’应用层价值。

部分应用公司试图通过行业壁垒（如法律领域的强监管、合规要求）或长尾场景（如客服中的‘拉 smile’需求）构建护城河。但这类策略存在局限性：仅依赖合规或处理边缘需求，无法捕获最大价值，长期利润率也难以提升。正如一位法律科技创业者所言：

‘律所会非常担心模型出这个hallucination，所以不能用今天的大模型直接去做应用。’

‘如果你只是依赖于一个合规，或者说你只是去处理，拉 smile的这个工作，其实你并不能吃到就是最大最肥的这块价值。’

VC新焦点：New Labs与Agent基础设施

VC投资主线已悄然转向：‘New Labs’——即从大模型实验室出走的研究员创办的新实验室——成为硅谷最热的投资主题。这一趋势背后是清晰的经济逻辑：OpenAI与Anthropic估值逼近万亿美元，投资人希望在更早期阶段博取更高回报；同时，硅谷长期存在的‘acquire hire’文化（优秀人才终将被顶级实验室挖走）为早期投资提供了良好退出路径。

从基金运作角度看，VC对New Labs采取分散押注策略：单家融资额较高（通常数千万美元），基金整体需覆盖4–5家，总投资额约2亿美元；若基金规模达数亿级，则具备系统性布局该赛道的能力。此外，推理优化与模型降本相关创业公司同样炙手可热，而另一条值得关注的主线是Agent基础设施：因Agent行为模式与人类不同（如高频调用Gmail API易被封禁），催生了Agent Mail、Agent Phone等专用工具，未来Email、支付、身份认证、合规等基础设施将被全面重构。

‘硅谷的那个投资主题变成了 new labs，这本身说明什么呀？’

‘你这一家你根本选不出来。所以我要放，大概是放，比如说啊，就四五家，然后每一家我如果放五千万，那我就是大概两个亿的这个总投资。’

Agent商业化的现实落点与系统性风险

Agent商业化路径正从To C向To B迁移：To C消费场景价值有限（用户愿为娱乐停留，AI代下单边际效用低），而To B高复杂度流程（如跨境电商采购）天然适配Agent——涉及定价、折扣、认证、合规、付款条款等多维变量，沟通成本极高，正是Agent发挥推理与协调能力的理想场景。

与此同时，自动驾驶与机器人领域进展不及预期：自动驾驶方面，英伟达开源模型AlphaMind若成功，或成为‘车厂的安卓系统’，推动行业快速普及；机器人则受限于缺乏清晰的scaling law（训练损失曲线不干净、跨任务泛化不足），硬件层面亦需反复迭代（厂商纷纷赴深圳取经），整体仍处‘feature强化’阶段。

更值得警惕的是系统性风险：云厂商自由现金流将在2027年前转负。当前全球AI资本开支已超万亿美元（仅表内），叠加长协订单与隐性支出，Capex曲线持续上修；尽管云厂商（如谷歌、亚马逊）已实现2年回本的投资回报，但云业务本身价值链正在稀释——上层软件毛利被模型公司截取，而OpenAI、XAI等新玩家加入更加剧竞争。芯片领域亦现战略转向：谷歌TPU开始对外商用，亚马逊自研芯片年收入已达2000亿美元量级，云厂商正从‘使用者’蜕变为‘硬件供应商’。

‘你按照今天的这个开拍，就是资本开支这个曲线走下去，到二七年。你几家就是大的厂商的这个叫我们叫现金流，就自由现金流都会转成是负的。’

‘云这个生意本身，我还是觉得是变差了的……价值的这概念……被模型公司是去拿走了的。’

IPO洪流与资金轮动

当前市场正迎来一波超大型IPO潮，包括SpaceX、Dropbox和OpenAI等，合计规模可能达到四万亿美元级别。按5%的融资比例估算，新增融资约两千亿美元，流通盘约四千亿美元。从市场容量角度看，全球主动型股票基金账上现金约一万亿美元，叠加散户、主权基金与对冲基金的资金，整体承接能力尚可。但真正挑战在于资金轮动：新IPO受捧可能挤压现有“七巨头”（Mac Seven）的估值空间；尤其当部分公司已进入负现金流阶段，市场对盈利可持续性的担忧将加剧。

“如果你抱听这个想法，你是arrogant，然后也不是open minded。”

“历史上人类真的经历了很多巨变。今天我们会觉得AI这种，对吧？很多不确定性，很大的压迫感。但如果真的和当年就工业化取代手工农业对农民的震撼相比，我觉得是不是一个量级的？”

裁员潮与就业焦虑的再审视

大规模裁员对每股收益（EPS）的提升作用有限——例如20%的裁员仅可能带来Mac Seven公司约5%-10%的EPS增长；但对人力密集型SaaS企业（如Salesforce），同等裁员可带来40%-50%的EPS跃升。这引发更深层的结构性焦虑：当AI驱动的效率提升无法快速转化为终端收入，市场将质疑“钱从哪里出”。尽管Anthropic等公司已展现良好收入，但其收入多来自B端生态，真正的AI原生收入尚未大规模显现。

“我倾向于觉得会变化会快很多。”

“所以这个平权会以一种非常就是痛苦，这个非常 painful 的方式，在这个社会中间去去实现。”

孤独时代的连接重构

技术迭代加速带来持续的信息过载焦虑：新模型、新工具、新API层出不穷，连安装OpenCloud都可能引发“是否被时代淘汰”的自我怀疑。这种焦虑并非个体特有，而是时代性特征——当不确定性成为常态，人对掌控感的渴求反而更强烈。有趣的是，AI正在掏空以信息交换为目的的对话价值：90%以上的事实性内容可由模型直接提供，且更高效。于是，人与人之间所剩的，只剩下情感连接——那些关于勇气、遗憾、在乎与闪光瞬间的对话，虽无信息增量，却构成最真实、最珍贵的体验。

“所以当这个剧情不管是按哪条路展开的时候，在心理上和这个组合上面都能准备好，都能快速调整。我觉得这个就是能做的事情了。”

当对话回归人味

在信息高度可预测的时代——比如会议前充分准备后，对方陈述的事实性内容往往可以被提前预判——真正稀缺的，反而是无预设、无功利目的的真诚对话。作者回忆起一次在 Paluto 与朋友的随意闲聊：本无明确议题，却自然延伸至“做事情的勇气”“人生遗憾”“我在乎什么”以及“有没有什么东西让我觉得有火花（spark）”。这次对话之所以珍贵，并非因其信息增量，而在于其‘人味’本身。它让作者意识到，自己已悄然划下一条清晰界限：涉及信息、知识与分析的任务，可放心交由 AI；而‘见人’这件事，反而需要回归最朴素的观察、倾听与袒露。若连倾诉尴尬、脆弱甚至羞于启齿的内容（如“装 Open Call 没有装上，然后痛哭”）都成为稀缺行为，那对话便失去了不可替代性——毕竟，“两个人都去跟 AI 聊一聊，会效果会更好”。

‘他没有给我任何信息上的增量，但就是比较有人味儿吧’ ‘我觉得这也是我们这档节目的初衷……希望能够和听众之间形成一些真实的、真诚的连接’

语言的双重使命

‘语言及世界工作室’这一名称，在初听时或许平淡无奇；但结合当下语境，它显露出深刻的时代隐喻：在 AI 时代，语言的‘信息翻译与传递’功能正被自动化接管，而‘建立人与人之间真实连接’的功能却愈发珍贵。作者判断，AI 将接管大量公开、结构化信息的处理，而人类语言中那些承载情感、脆弱性与主体性的部分——那些‘说出来会有点不好意思的东西’——将成为人与人之间不可被代理、不可被压缩的核心价值。这不仅是对播客初衷的重申，更是一种对语言本质的再确认：当世界被数据化，语言的温度反而成为我们抵抗异化的锚点。因此，工作室的命名本身，便是一声宣言：我们选择在‘语言’中重建‘世界’，而非仅传递它的副本。

‘今天社会很多时候语言都是被用来……翻译信息、传递信息的……AI会去做掉这部分的工作。但是，语言很多时候还会被用来就真正建立人与人之间的联系。我觉得这个是会越来越宝贵的这么一个东西。’