我其实有不同的看法。 越来越多的公司正从租用闭源大模型,转向通过开源大模型和后训练来“拥有模型权重”。 Cursor 就做到了。 开源大模型的营收在未来某个时刻可能会超过 Anthropic。
2026-06-18 · Yuchenj_UW · 打开 ↗
Noam 离开 Google 让 Gemini 的未来变得扑朔迷离。不止一位 DeepMind 的员工告诉我,是 Noam 拯救了 Gemini。甚至有传闻说,他仅通过微调几行训练代码,就让 Gemini 的质量瞬间飞跃。Gemini 的编程能力目前感觉仍显落后。真心希望它能重回巅峰,我们需要更多的模型选择。
2026-06-18 · Yuchenj_UW · 打开 ↗
两年前 Google 斥资 27 亿美元请回来的 AI 传奇 Noam Shazeer 离开了 Google,转投 OpenAI。 这对 Gemini 来说是个沉重的打击。
2026-06-18 · Yuchenj_UW · 打开 ↗
Matei 刚刚在 Databricks Data + AI Summit 上宣布了这一消息。录像将于今日发布。 了解 Omnigent:https://omnigent.ai/ GitHub:https://github.com/omnigent-ai/omnigent
2026-06-17 · Yuchenj_UW · 打开 ↗
Web UI 非常丝滑。 你可以让 Codex 和 Claude Code 展开辩论,也可以像使用 Google Docs 一样,邀请团队成员加入同一个实时会话共同协作。 你还可以通过手机控制这些智能体。
2026-06-17 · Yuchenj_UW · 打开 ↗
编程的未来不再是单个智能体,而是一个完整的 AI 团队。 Omnigent 让你能在同一个实时会话中运行智能体团队:包括 Claude Code、Codex、Cursor、Pi 以及你自定义的智能体。 它是 AI 智能体的“元框架”(meta-harness),源自 Databricks 内部开发工具,现已向所有人开源。 由传奇人物 @matei_zaharia 与 Databricks AI 团队打造。没错,Matei 依然保持着高产的编码习惯,甚至连 Omnigent 及我们产品的代码前端也是他亲手编写。
2026-06-17 · Yuchenj_UW · 打开 ↗
SpaceX 以 600 亿美元收购了 Cursor。 许多人曾轻视 Cursor,认为它只是 GPT/Claude 的“套壳”或 VS Code 的分支。但它已成长为一家能够进行模型后训练的公司。 这正是埃隆想要它的重要原因。 我认为未来会有更多公司通过后训练定制模型,以掌握权重并降低成本。 祝贺 @cursor_ai 团队和埃隆! 现在真正的问题是:Cursor 会在 SpaceX 办公室里延续其“不穿鞋”的文化吗?
2026-06-16 · Yuchenj_UW · 打开 ↗
明天开源 Fable 5。 晚安。
2026-06-15 · Yuchenj_UW · 打开 ↗
一种假设: 如果 Anthropic 的外籍员工无法参与 Mythos/Fable 项目,且 LLM 越狱问题仍未解决,美国的前沿实验室将被迫放缓训练和模型发布进度。 中国开源 AI 是否可能在约 6 个月内首次超越美国的闭源模型?
2026-06-14 · Yuchenj_UW · 打开 ↗
Anthropic 在其安全声明中将 Mythos 称为危险,而这正是 Fable 5 被美国政府封禁的原因。令人意外的是,“Dario 拒绝了”。
2026-06-13 · Yuchenj_UW · 打开 ↗
太让人兴奋了——我在 Databricks 使用 Omnigent 已有一段时间,今天我们正式将其开源。 Omnigent 是一个用于编排智能体集群的元智能体(meta-agent)。 为什么需要它?因为顶尖的效果不再仅仅依靠单一模型在单一框架下的运行。 我以前习惯用 Codex 和 Claude Code 跑同一个任务,然后从中选一个更好的。但显而易见,更优的做法是让它们协作、辩论,并最终收敛出更佳的结果。Omnigent 让这一过程变得极其顺畅。 我非常喜欢的另一个功能是实时协作。你可以邀请他人加入 Omnigent 会话,进行观察、引导并发送指令。 多智能体与多人类的协作就是未来。 Omnigent 是由 @matei_zaharia 和一支精干团队在短短 6 周内打造出来的,他们每天都在 Databricks 的攻坚室里奋战,简直太不可思议了。 Databricks AI 真的很有初创公司的感觉。
2026-06-13 · Yuchenj_UW · 打开 ↗
使用 Fable 5 的这三天体验极佳。 显然,Fable 5 是 ASI,非常危险。 作为外国人,这可能是我最后一次有机会接触到如此智能的模型。 但我最后的希望在于开源 AI。开源模型将在 6 个月内超越 Mythos。
2026-06-13 · Yuchenj_UW · 打开 ↗
“我们将暂停所有用户对 Claude Fable 5 的访问” 这到底是什么鬼???
2026-06-13 · Yuchenj_UW · 打开 ↗
马斯克成为首位万亿富翁,这意味着一件事:我现在离贝佐斯的距离,比贝佐斯离马斯克的距离还要近。
2026-06-12 · Yuchenj_UW · 打开 ↗
Claude Fable 5 目前体验不错,但我觉得它相比 GPT-5.5 或 Opus 4.8 还没实现质的飞跃。 我最大的槽点是:处理旧的 AI 研究论文/博客或基础问题时,经常会自动降级到 Opus 4.8。 Anthropic 昨晚表示不会再进行“静默模型切换”了(这很好),但请不要削弱对基础 AI 研究或生物学问题的处理能力。
2026-06-11 · Yuchenj_UW · 打开 ↗
虽然 Mythos/Fable 的基准测试表现惊人,但我很庆幸 Anthropic 并非全球唯一的顶尖 AI 公司。 让一家公司掌握制造“AI 之神”的能力,比多家公司共同拥有这种能力要危险得多。 最重要的是,我希望开源 AI 能持续繁荣。
2026-06-10 · Yuchenj_UW · 打开 ↗
兄弟,Fable 5 居然连“心脏是干什么的?”都不回答。 我们已经到了连初中生物题都过不了安全审核的地步了。
2026-06-10 · Yuchenj_UW · 打开 ↗
Claude Fable 5 / Mythos 5 全面碾压。 我原以为 Fable 5 只是阉割版的 Mythos Preview,但它实际上更强。SWE-Bench Pro 评分:Fable 5 80.3%,GPT-5.5 58.6%。 而且价格仅为 Opus 4.8 的两倍:输入 $10/百万 token,输出 $50/百万 token。 我觉得 GPT 5.6 也打不过它……
2026-06-09 · Yuchenj_UW · 打开 ↗
Claude Fable 5 (Mythos) 终于发布了!这正是我一直在找的东西!!!!!!!!!!!!!!!!!!!! https://twitter.com/Yuchenj_UW/status/2064391687263400420/photo/1
2026-06-09 · Yuchenj_UW · 打开 ↗
总而言之: “你不该再直接给编程智能体写提示词,而应设计能自动提示智能体的‘循环机制’。” 循环是目前的权宜之计:现有的 LLM 判断力不足,难以自主判断何时该继续、何时该停止或何时调用工具。而循环能迫使智能体持续工作。 正如 AutoResearch 所示,对于目前可验证的目标,循环机制极其强大。
2026-06-08 · Yuchenj_UW · 打开 ↗
OpenAI 在 Sora 上的领先优势正在流失。 OpenAI 在芯片领域的优势正流向 Anthropic。 “同时押注所有大方向”的策略开始显得捉襟见肘。 当你在编程领域与 Anthropic 展开肉搏战时,其他的赌注也开始失血。(就编程本身而言,OpenAI 显然已经追平。)
2026-06-07 · Yuchenj_UW · 打开 ↗
有AI之前,我一个周末只能做一个没用的App。 现在,我一个周末能做出67个没用的App,每个都配有Logo和精美的网页,但用户数全是0。
2026-06-06 · Yuchenj_UW · 打开 ↗
Google 和 Anthropic 每年向 SpaceX 支付 260 亿美元租用 GPU。 SpaceX 意外成为了全球最大的新一代云服务商,拥有约 55 万个 GPU,规模是 CoreWeave 的两倍多。 Starlink 的年经常性收入(ARR)约为 150 亿美元,这意味着 GPU 租赁已成为 SpaceX 最大的业务。马斯克或许并不需要 xAI 就能击败 OpenAI。
2026-06-05 · Yuchenj_UW · 打开 ↗
又是一个周五,Claude Code 和 Claude 网页版又崩了。 我总算明白 Mythos 为什么迟迟不发布了。 你好,Codex。
2026-06-05 · Yuchenj_UW · 打开 ↗
把你自己想象成一个大语言模型。 每一次社交、每一场会议,都在消耗你的 token。 除非有人为你的注意力付费,否则你没有义务回应那些低质量的指令。
2026-06-05 · Yuchenj_UW · 打开 ↗
Anthropic 关于“递归自我改进”的帖子: “每次发布新模型时,我们都会给它一段用于训练小型 AI 模型的代码,并要求新模型对其进行加速。 2024 年 5 月,Claude Opus 4 平均实现了约 3 倍的加速;今年 4 月,Mythos Preview 则实现了约 52 倍的加速。” 递归自我改进(RSI)正在发生,我迫不及待想看到 Mythos 了。
2026-06-04 · Yuchenj_UW · 打开 ↗
越来越多的工程师现在消耗的 AI Token 费用甚至超过了他们的基本工资。 科技公司正面临一个残酷的抉择: > 让所有人火力全开,以 AI 的速度前进 > 设置 Token 预算,但这会破坏工作氛围 > 裁掉 50% 的人,给剩下的人无限量的 Token
2026-06-03 · Yuchenj_UW · 打开 ↗
Opus 4.8 感觉相比 4.7 升级并不明显。 相比之下,GPT-5.4 到 5.5 感觉是质的飞跃。现在我非常好奇 5.6 会是什么样。 Anthropic 是在为 IPO 憋大招(Mythos)吗?
2026-06-03 · Yuchenj_UW · 打开 ↗
回家发现门口有个 Anthropic 送来的惊喜礼盒。 有什么比 vibe-coding 软件更酷的?当然是 vibe-coding 硬件!我或许能把这台微型电脑 vibe-code 成我 Claude Code 会话的遥控器。 感谢 @bcherny 送来这份礼物!
2026-06-02 · Yuchenj_UW · 打开 ↗
OpenAI 忽视了编程领域,让 Anthropic 夺走了王冠。 Anthropic 未能储备足够的 GPU/TPU 将领先优势转化为垄断,而现在 Codex 也追上来了。 Gemini 也会追上来,这只是时间问题。 AI 编程正演变成一场“三体问题”。
2026-06-01 · Yuchenj_UW · 打开 ↗
旧金山 Zillow 上的一个 300 万美元房源: “接受 Anthropic 或 OpenAI 的股票支付。” 别提什么现金买家了。旧金山房地产界的终极 BOSS,是一个拿着 AGI 前期股权、年仅 28 岁的 MTS。
2026-05-30 · Yuchenj_UW · 打开 ↗
Google 正在同时挑战各领域的“终极 Boss”: 模型领域的 OpenAI 和 Anthropic,芯片领域的 Nvidia,云服务的 AWS 和 Microsoft,广告领域的 Meta,自动驾驶领域的 Tesla,以及手机与系统领域的 Apple。 市值 4.6 万亿美元,感觉被低估得有些离谱。
2026-05-29 · Yuchenj_UW · 打开 ↗
Opus 4.8 在 SWE-Bench Pro 测试中得分 69.2%,比 GPT-5.5 高出 10 个百分点。 发布日志中最引人注目的部分是“动态工作流”(Dynamic Workflows): “这项目前处于研究预览阶段的新功能,让 Claude 能够在 Claude Code 中处理规模更大的任务。Claude 可以规划工作流程,并在单次会话中运行数百个并行子代理(在 Opus 4.8 中,这些代理的运行时间可以更长)。在向用户反馈结果之前,它还会对输出内容进行验证。”
2026-05-28 · Yuchenj_UW · 打开 ↗
Opus 4.8 发布了。太强了!
2026-05-28 · Yuchenj_UW · 打开 ↗
今天粉丝破15万了。 三个月前才10万。看来我的涨粉速度也遵循大模型的 Scaling Law。 感谢大家在 AGI 即将到来之际,愿意听我吐槽。 更令人兴奋的是:Opus 4.8 今天发布,或许 GPT-5.6 也要来了?!
2026-05-28 · Yuchenj_UW · 打开 ↗
我向所有人发起挑战:连续一周,每天手写代码 8 小时以上: 1. 不准使用编程智能体(如 Claude Code、Codex、Cursor) 2. 不准使用 GPT/Claude 或任何 AI 模型 如果你能坚持下来,你就是真正的战士。
2026-05-26 · Yuchenj_UW · 打开 ↗
科技行业花了数十年时间来构建职级和头衔体系。 Greg 将最初由贝尔实验室发明的“技术人员”(Member of Technical Staff,简称 MTS)引入了 OpenAI。随后,Anthropic、xAI、Thinky 以及许多 AI 初创公司也纷纷效仿。 年轻的 MTS 也能产生巨大影响。例如 Alec 创造了 GPT,但在传统体系下,他只是个“L4 软件工程师”。 Databricks AI 最近也开始采用 MTS。我认为这是硅谷一个非常积极的变化。
2026-05-25 · Yuchenj_UW · 打开 ↗
谁发明了“Member of Technical Staff”简直是个天才。 它过滤掉了那些唯头衔论的 Staff/Principal 党,保护了工程和研究免受“职场晋升脑”的侵蚀,还让招聘人员盯着 LinkedIn 犯愁:“这人到底是 L4 还是 L7?” MTS 是最好的头衔。很荣幸能是一名 MTS。
2026-05-24 · Yuchenj_UW · 打开 ↗
不敢相信我竟然手动写了15年代码。 15年里,背语法、用 Vim、刷 Stack Overflow、处理构建失败、折腾坑爹的依赖、解决合并冲突,还有那句“睡前再修最后一个 bug”。 折腾了这么久,最后竟然只是在对话框里输入“修一下这个”,然后看着 AI 代理在那儿胡作非为。
2026-05-23 · Yuchenj_UW · 打开 ↗
若属实,简直离谱。 也就是说,OpenAI 有 50% 的研究人员必须离开美国回国才能申请绿卡? 别把人才赶走。
2026-05-23 · Yuchenj_UW · 打开 ↗
给我 Mythos 给我 Mythos 给我 Mythos 给我 Mythos 给我 Mythos 我真受够了,不想再给这些笨大模型当保姆了……
2026-05-22 · Yuchenj_UW · 打开 ↗
哇,DeepSeek 直接降价了 75%。 要么是推理优化做得极好,要么是华为芯片确实便宜得多? 开源模型越多,Token 经济性就越好。
2026-05-22 · Yuchenj_UW · 打开 ↗
这话以后看会很尴尬。
2026-05-21 · Yuchenj_UW · 打开 ↗
刚试用了 Antigravity 2.0。 它不再是一个 IDE 了……真让我惊讶!它基本上就是一个集成了 Gemini 模型的 Codex/Claude 桌面应用。 在斥资 24 亿美元收购 Windsurf 后,Google 得出结论:AI 编程的未来不再是 IDE。我们不再需要阅读代码了。
2026-05-21 · Yuchenj_UW · 打开 ↗
Andrej 加入了 Anthropic。 连马斯克都忍不住为 Anthropic 点赞。 Anthropic 今天在 Google I/O 上简直气场全开,抢尽风头。
2026-05-19 · Yuchenj_UW · 打开 ↗
Anthropic 已夺天命。
2026-05-19 · Yuchenj_UW · 打开 ↗
Cursor 的 Composer 2.5 引燃了编程大战。 现在已有三大实验室具备训练强力编程模型的能力:Anthropic、OpenAI 和 SpaceX(加上 Cursor)。 如果 Google 明天在 I/O 大会上推出强力编程模型,也并不意外。 这简直是聊天机器人大战的重演:OpenAI 领跑,随后市场被其他 AI 实验室瓜分。编程模型领域也正在发生同样的事情。
2026-05-19 · Yuchenj_UW · 打开 ↗
GPU短缺比以往任何时候都严重。 H100现在的价格比三年前还要贵,而且根本无法按需购买。 大型AI实验室多年来垄断了绝大部分供应。我担心高校研究人员和个人开发者将根本无法获得GPU。
2026-05-18 · Yuchenj_UW · 打开 ↗
我也曾有过 FOMO 阶段: “如果几年前我没创业,而是去了 OpenAI/Anthropic/xAI,我现在可能已经身价过亿了。” 但后来我观察了那些富人。他们的日常重心变成了:“如何避税?”“在旧金山或湾区买哪里的房子?”而不是专注于创造。 而且说实话,他们看起来并不怎么快乐。 我一直觉得,1000 万美元是财富的黄金平衡点。超过这个数额,如果你追求的唯一目标还是钱,这场游戏就会变得毫无意义。
2026-05-16 · Yuchenj_UW · 打开 ↗
Anthropic 拿到了 xAI 的 GPU,紧接着就开始玩起 Codex 那一套。竞争对开发者有利。
2026-05-15 · Yuchenj_UW · 打开 ↗
Prism is open source · ⭐ Star on GitHub · about