Yuchen Jin

我其实有不同的看法。越来越多的公司正从租用闭源大模型，转向通过开源大模型和后训练来“拥有模型权重”。 Cursor 就做到了。开源大模型的营收在未来某个时刻可能会超过 Anthropic。

2026-06-18 · Yuchenj_UW · 打开 ↗

Noam 离开 Google 让 Gemini 的未来变得扑朔迷离。不止一位 DeepMind 的员工告诉我，是 Noam 拯救了 Gemini。甚至有传闻说，他仅通过微调几行训练代码，就让 Gemini 的质量瞬间飞跃。Gemini 的编程能力目前感觉仍显落后。真心希望它能重回巅峰，我们需要更多的模型选择。

2026-06-18 · Yuchenj_UW · 打开 ↗

两年前 Google 斥资 27 亿美元请回来的 AI 传奇 Noam Shazeer 离开了 Google，转投 OpenAI。这对 Gemini 来说是个沉重的打击。

2026-06-18 · Yuchenj_UW · 打开 ↗

Matei 刚刚在 Databricks Data + AI Summit 上宣布了这一消息。录像将于今日发布。了解 Omnigent：https://omnigent.ai/ GitHub：https://github.com/omnigent-ai/omnigent

2026-06-17 · Yuchenj_UW · 打开 ↗

Web UI 非常丝滑。你可以让 Codex 和 Claude Code 展开辩论，也可以像使用 Google Docs 一样，邀请团队成员加入同一个实时会话共同协作。你还可以通过手机控制这些智能体。

2026-06-17 · Yuchenj_UW · 打开 ↗

编程的未来不再是单个智能体，而是一个完整的 AI 团队。 Omnigent 让你能在同一个实时会话中运行智能体团队：包括 Claude Code、Codex、Cursor、Pi 以及你自定义的智能体。它是 AI 智能体的“元框架”（meta-harness），源自 Databricks 内部开发工具，现已向所有人开源。由传奇人物 @matei_zaharia 与 Databricks AI 团队打造。没错，Matei 依然保持着高产的编码习惯，甚至连 Omnigent 及我们产品的代码前端也是他亲手编写。

2026-06-17 · Yuchenj_UW · 打开 ↗

SpaceX 以 600 亿美元收购了 Cursor。许多人曾轻视 Cursor，认为它只是 GPT/Claude 的“套壳”或 VS Code 的分支。但它已成长为一家能够进行模型后训练的公司。这正是埃隆想要它的重要原因。我认为未来会有更多公司通过后训练定制模型，以掌握权重并降低成本。祝贺 @cursor_ai 团队和埃隆！现在真正的问题是：Cursor 会在 SpaceX 办公室里延续其“不穿鞋”的文化吗？

2026-06-16 · Yuchenj_UW · 打开 ↗

明天开源 Fable 5。晚安。

2026-06-15 · Yuchenj_UW · 打开 ↗

一种假设：如果 Anthropic 的外籍员工无法参与 Mythos/Fable 项目，且 LLM 越狱问题仍未解决，美国的前沿实验室将被迫放缓训练和模型发布进度。中国开源 AI 是否可能在约 6 个月内首次超越美国的闭源模型？

2026-06-14 · Yuchenj_UW · 打开 ↗

Anthropic 在其安全声明中将 Mythos 称为危险，而这正是 Fable 5 被美国政府封禁的原因。令人意外的是，“Dario 拒绝了”。

2026-06-13 · Yuchenj_UW · 打开 ↗

太让人兴奋了——我在 Databricks 使用 Omnigent 已有一段时间，今天我们正式将其开源。 Omnigent 是一个用于编排智能体集群的元智能体（meta-agent）。为什么需要它？因为顶尖的效果不再仅仅依靠单一模型在单一框架下的运行。我以前习惯用 Codex 和 Claude Code 跑同一个任务，然后从中选一个更好的。但显而易见，更优的做法是让它们协作、辩论，并最终收敛出更佳的结果。Omnigent 让这一过程变得极其顺畅。我非常喜欢的另一个功能是实时协作。你可以邀请他人加入 Omnigent 会话，进行观察、引导并发送指令。多智能体与多人类的协作就是未来。 Omnigent 是由 @matei_zaharia 和一支精干团队在短短 6 周内打造出来的，他们每天都在 Databricks 的攻坚室里奋战，简直太不可思议了。 Databricks AI 真的很有初创公司的感觉。

2026-06-13 · Yuchenj_UW · 打开 ↗

使用 Fable 5 的这三天体验极佳。显然，Fable 5 是 ASI，非常危险。作为外国人，这可能是我最后一次有机会接触到如此智能的模型。但我最后的希望在于开源 AI。开源模型将在 6 个月内超越 Mythos。

2026-06-13 · Yuchenj_UW · 打开 ↗

“我们将暂停所有用户对 Claude Fable 5 的访问” 这到底是什么鬼？？？

2026-06-13 · Yuchenj_UW · 打开 ↗

马斯克成为首位万亿富翁，这意味着一件事：我现在离贝佐斯的距离，比贝佐斯离马斯克的距离还要近。

2026-06-12 · Yuchenj_UW · 打开 ↗

Claude Fable 5 目前体验不错，但我觉得它相比 GPT-5.5 或 Opus 4.8 还没实现质的飞跃。我最大的槽点是：处理旧的 AI 研究论文/博客或基础问题时，经常会自动降级到 Opus 4.8。 Anthropic 昨晚表示不会再进行“静默模型切换”了（这很好），但请不要削弱对基础 AI 研究或生物学问题的处理能力。

2026-06-11 · Yuchenj_UW · 打开 ↗

虽然 Mythos/Fable 的基准测试表现惊人，但我很庆幸 Anthropic 并非全球唯一的顶尖 AI 公司。让一家公司掌握制造“AI 之神”的能力，比多家公司共同拥有这种能力要危险得多。最重要的是，我希望开源 AI 能持续繁荣。

2026-06-10 · Yuchenj_UW · 打开 ↗

兄弟，Fable 5 居然连“心脏是干什么的？”都不回答。我们已经到了连初中生物题都过不了安全审核的地步了。

2026-06-10 · Yuchenj_UW · 打开 ↗

Claude Fable 5 / Mythos 5 全面碾压。我原以为 Fable 5 只是阉割版的 Mythos Preview，但它实际上更强。SWE-Bench Pro 评分：Fable 5 80.3%，GPT-5.5 58.6%。而且价格仅为 Opus 4.8 的两倍：输入 $10/百万 token，输出 $50/百万 token。我觉得 GPT 5.6 也打不过它……

2026-06-09 · Yuchenj_UW · 打开 ↗

Claude Fable 5 (Mythos) 终于发布了！这正是我一直在找的东西！！！！！！！！！！！！！！！！！！！！ https://twitter.com/Yuchenj_UW/status/2064391687263400420/photo/1

2026-06-09 · Yuchenj_UW · 打开 ↗

总而言之： “你不该再直接给编程智能体写提示词，而应设计能自动提示智能体的‘循环机制’。” 循环是目前的权宜之计：现有的 LLM 判断力不足，难以自主判断何时该继续、何时该停止或何时调用工具。而循环能迫使智能体持续工作。正如 AutoResearch 所示，对于目前可验证的目标，循环机制极其强大。

2026-06-08 · Yuchenj_UW · 打开 ↗

OpenAI 在 Sora 上的领先优势正在流失。 OpenAI 在芯片领域的优势正流向 Anthropic。 “同时押注所有大方向”的策略开始显得捉襟见肘。当你在编程领域与 Anthropic 展开肉搏战时，其他的赌注也开始失血。（就编程本身而言，OpenAI 显然已经追平。）

2026-06-07 · Yuchenj_UW · 打开 ↗

有AI之前，我一个周末只能做一个没用的App。现在，我一个周末能做出67个没用的App，每个都配有Logo和精美的网页，但用户数全是0。

2026-06-06 · Yuchenj_UW · 打开 ↗

Google 和 Anthropic 每年向 SpaceX 支付 260 亿美元租用 GPU。 SpaceX 意外成为了全球最大的新一代云服务商，拥有约 55 万个 GPU，规模是 CoreWeave 的两倍多。 Starlink 的年经常性收入（ARR）约为 150 亿美元，这意味着 GPU 租赁已成为 SpaceX 最大的业务。马斯克或许并不需要 xAI 就能击败 OpenAI。

2026-06-05 · Yuchenj_UW · 打开 ↗

又是一个周五，Claude Code 和 Claude 网页版又崩了。我总算明白 Mythos 为什么迟迟不发布了。你好，Codex。

2026-06-05 · Yuchenj_UW · 打开 ↗

把你自己想象成一个大语言模型。每一次社交、每一场会议，都在消耗你的 token。除非有人为你的注意力付费，否则你没有义务回应那些低质量的指令。

2026-06-05 · Yuchenj_UW · 打开 ↗

Anthropic 关于“递归自我改进”的帖子： “每次发布新模型时，我们都会给它一段用于训练小型 AI 模型的代码，并要求新模型对其进行加速。 2024 年 5 月，Claude Opus 4 平均实现了约 3 倍的加速；今年 4 月，Mythos Preview 则实现了约 52 倍的加速。” 递归自我改进（RSI）正在发生，我迫不及待想看到 Mythos 了。

2026-06-04 · Yuchenj_UW · 打开 ↗

越来越多的工程师现在消耗的 AI Token 费用甚至超过了他们的基本工资。科技公司正面临一个残酷的抉择： > 让所有人火力全开，以 AI 的速度前进 > 设置 Token 预算，但这会破坏工作氛围 > 裁掉 50% 的人，给剩下的人无限量的 Token

2026-06-03 · Yuchenj_UW · 打开 ↗

Opus 4.8 感觉相比 4.7 升级并不明显。相比之下，GPT-5.4 到 5.5 感觉是质的飞跃。现在我非常好奇 5.6 会是什么样。 Anthropic 是在为 IPO 憋大招（Mythos）吗？

2026-06-03 · Yuchenj_UW · 打开 ↗

回家发现门口有个 Anthropic 送来的惊喜礼盒。有什么比 vibe-coding 软件更酷的？当然是 vibe-coding 硬件！我或许能把这台微型电脑 vibe-code 成我 Claude Code 会话的遥控器。感谢 @bcherny 送来这份礼物！

2026-06-02 · Yuchenj_UW · 打开 ↗

OpenAI 忽视了编程领域，让 Anthropic 夺走了王冠。 Anthropic 未能储备足够的 GPU/TPU 将领先优势转化为垄断，而现在 Codex 也追上来了。 Gemini 也会追上来，这只是时间问题。 AI 编程正演变成一场“三体问题”。

2026-06-01 · Yuchenj_UW · 打开 ↗

旧金山 Zillow 上的一个 300 万美元房源： “接受 Anthropic 或 OpenAI 的股票支付。” 别提什么现金买家了。旧金山房地产界的终极 BOSS，是一个拿着 AGI 前期股权、年仅 28 岁的 MTS。

2026-05-30 · Yuchenj_UW · 打开 ↗

Google 正在同时挑战各领域的“终极 Boss”：模型领域的 OpenAI 和 Anthropic，芯片领域的 Nvidia，云服务的 AWS 和 Microsoft，广告领域的 Meta，自动驾驶领域的 Tesla，以及手机与系统领域的 Apple。市值 4.6 万亿美元，感觉被低估得有些离谱。

2026-05-29 · Yuchenj_UW · 打开 ↗

Opus 4.8 在 SWE-Bench Pro 测试中得分 69.2%，比 GPT-5.5 高出 10 个百分点。发布日志中最引人注目的部分是“动态工作流”（Dynamic Workflows）： “这项目前处于研究预览阶段的新功能，让 Claude 能够在 Claude Code 中处理规模更大的任务。Claude 可以规划工作流程，并在单次会话中运行数百个并行子代理（在 Opus 4.8 中，这些代理的运行时间可以更长）。在向用户反馈结果之前，它还会对输出内容进行验证。”

2026-05-28 · Yuchenj_UW · 打开 ↗

Opus 4.8 发布了。太强了！

2026-05-28 · Yuchenj_UW · 打开 ↗

今天粉丝破15万了。三个月前才10万。看来我的涨粉速度也遵循大模型的 Scaling Law。感谢大家在 AGI 即将到来之际，愿意听我吐槽。更令人兴奋的是：Opus 4.8 今天发布，或许 GPT-5.6 也要来了？！

2026-05-28 · Yuchenj_UW · 打开 ↗

我向所有人发起挑战：连续一周，每天手写代码 8 小时以上： 1. 不准使用编程智能体（如 Claude Code、Codex、Cursor） 2. 不准使用 GPT/Claude 或任何 AI 模型如果你能坚持下来，你就是真正的战士。

2026-05-26 · Yuchenj_UW · 打开 ↗

科技行业花了数十年时间来构建职级和头衔体系。 Greg 将最初由贝尔实验室发明的“技术人员”（Member of Technical Staff，简称 MTS）引入了 OpenAI。随后，Anthropic、xAI、Thinky 以及许多 AI 初创公司也纷纷效仿。年轻的 MTS 也能产生巨大影响。例如 Alec 创造了 GPT，但在传统体系下，他只是个“L4 软件工程师”。 Databricks AI 最近也开始采用 MTS。我认为这是硅谷一个非常积极的变化。

2026-05-25 · Yuchenj_UW · 打开 ↗

谁发明了“Member of Technical Staff”简直是个天才。它过滤掉了那些唯头衔论的 Staff/Principal 党，保护了工程和研究免受“职场晋升脑”的侵蚀，还让招聘人员盯着 LinkedIn 犯愁：“这人到底是 L4 还是 L7？” MTS 是最好的头衔。很荣幸能是一名 MTS。

2026-05-24 · Yuchenj_UW · 打开 ↗

不敢相信我竟然手动写了15年代码。 15年里，背语法、用 Vim、刷 Stack Overflow、处理构建失败、折腾坑爹的依赖、解决合并冲突，还有那句“睡前再修最后一个 bug”。折腾了这么久，最后竟然只是在对话框里输入“修一下这个”，然后看着 AI 代理在那儿胡作非为。

2026-05-23 · Yuchenj_UW · 打开 ↗

若属实，简直离谱。也就是说，OpenAI 有 50% 的研究人员必须离开美国回国才能申请绿卡？别把人才赶走。

2026-05-23 · Yuchenj_UW · 打开 ↗

给我 Mythos 给我 Mythos 给我 Mythos 给我 Mythos 给我 Mythos 我真受够了，不想再给这些笨大模型当保姆了……

2026-05-22 · Yuchenj_UW · 打开 ↗

哇，DeepSeek 直接降价了 75%。要么是推理优化做得极好，要么是华为芯片确实便宜得多？开源模型越多，Token 经济性就越好。

2026-05-22 · Yuchenj_UW · 打开 ↗

这话以后看会很尴尬。

2026-05-21 · Yuchenj_UW · 打开 ↗

刚试用了 Antigravity 2.0。它不再是一个 IDE 了……真让我惊讶！它基本上就是一个集成了 Gemini 模型的 Codex/Claude 桌面应用。在斥资 24 亿美元收购 Windsurf 后，Google 得出结论：AI 编程的未来不再是 IDE。我们不再需要阅读代码了。

2026-05-21 · Yuchenj_UW · 打开 ↗

Andrej 加入了 Anthropic。连马斯克都忍不住为 Anthropic 点赞。 Anthropic 今天在 Google I/O 上简直气场全开，抢尽风头。

2026-05-19 · Yuchenj_UW · 打开 ↗

Anthropic 已夺天命。

2026-05-19 · Yuchenj_UW · 打开 ↗

Cursor 的 Composer 2.5 引燃了编程大战。现在已有三大实验室具备训练强力编程模型的能力：Anthropic、OpenAI 和 SpaceX（加上 Cursor）。如果 Google 明天在 I/O 大会上推出强力编程模型，也并不意外。这简直是聊天机器人大战的重演：OpenAI 领跑，随后市场被其他 AI 实验室瓜分。编程模型领域也正在发生同样的事情。

2026-05-19 · Yuchenj_UW · 打开 ↗

GPU短缺比以往任何时候都严重。 H100现在的价格比三年前还要贵，而且根本无法按需购买。大型AI实验室多年来垄断了绝大部分供应。我担心高校研究人员和个人开发者将根本无法获得GPU。

2026-05-18 · Yuchenj_UW · 打开 ↗

我也曾有过 FOMO 阶段： “如果几年前我没创业，而是去了 OpenAI/Anthropic/xAI，我现在可能已经身价过亿了。” 但后来我观察了那些富人。他们的日常重心变成了：“如何避税？”“在旧金山或湾区买哪里的房子？”而不是专注于创造。而且说实话，他们看起来并不怎么快乐。我一直觉得，1000 万美元是财富的黄金平衡点。超过这个数额，如果你追求的唯一目标还是钱，这场游戏就会变得毫无意义。

2026-05-16 · Yuchenj_UW · 打开 ↗

Anthropic 拿到了 xAI 的 GPU，紧接着就开始玩起 Codex 那一套。竞争对开发者有利。

2026-05-15 · Yuchenj_UW · 打开 ↗