← 精选
Talkie 由 @status_effects、@DavidDuvenaud 和 @AlecRad 开发。
2026-04-28 · simonw · 打开 ↗
虽然没能画出我想要的骑自行车的鹈鹕,但它那符合时代感的回答还是挺不错的。
2026-04-28 · simonw · 打开 ↗
关于 talkie 的一些笔记:这是一个由 Alec Radford(没错,就是那位 Alec Radford)及其团队开发的全新“复古语言模型”,基于 2600 亿 token 的 1931 年前历史英语文本训练而成。 https://simonwillison.net/2026/Apr/28/talkie/
2026-04-28 · simonw · 打开 ↗
Here's a uv one-liner that downloads and runs the MLX model against a local mp3 file uv run --with mlx-audio python -m mlx_audio.stt.generate \ --model mlx-community/VibeVoice-ASR-4bit \ --audio lenny.mp3 --output-path lenny \ --format json --verbose --max-tokens 32768 https://t
2026-04-27 · simonw · 打开 ↗
微软采用 MIT 协议的 VibeVoice 语音转文本模型(可以理解为带有说话人识别功能的 Whisper)非常出色。分享我在 M5 MacBook 上运行 5.71GB 4bit MLX 量化版的测试笔记:峰值内存占用约 60GB,转录 1 小时音频仅需约 9 分钟。 https://simonwillison.net/2026/Apr/27/vibevoice/
2026-04-27 · simonw · 打开 ↗
忍不住用我最喜欢的 Matt Levine 名言来收尾。
2026-04-27 · simonw · 打开 ↗
来自 MiMo-V2.5 的元气小家伙。
2026-04-27 · simonw · 打开 ↗
OpenAI 今日宣布:“OpenAI 向微软支付的收入分成将持续至 2030 年,且不受 OpenAI 技术进展的影响。” “不受 OpenAI 技术进展的影响”这一表述似乎意味着,那个奇怪的 AGI 条款已宣告作废。
2026-04-27 · simonw · 打开 ↗
我不认同这里的结论。我总结出的两条经验是: 1. 不要让 Agent 运行在可能接触到生产环境凭据的地方——识别哪些是此类凭据是你的责任。 2. 保持与生产主机隔离且经过测试的备份。
2026-04-27 · simonw · 打开 ↗
必须把这件事记在博客里,留作纪念:https://simonwillison.net/2026/Apr/25/why-are-you-like-this/
2026-04-25 · simonw · 打开 ↗
有人在 Mac 上跑通 DeepSeek-V4-Flash 了吗?512GB、256GB、128GB 甚至更小容量的行吗?
2026-04-25 · simonw · 打开 ↗
@huggingface 详情请见:https://huggingface.co/models?other=base_model:quantized:deepseek-ai/DeepSeek-V4-Flash
2026-04-24 · simonw · 打开 ↗
给 @huggingface 的功能建议:在排序菜单中增加“仓库大小”选项,我想找占用磁盘空间最小的 DeepSeek 量化模型。https://twitter.com/simonw/status/2047711586685800578/photo/1
2026-04-24 · simonw · 打开 ↗
...原来只要在浏览器的网络检查器里仔细翻找,真的能找到提示词——这张图片的提示词如下:https://twitter.com/simonw/status/2047011208478564401/photo/1
2026-04-22 · simonw · 打开 ↗
重要:已确认 ChatGPT Images 2.0 会擅自添加“Why are you like this”的字样 https://x.com/scottjla/status/2047545918665449844
2026-04-24 · simonw · 打开 ↗
关于 DeepSeek V4 的更多笔记——真正的重磅消息是定价:DeepSeek-V4-Flash 和 DeepSeek-V4-Pro 都是同类模型中最便宜的,且基准测试表现已接近其他厂商的最前沿模型。
2026-04-24 · simonw · 打开 ↗
天哪
2026-04-24 · simonw · 打开 ↗
这些鹈鹕看起来有点凶! 左边是 deepseek-v4-flash,右边是 deepseek-v4-pro —— 都是通过我的 LLM 工具 https://twitter.com/simonw/status/2047534175855759771/photo/1 调用 OpenRouter 生成的。
2026-04-24 · simonw · 打开 ↗
我还天真地以为在太平洋时间周四晚上9点发布很稳妥,觉得今晚肯定不会有什么突发新闻需要我临时补充……
2026-04-24 · simonw · 打开 ↗
本周邮件通讯包含:4只骑自行车的鹈鹕、1只骑电动滑板车的负鼠、人群中潜伏着多达5只带着业余无线电的浣熊,此外还有5篇博文、8个链接、3段语录,以及《智能体工程模式指南》的新章节:https://simonw.substack.com/p/gpt-55-chatgpt-images-20-qwen36-27b
2026-04-24 · simonw · 打开 ↗
LiteParse 浏览器版现已上线:https://simonw.github.io/liteparse/ 我在博客上详细记录了如何使用 Claude Code(运行一小时)构建它的过程:https://simonwillison.net/2026/Apr/23/liteparse-for-the-web/
2026-04-23 · simonw · 打开 ↗
LiteParse 真好用!它能非常出色地从复杂的 PDF 布局(比如多栏布局)中提取文本。由于它目前仅提供 Node.js CLI 版本,所以我随手写了个能在浏览器运行的版本。
2026-04-23 · simonw · 打开 ↗
GPT-5.5 或许不在 OpenAI 的官方 API 中,但可以通过那个看似被认可的 Codex API 后门来调用。于是我用它做了这些鹈鹕(默认版和超高版)!
2026-04-23 · simonw · 打开 ↗
我在 Codex 里试用了几周,效果非常棒!用它来对其他模型生成的代码进行安全审查,效果很惊艳。
2026-04-23 · simonw · 打开 ↗
这个挺好玩的,值得一试 - https://flipbook.page/
2026-04-23 · simonw · 打开 ↗
两年之内,你就能对整个国家进行提示词注入。
2026-04-23 · simonw · 打开 ↗
更正:OpenAI 并未弃用该模型,此前的公告有误。
2026-04-22 · simonw · 打开 ↗
这就是为什么我不使用闭源托管的嵌入模型——我非常愿意为托管方案付费(比自托管更便宜、更快捷、更方便),但我需要有开源权重作为退路,以防哪天他们停止服务。
2026-04-22 · simonw · 打开 ↗
像这样关停嵌入模型,对那些投入大量时间和金钱处理海量文本并存储向量的人来说是巨大的损失——如果无法再计算新向量进行比对,之前的投入基本就白费了。
2026-04-22 · simonw · 打开 ↗
这也不是第一次了——早在 2024 年 4 月的这份公告中,他们也关停了一批原有的自研托管嵌入模型:https://openai.com/index/gpt-4-api-general-availability/#deprecation-of-older-embeddings-models
2026-04-22 · simonw · 打开 ↗
最让人费解的是:既然想让用户每月为 Claude Code 支付 100 美元,难道不该先提供一个 20 美元的方案让他们试用吗?谁会为了试用直接砸 100 美元啊?
2026-04-22 · simonw · 打开 ↗
我直觉这只是一次考虑不周的测试,他们没料到会被瞬间识破并引发(理所当然的)舆论风暴——但愿他们能意识到这个“测试”是个馊主意!如果他们执意推进,我预计 OpenAI Codex 会很快追上 Claude Code。
2026-04-21 · simonw · 打开 ↗
我最近主要通过 client.images.generate() API 直接向新模型发送提示词。我不确定 API 会不会重写提示词,还是直接将其传给模型。详情见:https://simonwillison.net/2026/Apr/21/gpt-image-2/#gpt-image-2
2026-04-22 · simonw · 打开 ↗
这是这段 ChatGPT 对话的内容:https://chatgpt.com/share/69e90ba5-7760-83e8-9e09-f06e25a90930。我的提示词是:“做一个《威利在哪里》风格的图,但主题是寻找一只拿着业余无线电的浣熊”。
2026-04-22 · simonw · 打开 ↗
推测 GPT-imagegen-2(即 ChatGPT Images 2.0 或 gpt-image-2)是作为一种工具,由模型生成提示词来调用? 真希望我们能像以前用 DALL-E 3 时那样,看到这些提示词。 https://simonwillison.net/2023/Oct/26/add-a-walrus/
2026-04-22 · simonw · 打开 ↗
新沙盒!
2026-04-22 · simonw · 打开 ↗
这意义重大——如果网站遭遇激进爬虫,使用 Cloud Run 很容易产生高额账单,有了支出上限,运行小项目就安全多了。
2026-04-22 · simonw · 打开 ↗
不错
2026-04-22 · simonw · 打开 ↗
有人也能看到截图里 Claude Pro 每月 34 美元的价格吗?
2026-04-22 · simonw · 打开 ↗
最新的 Qwen3.6-27B 刚刚生成了一张骑自行车的鹈鹕,这绝对是我在 16.8GB 模型中见过的最佳效果! https://simonwillison.net/2026/Apr/22/qwen36-27b/
2026-04-22 · simonw · 打开 ↗
等等,这是 A/B 测试吗!?
2026-04-21 · simonw · 打开 ↗
……这让情况变得更加复杂,因为它提出了一个重要的新问题 https://x.com/simonw/status/2046798283700617267
2026-04-22 · simonw · 打开 ↗
显然是出了 bug,导致新的价格方案在全球范围内上线了,而它本应只针对 A/B 测试中 2% 的用户。
2026-04-22 · simonw · 打开 ↗
看来我的博客现在基本都在聊 token 定价了。这里有一些关于 GitHub Copilot 最新重大变化的笔记,包括完全暂停新用户注册:https://simonwillison.net/2026/Apr/22/changes-to-github-copilot/
2026-04-22 · simonw · 打开 ↗
有人看到 Anthropic 官方或员工针对 Pro 版 Claude Code 重新勾选一事发表过任何说明吗?还是说,他们改变政策的唯一证据仅仅是 https://claude.com/pricing 页面上的那个勾选框?
2026-04-22 · simonw · 打开 ↗
我在博客里写了今天下午 Anthropic 关于 Claude Code 定价的“自打脸”事件。结果我刚点发布,他们就改口了,所以我尝试更新了文章以反映现状。 https://simonwillison.net/2026/Apr/22/claude-code-confusion/
2026-04-22 · simonw · 打开 ↗
据我所知,这条埋在推文串里的推文是目前唯一的官方确认,表明潜在的价格变动不会影响现有的 Pro 订阅用户。
2026-04-22 · simonw · 打开 ↗
Anthropic 真是直接把机会拱手让给了 OpenAI。
2026-04-22 · simonw · 打开 ↗
好了,解决方法来了——我通过以下设置成功让它开始思考: "thinking": { "type": "adaptive", "display": "summarized" }, "output_config": { "effort": "max" } 如果不设置 "display": "summarized",我根本无法判断它是否在思考。
2026-04-21 · simonw · 打开 ↗
太让人困惑了。Anthropic 真的把 Claude Code 从每月 20 美元的方案中剔除了吗?为什么要通过更新定价页面,而不是发布正式公告来这么做?而且,20 美元/月依然能用 Cowork,这不就是给 Claude Code 换了个“温和”的马甲吗!
2026-04-21 · simonw · 打开 ↗
Prism is open source · ⭐ Star on GitHub · about