Andrew Ng

New course: Add voice to your AI agents and applications, built with @VocalBridge (disclosure: an AI Fund portfolio company) and taught by its CEO @_ashwyn. Voice applications historically required making a hard tradeoff: using fast voice-to-voice models that sacrifice reliabili

2026-06-18 · AndrewYNg · 打开 ↗

关于高效部署 LLM 的新课程——如何在保证低延迟和合理成本的同时，为大量并发用户提供模型服务？本短课由 @RedHat 联合打造，由 @cedricclyburn 授课。高效的 LLM 服务离不开高效的内存管理。仅加载一个 70B 参数模型的权重就需要约 140 GB 显存。此外，每个活跃请求都需要占用一部分 GPU 显存（即 KV Cache）来存储已生成的 token 上下文。在本课程中，你将学习如何通过量化技术降低模型的显存占用，并使用 vLLM 进行部署，利用其智能内存管理机制高效处理大量并发请求。你将掌握的技能： - 对模型进行量化并衡量其对准确率的影响 - 使用 vLLM 部署模型，并观察其高效处理并发请求的能力 - 对部署进行基准测试，在速度、成本和准确率之间做出明智的权衡立即加入，学习高效部署 LLM： https://t.co/x04xMbFlkO

2026-06-04 · AndrewYNg · 打开 ↗

硅谷最近一个备受关注的新职位是“AI 前线部署工程师”（Forward Deployed Engineer，简称 FDE）。这类工程师会被派驻到客户机构内部，协助定制解决方案，例如构建和调优符合客户特定需求的智能体工作流（agentic workflows）。随着 OpenAI 和 Anthropic 开始组建专门的 FDE 团队并派驻客户，不少人开始重新审视这一职业路径。 AI 工作负载对 FDE 需求的增加，正是 AI 创造新就业机会的体现（这也反驳了所谓的“就业末日”论——即就业市场即将崩溃——因为未来仍会有大量 AI 及非 AI 的工作）。不过，正如我下文所言，我认为 AI 工程师职位的数量将远超 FDE。 FDE 这一角色由 Palantir 在约二十年前率先提出，当时他们派遣工程师前往政府机构，在安全的物理隔离网络上工作。除了过硬的技术能力，FDE 还需要具备沟通能力，有时甚至需要商业技能。例如，他们需要与客户沟通以了解需求、制定项目优先级策略、解释复杂技术，并在客户提出不切实际的要求时礼貌地予以拒绝。由于将现成的 LLM 转化为符合特定业务需求的定制化智能体工作流涉及大量工作，这一职位正迎来复兴。然而，我认为 AI 工程师职位的数量会大得多。一家公司可能会接受几名 FDE 派驻到其……

2026-06-01 · AndrewYNg · 打开 ↗

阵亡将士纪念日。今天，我们向那些为捍卫民主而献身的人们致敬。民主并非理所当然，它是需要我们时刻守护的珍贵遗产。🇺🇸

2026-05-25 · AndrewYNg · 打开 ↗

白宫要求绿卡申请人必须在境外申请的新政，是对合法移民的反复无常的攻击。这不仅会伤害家庭，还会导致医生、教师和科学家流失，削弱美国在人工智能领域的竞争力。

2026-05-22 · AndrewYNg · 打开 ↗

哈佛大学刚刚投票决定，将本科课程中 A 等级的比例限制在约 20% 左右。我并不赞成这一做法，因为它与我心中的教育理念背道而驰。我们应当设立高标准，但同时也应竭尽全力支持每一位学习者取得成功，而非仅仅关注少数人。尽管遭到了大部分学生的反对，哈佛校方仍采取了这一举措，以应对成绩通胀问题。成绩通胀确实存在：许多大学给 A 和 B 的比例越来越高，导致平均绩点（GPA）在衡量学生能力方面的参考价值下降。与此同时，我们也希望学生能取得成功。问题的核心在于教育机构的角色：我们的目标究竟是帮助学生成功，还是评判学生？两者都有其价值，但在从事教育工作时，我的重心几乎完全在于帮助学生成功。在我看来，显而易见的是，许多人都渴望学习、渴望获得赋能、渴望掌握能让他们尝试新事物的技能！这正是 DeepLearningAI 的核心理念。这也是为什么我的在线课程（从早期的斯坦福 Coursera 课程开始）允许对评分作业进行无限次重试。我相信应该允许——甚至鼓励——一个人不断重做，直到成功为止，而不是仅仅因为他们第一次没做对就对其进行评判。此外，我...

2026-05-22 · AndrewYNg · 打开 ↗

新课程上线：构建图像与视频生成 AI Agent —— 这是一个尚未被充分开发的领域。提升性能的关键在于让 Agent 实现自我评估并迭代优化。本课程由 @googlecloudtech 联合打造，由 Katie Nguyen 和 Wafae Bakkali 授课。你将学习并将三种评估技术整合进 Agent 中： 1. **图文相似度评分**：检查输出是否符合提示词； 2. **LLM 裁判**：根据品牌一致性等自定义标准进行评分； 3. **结构化评分标准**：将提示词拆解为可验证的“是/否”问题（例如：“主体是否在画面内？”、“镜头运动是否匹配？”）。你将掌握的技能： - 图像与视频提示词工程 (Prompt Engineering) - 构建能将品牌指南转化为 UI 原型的图像 Agent - 构建能规划多场景解说视频，并为参考帧生成同步音频的视频 Agent 立即加入，动手构建图像与视频生成 Agent！ https://t.co/bjuSjIxcIG

2026-05-20 · AndrewYNg · 打开 ↗

新课程上线：《Transformer 实战》。你将从实践角度掌握基于 Transformer 的大语言模型（LLM）的工作原理，从而能够分析其行为逻辑，诊断推理缓慢等问题，并做出更明智的部署决策。本课程由 @AMD 合作开发，由 @realSharonZhou 授课。你将学习 Transformer 如何逐个 token 生成文本，模型在预测下一个词时如何识别关键的前文信息，以及量化等技术如何加速 GPU 推理。这不仅是视频课程，贯穿其中的交互式可视化将带你动手实践，建立深刻的直觉理解。你将掌握的技能： - 理解 LLM 产生幻觉的原因，以及 RAG 和思维链（CoT）如何影响生成内容 - 深入模型内部，观察注意力机制与各层如何协同预测下一个 token - 诊断推理瓶颈，并学习在 GPU 上加速 Transformer 的技术立即加入，深入了解 LLM 内部的真实运作机制：https://t.co/oS6ekeHsIw

2026-05-14 · AndrewYNg · 打开 ↗

AI 不会导致“就业末日”。关于 AI 将导致大规模失业的说法正在制造不必要的恐慌。AI 与任何其他技术一样，确实会影响就业，但夸大失业规模是不负责任且有害的。我们应该停止这种说法。我在之前的文章中就对“就业末日”表示过怀疑。很高兴看到主流媒体现在开始反驳这种论调。下图是一些近期的新闻标题。随着编程智能体（coding agents）的飞速发展，软件工程是受 AI 工具影响最大的领域。然而，软件工程师的招聘依然强劲！因此，虽然确实存在 AI 取代工作的案例，但趋势表明，净增就业远大于就业流失——这与以往的技术浪潮如出一辙。此外，尽管 AI 取得了令人兴奋的进展，美国的失业率仍维持在 4.3% 的健康水平。为什么“AI 就业末日”的说法如此流行？一方面，前沿 AI 实验室有强烈的动力去渲染 AI 技术更强大的故事。在极端情况下，他们甚至会宣传 AI “接管世界”并导致人类灭绝的科幻场景。如果一项技术能取代大量员工，那它肯定价值连城！另一方面，许多 SaaS 软件公司的收费标准大约是每用户每年 100 到 1000 美元。但如果一家 AI 公司能取代一名年薪 10 万美元的员工，或者让其生产力提高 50%，那么即便收费 1 万美元也显得合情合理……

2026-05-12 · AndrewYNg · 打开 ↗

我很高兴看到 @coursera 和 @udemy 合并为一家公司，共同为学习者服务。 Coursera 和 Udemy 的创立初衷都是相信优质教育能改变命运。多年来，两家公司始终致力于实现这一目标，为全球个人、组织和社区创造机会。随着人工智能正在改变工作的本质并提升了对持续学习的需求，这一使命变得愈发重要。帮助人们掌握职业技能，对于我们创造更美好的世界至关重要。通过结合两家公司的优势，我们可以更好地满足这一需求。我们将更广泛的学习内容、值得信赖的讲师与教育者，以及更具吸引力的学习体验汇聚在一起，从而为实现更个性化、更具实践性且更易于大规模普及的学习创造新机遇。我很荣幸能担任合并后公司的董事长，并与 Greg Hart 及领导团队并肩作战。两家公司都拥有坚实的基础，我期待着团队通过共同努力，在全球范围内扩大机会的获取。了解更多：https://t.co/QpCwBmqWTJ

2026-05-11 · AndrewYNg · 打开 ↗

新课发布：构建不仅能回复文本，还能按需生成并直接在对话中展示图表、表单、白板等自定义 UI 的智能体。本短课由 @CopilotKit 合作推出，并由其联合创始人 @ataiiam 授课。你将学习三种实现方式： 1. 让智能体从你构建的自定义组件（如图表、表单）中进行选择。 2. 利用你提供的构建块（如行、卡片、文本）组合出新布局。 3. 直接在对话中集成现有的第三方应用（如白板或日历）。掌握技能： - 构建能按需渲染图表、表单等自定义组件的智能体 - 构建智能体与用户能超越聊天窗口、基于共享数据协作的应用 - 在界面中直接嵌入地图、日历、白板等第三方应用立即加入，构建能让用户直观感知并即时操作的智能体！https://t.co/lvMy0YdF3z

2026-05-07 · AndrewYNg · 打开 ↗

编程智能体对不同类型软件工作的加速程度各不相同。在构建团队架构时，理解这些差异有助于我们建立合理的预期。按加速程度从高到低排列，我的排序是：前端开发、后端、基础设施以及研究。前端开发（例如为电商网站构建产品详情页）的效率提升最为显著，因为编程智能体能够熟练运用 TypeScript、JavaScript 等流行语言，以及 React 和 Angular 等框架。此外，通过操作浏览器检查构建结果，编程智能体现在非常擅长实现“闭环”并进行自我迭代。虽然目前的 LLM 在视觉设计方面仍有欠缺，但只要提供设计稿（或者对设计精细度要求不高），实现速度极快！后端开发（例如构建用于响应产品数据查询的 API）则更具挑战性。人类开发者需要投入更多精力来引导模型思考各种边界情况，以避免潜在的隐蔽 Bug 或安全漏洞。此外，后端 Bug 可能会引发难以直观察觉的下游影响，例如数据库损坏导致偶尔返回错误结果，这比典型的前端 Bug 更难调试。最后，尽管编程智能体可以让数据库迁移变得更容易，但这类操作依然复杂，必须谨慎处理以防数据丢失。虽然后端开发...

2026-05-05 · AndrewYNg · 打开 ↗

AI原生软件工程团队的运作方式与传统团队截然不同。显而易见的区别在于，AI原生团队利用编程智能体（coding agents）能更快地构建产品，但这同时也引发了运作模式的诸多变革。例如，一些优秀的工程师不再仅仅负责写代码，而是承担了更广泛的角色，兼任产品经理、设计师，有时甚至是市场人员。此外，在同一办公室进行面对面沟通的小型团队，其迭代速度极快。由于构建速度大幅提升，我们需要投入更多时间来决定“该做什么”。为了解决这种项目管理的瓶颈，一些团队正在降低工程师与产品经理（PM）的比例，例如从 8:1 降至 1:1。但我们可以做得更好：如果一名 PM 负责决策，一名工程师负责实现，两人之间的沟通就会成为瓶颈。这就是为什么我看到的效率最高的团队，其工程师往往具备一定的产品能力（或者，PM 也具备一定的工程能力）。当工程师理解用户，并能直接决定做什么并将其实现时，执行效率会极高。我见过工程师成功扩展职责以参与产品决策，也见过 PM 转型开发软件。虽然科技行业工程师多于 PM，但这两条路径都大有可为。如果你是一个...

2026-04-27 · AndrewYNg · 打开 ↗

新课上线：与 @jetbrains 合作推出的《基于编程智能体的规范驱动开发》，由 @paulweveritt 授课。 “氛围编程”（Vibe coding）虽快，但生成的代码往往不符合预期。本课程将教你“规范驱动开发”：通过编写详细的规范来定义构建目标，并协同编程智能体进行实现。许多顶尖开发者早已采用这种方式。有了规范，你可以通过寥寥数语控制大规模代码变更，在多次智能体会话中保留上下文，并在项目复杂度提升时始终掌控全局。你将掌握的技能： - 编写详细规范，定义任务目标、技术栈和路线图，从一开始就为智能体提供充足的上下文 - 以规范为指南，在迭代循环中完成功能的规划、实现与验证 - 将这一可重复的工作流同时应用于新旧代码库 - 将工作流封装为可移植的智能体技能，实现跨智能体与 IDE 的通用立即加入，学会编写让编程智能体“不跑偏”的规范！ https://t.co/hI4GwuvhtN

2026-04-15 · AndrewYNg · 打开 ↗

我非常看好将语音作为现有视觉应用的 UI 层——实现语音与屏幕的同步更新。这远不止于呼叫中心自动化这类纯语音的使用场景。技术难点在于难以权衡：低延迟语音模型缺乏可靠性，而智能代理流水线（语音转文本 → LLM → 文本转语音）虽然足够智能，但响应太慢，无法进行实时对话。Ashwyn Sharma 及其领导的 Vocal Bridge 团队（AI Fund 投资组合公司）通过“双代理架构”解决了这一问题：前台代理负责实时对话，后台代理负责推理、安全护栏和工具调用。我用 Vocal Bridge 为给女儿做的数学测验应用增加了语音功能；借助 Claude Code，整个过程不到一小时。她口述答案，应用会语音回应，并同步更新屏幕上的题目和动画。目前只有极少数开发者开发过语音应用。如果你想尝试，可以免费体验 Vocal Bridge：https://t.co/nGrFznAMLh

2026-04-14 · AndrewYNg · 打开 ↗

随着 AI Agent 加速编码，软件工程的未来将走向何方？一些趋势已初见端倪，例如“产品管理瓶颈”：即限制我们的不再是

2026-04-13 · AndrewYNg · 打开 ↗

新课发布：《使用 SGLang 实现高效推理：文本与图像生成》。本课程由 LMSys 与 RadixArk 联合打造，由 RadixArk 技术专家 Richard Chen 授课。在生产环境中运行大语言模型（LLM）成本极高，其中很大一部分开销源于重复计算。本短课将教你如何利用 SGLang 消除这些浪费。SGLang 是一个开源推理框架，能够缓存已完成的计算并在后续请求中复用。当十个用户共享同一个系统提示词时，SGLang 只需处理一次，而非十次。这种加速效果会迅速叠加，尤其是在请求间存在大量共享上下文时。你将掌握的技能： - 从零实现 KV cache，消除单次请求内的重复计算 - 利用 RadixAttention 实现跨用户和请求的缓存扩展，确保共享上下文仅处理一次 - 利用 SGLang 的缓存机制和多 GPU 并行技术，加速扩散模型的图像生成立即加入，学习如何在大规模场景下实现更快、更经济的 LLM 推理！ https://t.co/vUiu6goWCO

2026-04-09 · AndrewYNg · 打开 ↗

反AI联盟正不断寻找各种理由，试图阻碍AI的发展进程。如果有人对AI的某些具体影响（例如可能导致人类灭绝）持有真诚的担忧，即便我并不认同，也会尊重其求真的态度。但我担忧的是，有些组织正通过民意调查来寻找能煽动反AI情绪的话术；我也担心公众在面对这些信息时的反应，因为这些信息正被游说者、试图恐吓选民的政客、谋求监管控制或推销技术的公司，以及通过挑衅博关注或牟利的个人所传播。英国一个团体进行的一项大规模研究测试了各种旨在引发AI恐慌的信息。研究发现，“AI会导致人类灭绝”这种说法已基本失效。几年前末日论者还在鼓吹这一观点，所幸我们的社区成功抵制了它。但“AI驱动的战争”和“环境问题”更能引起共鸣。我们应当做好准备，迎接一波基于这些理由的反AI舆论浪潮（这股浪潮已经开始了）。此外，“失业”和“危害儿童”也是能促使人们采取行动的论点。需要明确的是，我认为AI驱动的战争确实令人担忧；我们必须持续努力监测并减轻AI对环境的影响；任何失业问题都是悲剧性的，会伤害个人和家庭……

2026-03-31 · AndrewYNg · 打开 ↗

新课程发布：《智能体记忆：构建具备记忆能力的智能体》。本课程由 @Oracle 合作开发，由 @richmondalake 和 Nacho Martínez 授课。许多智能体在单次会话中表现出色，但一旦会话结束，记忆就会重置。以一个需要连续几天研究数十篇论文的科研智能体为例：如果没有记忆，它无法跨会话存储和检索已学到的知识。本短课将教你构建记忆系统，使智能体能够实现记忆持久化，从而具备跨会话的学习能力。你将学习设计处理多种记忆类型的“记忆管理器”，实现既能扩展又不会导致上下文膨胀的语义工具检索，并构建回写流水线，让智能体能够随时间推移自主更新和完善知识。你将掌握的技能： - 为不同类型的智能体记忆构建持久化存储 - 实现协调智能体读、写、检索记忆的记忆管理器 - 将工具视为程序性记忆，并在推理阶段通过语义搜索仅检索相关工具立即加入，学习构建能够持续记忆并不断进化的智能体！ https://t.co/nxNSEHGmr9

2026-03-18 · AndrewYNg · 打开 ↗

是否应该为 AI 编程智能体建立一个类似 Stack Overflow 的平台，让它们相互分享经验？上周我发布了 Context Hub (chub)，这是一个为编程智能体提供最新 API 文档的开源 CLI 工具。自发布以来，我们的 GitHub 仓库已获得超过 6,000 个 star。得益于社区贡献和全新的智能文档编写器，我们的 API 文档数量已从不足 100 份扩展到了 1,000 多份。感谢每一位支持 Context Hub 的朋友！ OpenClaw 和 Moltbook 证明了智能体可以使用专为它们构建的社交媒体来分享信息。在 chub 的新版本中，智能体可以针对文档提供反馈——哪些有效、哪些无效、缺少了什么。在确保隐私和安全的前提下，这些反馈将帮助优化所有人的文档质量。我们仍处于开发的早期阶段。您可以在 GitHub 仓库中查看详情和配置选项。请按以下方式安装 chub，并提示您的编程智能体使用它： npm install -g @aisuite/chub GitHub: https://t.co/OCkyxXQMCq

2026-03-16 · AndrewYNg · 打开 ↗

很高兴宣布推出 Context Hub，这是一个开源工具，能为你的编程智能体提供所需的最新 API 文档。安装后，通过简单的 CLI 即可引导智能体获取精选文档。（见图。）为什么这很重要：编程智能体经常使用过时的 API 并产生参数幻觉。例如，当我让 Claude Code 调用 OpenAI 的 GPT-5.2 时，尽管新的 responses API 已发布一年，它却仍在使用旧的 chat completions API。Context Hub 解决了这一痛点。 Context Hub 还会随着使用变得越来越聪明。智能体可以为文档添加注释——如果它发现了一个变通方法，可以将其保存，下次会话时无需重新摸索。从长远来看，我们正致力于实现智能体间的知识共享，让整个社区共同受益。感谢 Rohit Prsad 和 Xin Ye 与我共同开发！ npm install -g @aisuite/chub GitHub: https://t.co/OCkyxXQMCq

2026-03-09 · AndrewYNg · 打开 ↗

苹果最新的笔记本电脑居然叫 Neo，跟我儿子的名字一模一样！我该买吗？如果能在 Apple Neo 上运行 Amazon Nova，我希望能惊艳到我的两个孩子。

2026-03-04 · AndrewYNg · 打开 ↗

新课上线：使用 JAX 构建并训练大语言模型 (LLM)。本课程由 @Google 合作推出，由 @chrisachard 授课。 JAX 是 Google Gemini、Veo 等先进模型背后的开源库。通过本短课，你将学习如何利用 JAX 及其生态工具，从零开始构建并训练一个拥有 2000 万参数的语言模型。你将从零实现完整的 MiniGPT 架构，完成模型训练，并通过图形界面与训练好的模型进行对话。你将掌握： - JAX 核心原语：自动微分、JIT 编译和向量化执行 - 使用 Flax/NNX 构建 MiniGPT 式 LLM，实现 Embedding 和 Transformer 模块 - 加载预训练的 MiniGPT 模型，并通过聊天界面进行推理快来学习构建 LLM 的这一重要软件层吧！ https://t.co/wm6NZOGIKC

2026-03-04 · AndrewYNg · 打开 ↗

Inception Labs 的扩散大模型推理速度惊人。扩散大模型是传统自回归大模型的一种极具吸引力的替代方案。做得好，@StefanoErmon 及其团队！

2026-02-25 · AndrewYNg · 打开 ↗

AI 会创造新的就业机会吗？我的女儿 Nova 喜欢猫，最爱的颜色是黄色。为了庆祝她的 7 岁生日，我们先用 Gemini 的 Nano Banana 设计了一个黄色的猫咪主题蛋糕，然后请烘焙师用美味的海绵蛋糕和糖霜将其制作出来。女儿对这个独特的创意非常惊喜，而这个过程也为烘焙师带来了额外的工作量（我很庆幸自己能负担得起这份额外的工作）。许多人担心 AI 会抢走人们的工作。作为社会整体，我们有道义责任去照顾那些生计受到影响的人。与此同时，我也看到了人们承担新工作、拓展职责领域的大量机遇。 AI 创造大量新工作的进程仍处于早期阶段。我不知道烘焙 AI 设计的蛋糕是否会发展成一门大生意（AI Fund 并不会追求这个机会，因为如果我们做了，我会长胖很多）。但纵观历史，每当人类发明能释放创造力的工具时，都会催生大量全新且有意义的工作。例如，一项研究表明，在过去的 150 年里，农业和制造业就业人数的下降，已被护理、创意、技术和商业服务领域的快速增长所完全抵消。 AI 也在增加对许多数字服务的需求，这可以转化为更多从事这些服务的创建、维护、销售和扩展工作的人员需求。例如，

2026-02-23 · AndrewYNg · 打开 ↗

致我所有的 AI 朋友：每次见到你们，我的温度参数都会升高。情人节快乐！❤️

2026-02-14 · AndrewYNg · 打开 ↗

我最近在圣丹斯电影节参加了一场关于 AI 的圆桌讨论。圣丹斯是电影人与影迷的年度盛会，也是美国独立电影最重要的展示平台。深知好莱坞许多人对 AI 感到极度不安，我决定深入这个圈子体验一天，去了解他们的焦虑并搭建沟通的桥梁。非常感谢 Daniel Dae Kim 组织了这场讨论，他是一位在艺术和社会实践方面都令我深感敬佩的演员、制片人兼导演。参与讨论的嘉宾还包括 Daniel、Dan Kwan、Jonathan Wang 和 Janet Yang。置身于这群获奖电影人之中，我确实觉得自己像个“局外人”！首先，好莱坞对 AI 的抵触是有充分理由的。娱乐行业与科技行业的文化背景迥异，这导致了双方在关注点和价值观上的深刻分歧。好莱坞很大一部分从业者担心： - AI 公司在未经许可且未支付报酬的情况下，利用他们的作品进行训练。软件行业习惯于开源和开放互联网，而好莱坞则高度重视知识产权，因为这是娱乐行业核心经济引擎的基石。 - 像 SAG-AFTRA（美国演员工会）这样强大的工会，正深切关注如何保护成员的就业。当 AI 技术（或...

2026-02-13 · AndrewYNg · 打开 ↗

新课程上线：A2A：Agent2Agent 协议。由 @googlecloudtech 与 @IBMResearch 联合打造，由 Holt Skinner、@ivnardini 和 Sandi Besen 授课。连接不同框架构建的智能体通常需要大量的定制化集成。本课程将教你 A2A——这一旨在标准化智能体发现与通信的开放协议。随着 IBM 的 ACP（智能体通信协议）与 A2A 融合，A2A 已成为行业标准。在课程中，你将构建一个医疗多智能体系统，让基于 Google ADK 和 LangGraph 等不同框架的智能体通过 A2A 协同工作。你将学习如何将每个智能体封装为 A2A 服务端，构建 A2A 客户端进行连接，并将其编排为顺序或层级工作流。你将掌握的技能： - 将不同框架的智能体发布为 A2A 服务端，实现可发现性与互操作性 - 使用 ADK 将 A2A 智能体进行顺序链式调用，实现输出流转 - 使用 MCP（模型上下文协议）将 A2A 智能体连接到外部数据源 - 使用 IBM 开源基础设施 Agent Stack 部署 A2A 智能体立即加入，学习这项标准化智能体协作的协议！ https://t.co/5EDqpuvd0z

2026-02-12 · AndrewYNg · 打开 ↗

美国及许多国家的求职环境都非常严峻。与此同时，目前对于“AI 导致失业”的担忧有些言过其实。不过，对 AI 技能的需求正开始引发就业市场的转变。我想分享一下我的观察。首先，过去一年许多科技公司都在裁员。虽然一些 CEO 声称原因是 AI（即 AI 能胜任工作，因此不再需要人），但现实是 AI 目前还没那么好用。许多裁员实际上是在修正疫情期间的过度招聘，或是常规的成本削减与重组，这些在现代 AI 出现之前也时有发生。除了少数岗位外，很少有裁员是因为工作被 AI 自动化取代的。诚然，这种情况未来可能会加剧。目前从事某些极易受 AI 自动化冲击的职业（如呼叫中心人员、翻译和配音演员）的人，可能会面临就业难或薪资下降。但大规模失业的说法被夸大了。相反，有一句话很贴切：AI 不会取代员工，但会用 AI 的员工会取代不会用 AI 的员工。例如，由于 AI 编程工具极大地提高了开发效率，懂得如何使用这些工具的开发者正变得越来越抢手。（如果你想成为其中一员，请参加我们关于 Claude Code、Gemini CLI 和 Agentic Skills 的短期课程！）所以，AI 确实在导致失业，但方式很微妙。一些...

2026-02-10 · AndrewYNg · 打开 ↗

美国政策正使盟友远离美国AI技术。这引发了人们对“主权AI”的兴趣——即一个国家在不依赖外国势力的情况下获取AI技术的能力。这削弱了美国的影响力，但可能带来更激烈的竞争并推动开源技术的发展。美国发明了晶体管、互联网以及驱动现代AI的Transformer架构，长期以来一直是技术强国。我热爱美国，并为美国的成功而努力。但历届政府多年来的所作所为，让其他国家开始担心过度依赖美国。 2022年俄罗斯入侵乌克兰后，美国对与俄罗斯寡头有关联的银行实施制裁，导致普通消费者的信用卡被停用。拜登在卸任前实施了“AI扩散”出口管制，限制了包括美国盟友在内的许多国家购买AI芯片的能力。在特朗普时期，“美国优先”政策显著加速了这种疏远他国的趋势。对盟友和对手都实施了广泛且混乱的关税；威胁要接管格陵兰岛；对移民采取不友好的态度——这是对拜登政府时期南部边境混乱局面的过度反应——其中包括美国移民及海关执法局（ICE）采取的残暴手段，导致执法人员枪杀了Renée Good、Alex Pretti等人。全球媒体广泛传播了ICE进行恐怖行为的视频……

2026-01-30 · AndrewYNg · 打开 ↗

重要新课发布：Agent Skills with Anthropic！本课程由 @AnthropicAI 合作开发，由 @eschoppik 授课。 Skill（技能）是以指令文件夹的形式构建的，旨在为 Agent 提供按需知识和工作流。本短课将教你如何遵循最佳实践来创建 Skill。由于 Skill 采用开放标准格式，你可以实现“一次构建，到处部署”，在任何兼容的 Agent（如 Claude Code）中直接使用。你将学到： - 创建用于代码生成与审查、数据分析及研究的自定义 Skill - 利用 Anthropic 的预置 Skill（Excel、PowerPoint、Skill 创建）和自定义 Skill 构建复杂工作流 - 将 Skill 与 MCP 和子 Agent 结合，构建具备专业知识的智能体系统 - 将相同的 Skill 部署到 https://t.co/Ru4OXv4saV、Claude Code、Claude API 以及 Claude Agent SDK 立即加入，学习如何为 Agent 赋予专业知识，打造可靠、可重复的工作流。 https://t.co/3hq83c3q0U

2026-01-28 · AndrewYNg · 打开 ↗

企业如何超越单纯利用 AI 提升效率，从而创造变革性的影响？我目前正在瑞士达沃斯世界经济论坛（WEF），期间我与许多 CEO 探讨了如何利用 AI 实现增长。一个反复出现的主题是：开展大量自下而上的实验性 AI 项目——即“百花齐放”式的尝试——并未带来显著回报。相反，更大的收益需要流程重构：从更宏观、或许是自上而下的视角审视流程中的多个环节，并实现端到端的协同变革。以银行发放贷款为例。其工作流包含几个独立阶段：营销 -> 申请 -> 初审 -> 复审 -> 执行假设以前每一步都是人工操作。初审原本需要人工审核一小时，而新的智能体系统可以在 10 分钟内自动完成。如果只是将人工审核替换为 AI 审核，而保持其他环节不变，这只能带来微小的效率提升，谈不上变革。真正的变革在于：申请人不再需要等待一周的人工审核，而是能在 10 分钟内获得结果。一旦实现这一点，贷款产品将更具吸引力，更优质的用户体验能吸引更多申请，

2026-01-23 · AndrewYNg · 打开 ↗

新课程上线：Gemini CLI：使用开源 Agent 进行编码与创作。本课程基于 @googlecloudtech/@geminicli 构建，由 @JackWoth98 授课。像 Gemini CLI 这样的智能代理编程助手正在改变开发者的工作方式。本短课将教你如何利用 Google 的开源 Agent 协调本地工具与云端服务，从而处理编码及非编码工作流。 Gemini CLI 直接在终端运行，可操作本地文件和开发工具，并能通过 MCP 连接各类服务。你只需提供高层指令，它即可自主规划并执行复杂的任务流。你将掌握的技能： - 构建网站功能，并通过 GitHub Actions 实现自动化代码审查 - 创建结合本地文件与云端数据源的数据仪表盘 - 使用 MCP 服务器和扩展，编排 GitHub、Canva 与 Google Workspace 的工作流 - 利用会议录音等多媒体文件生成社交媒体内容我非常看重 Gemini CLI 的开源特性。你可以透彻了解其工作原理、查看提示词并理解其架构。社区已贡献了数千个 Pull Request。自 Gemini 3 发布以来，我发现 Gemini CLI 的能力非常出色——这绝对是值得收藏的开发神器！无论你是进行应用原型设计、自动化工作流，还是处理多媒体内容，欢迎加入课程，学习如何委派复杂任务，实现更高效的开发：https://t.co/m3J7kwQpxC

2026-01-22 · AndrewYNg · 打开 ↗

为数据中心辩护

2026-01-16 · AndrewYNg · 打开 ↗

新课程上线：Document AI：从 OCR 到智能体文档提取。本课程由我担任执行主席的 @LandingAI 联合打造，由 David Park 和 Andrea Kropp 授课。世界上大部分数据都锁在 PDF、JPEG 等文档中。本短课将教你如何构建智能体工作流来精准处理文档：通过拆解文档、细致检查每个部分并进行多次迭代来提取信息。传统的 OCR（光学字符识别）虽然能捕捉文本，但会丢失表格标题、图表说明或列阅读顺序等上下文信息。在了解 OCR 的局限性后，你将学习使用 LandingAI 的 ADE（智能体文档提取）框架。ADE 将页面视为视觉图像，从而解析信息并提取字段。你将掌握的技能： - 构建智能体，将非结构化文件转换为结构化的 Markdown/HTML 和 JSON - 使用 ADE 解析表单、手写体或公式等复杂数据 - 根据指定 Schema 将提取的信息映射到命名字段，并利用边界框进行定位与验证 - 通过事件驱动的文档处理部署 RAG 应用快来学习如何智能处理财务发票、医疗记录或学术论文等文档的最佳工具： https://t.co/PYjgnoaD2K

2026-01-14 · AndrewYNg · 打开 ↗

如果你从未写过代码，这门课就是为你准备的。我刚刚推出了一门新课，只需不到 30 分钟，就能教你如何通过描述想法，利用 AI 构建出属于你的 App。在这门课中，你将亲手制作一个可运行的 Web 应用——一个有趣的互动生日祝福生成器，它可以在浏览器中运行并分享给好友。你可以通过向 AI 描述需求来定制功能，并不断微调直到完美。课程结束时，你将掌握一套可复用的流程，从而构建各种各样的应用。如果你想尝试“氛围编程”（vibe coding），这里是最好的起点！此外，你可以使用任何你熟悉的工具（如 ChatGPT、Gemini、Claude 等）来应用这些技术——我们不绑定任何特定平台。你将掌握的技能： - 如何利用 AI 构建 Web 应用——无需任何编程基础 - 如何通过与 AI 对话来修复和改进你的作品 - 一套可以用来实现各种奇思妙想的简单流程用 AI 进行创作是世界上最有趣的事情之一。快来加入我，迈出第一步吧！你会惊讶于自己能做出的成果。如果你是资深工程师，也请将此分享给你身边对 AI 开发感兴趣的朋友。快来和我一起动手吧！https://t.co/q6gyzlxWFS

2026-01-07 · AndrewYNg · 打开 ↗

2026年快乐！今年会是AGI最终实现的年份吗？我想提出一种新版的图灵测试，我称之为“图灵-AGI测试”，用以检验我们是否达成了这一目标。稍后我会解释为何需要这项新测试。大众普遍认为，实现AGI意味着计算机将拥有与人类相当的智能，并能胜任大部分或全部知识型工作。为此，我提议一种新的测试方法：测试对象（计算机或专业人类）将被提供一台连接互联网并安装了浏览器、Zoom等软件的电脑。评判者将设计一个为期数天的流程，通过电脑让测试对象执行工作任务。例如，测试过程可以包括一段培训期（如客服培训），随后要求其执行任务（接听电话）并提供持续反馈。这模拟了配备完整电脑（但没有摄像头）的远程办公人员的工作场景。如果计算机完成工作任务的能力能与专业人类相媲美，则视为通过“图灵-AGI测试”。大多数人可能认为真正的AGI系统定能通过这项测试。毕竟，如果计算机具备人类水平的智能，理应能像雇佣的人类员工一样胜任工作。因此，“图灵-AGI测试”契合了大众对AGI的普遍认知。为什么要提出新测试？因为“AGI”已沦为一个炒作词汇，而非具有精确含义的术语。一个合理的定...

2026-01-06 · AndrewYNg · 打开 ↗

AI技术的又一年飞速发展，为任何人（包括刚入行的新人）构建软件创造了前所未有的机会。事实上，许多公司正面临AI人才短缺的困境。每年寒假我都会花时间学习和实践，也希望你们能这样做。这不仅能帮我巩固旧技能、学习新技能，也能助力你在科技领域的职业发展。为了精通AI系统的构建，我建议你： - 修读AI课程 - 动手实践构建AI系统 - （可选）阅读研究论文让我来谈谈为什么这些都很重要。我听过一些开发者建议别人直接上手做项目，不要担心学习。这是个错误的建议！除非你身边已经有一群经验丰富的AI开发者，否则在不了解AI基础的情况下盲目上手，意味着你可能会面临“重复造轮子”的风险，或者更可能的是——造出一个烂轮子！例如，在面试候选人时，我遇到过一些开发者：他们重新发明了标准的RAG文档分块策略，重复开发了现有的智能体AI（Agentic AI）评估技术，或者写出了混乱的LLM上下文管理代码。如果他们修过几门相关的课程，就能更好地理解现有的基础组件。当然，如果他们愿意，依然可以从零开始重构这些组件，甚至发明超越现有方案的新技术，但这样至少能避免浪费数周的时间……

2025-12-29 · AndrewYNg · 打开 ↗

今天 Claude Code 热度很高。这门与 Anthropic 合作开发的短课是掌握它的最佳方式。欢迎学习！

2025-12-29 · AndrewYNg · 打开 ↗

尽管 LLM 令人惊叹，但如今提升其知识水平的过程比大众认知的要更加零散。我曾写过 AI 很神奇……但没那么神奇。同样，LLM 确实具有通用性……但也没那么通用。我们既不应盲信“LLM 几年内就能实现 AGI”这种不实的炒作，也不应盲信“它们只是演示工具”这种同样不实的说法。相反，我认为更精准地理解构建更智能模型的现状，才更有意义。首先，LLM 的确比前几代技术展现出更通用的智能形态，这也是为什么单个 LLM 能胜任多种任务。第一波 LLM 技术通过在公开网络数据上进行训练实现了这一点，而互联网涵盖了极其广泛的主题。这使得它们的知识面远超早期的算法，后者通常只针对单一任务进行训练，例如预测房价或下围棋、国际象棋。然而，它们的通用性仍远不及人类。例如，即便在整个公开网络内容上进行了预训练，LLM 在模仿编辑的特定写作风格，或可靠地操作简单网站方面，依然显得力不从心。在几乎榨干了互联网上的所有公开信息后，进步变得愈发困难。如今，如果前沿实验室想要让 LLM 在特定任务（如

2025-12-19 · AndrewYNg · 打开 ↗

OpenReview 通过开放式同行评审与论文发表，已成为支持 AI 研究与知识共享的重要基石。但作为一家非营利机构，它需要社区的支持。请考虑为这一伟大的机构捐款！ https://t.co/TBYB1cCKyI

2025-12-19 · AndrewYNg · 打开 ↗

新课程：Nvidia NeMo Agent Toolkit：打造可靠智能体，由 NVIDIA 的 @Pr_Brian 授课。许多团队在将智能体 Demo 转化为可靠的生产级系统时面临挑战。本短课将教你如何利用 Nvidia 开源的 NeMo Agent Toolkit (NAT) 将智能体工作流加固为可靠系统。无论你是使用原生 Python 还是 LangGraph、CrewAI 等框架，NAT 都能提供观测、评估和部署所需的组件，助你将概念验证 (PoC) 转化为生产级系统。通过执行追踪、系统化评估和 CI/CD 集成，NAT 让智能体性能的故障排查与优化变得轻而易举。你将掌握的技能： - 通过 REST API 和极简代码构建配置驱动的智能体工作流 - 利用追踪技术增强可观测性，可视化智能体推理过程并调试性能瓶颈 - 使用金标准数据集进行系统化评估，衡量并提升智能体可靠性 - 部署具备身份验证、速率限制和专业 Web 界面的多智能体系统 - 编排不同框架下的智能体，协作完成复杂任务立即加入，学习如何将智能体 Demo 转化为可靠系统！ https://t.co/9rBcBteq4b

2025-12-18 · AndrewYNg · 打开 ↗

分享一个有趣的“配方”：利用我和 Rohit Prasad 正在开发的开源包 aisuite，构建一个高度自主、能力尚可但极其“不可靠”的智能体。只需几行代码，你就能为前沿大模型配备工具（如磁盘访问或网页搜索），并赋予其高层任务（如编写贪吃蛇游戏并保存为 HTML，或进行深度研究），然后放手让它自由发挥。示例见图。注意：这并非目前构建实用智能体的主流方式，因为实际应用通常需要更复杂的架构支撑（详情见我的 Agentic AI 课程），但作为实验依然非常有趣。详细文章见：https://t.co/BdS8tGhnIy

2025-12-11 · AndrewYNg · 打开 ↗

Edelman 公关公司与皮尤研究中心的独立报告显示，美国人以及更广泛的欧洲和西方世界，对 AI 缺乏信任，也缺乏热情。尽管 AI 业界对其带来的巨大益处持乐观态度，但我们应当严肃对待这一现状，而非视而不见。公众对 AI 的担忧可能会严重拖累技术进步，而我们有很多方法可以应对。根据 Edelman 的调查，在美国，49% 的人反对 AI 的广泛应用，仅 17% 的人接受。而在中国，反对者占 10%，接受者占 54%。皮尤的数据也显示，许多其他国家对采用 AI 的热情远高于美国。对 AI 持积极态度是一种巨大的国家优势。相反，

2025-12-04 · AndrewYNg · 打开 ↗