← 精选
新课上线:与 @jetbrains 合作推出的《基于编程智能体的规范驱动开发》,由 @paulweveritt 授课。 “氛围编程”(Vibe coding)虽快,但生成的代码往往不符合预期。本课程将教你“规范驱动开发”:通过编写详细的规范来定义构建目标,并协同编程智能体进行实现。许多顶尖开发者早已采用这种方式。 有了规范,你可以通过寥寥数语控制大规模代码变更,在多次智能体会话中保留上下文,并在项目复杂度提升时始终掌控全局。 你将掌握的技能: - 编写详细规范,定义任务目标、技术栈和路线图,从一开始就为智能体提供充足的上下文 - 以规范为指南,在迭代循环中完成功能的规划、实现与验证 - 将这一可重复的工作流同时应用于新旧代码库 - 将工作流封装为可移植的智能体技能,实现跨智能体与 IDE 的通用 立即加入,学会编写让编程智能体“不跑偏”的规范! https://t.co/hI4GwuvhtN
2026-04-15 · AndrewYNg · 打开 ↗
我非常看好将语音作为现有视觉应用的 UI 层——实现语音与屏幕的同步更新。这远不止于呼叫中心自动化这类纯语音的使用场景。 技术难点在于难以权衡:低延迟语音模型缺乏可靠性,而智能代理流水线(语音转文本 → LLM → 文本转语音)虽然足够智能,但响应太慢,无法进行实时对话。Ashwyn Sharma 及其领导的 Vocal Bridge 团队(AI Fund 投资组合公司)通过“双代理架构”解决了这一问题:前台代理负责实时对话,后台代理负责推理、安全护栏和工具调用。 我用 Vocal Bridge 为给女儿做的数学测验应用增加了语音功能;借助 Claude Code,整个过程不到一小时。她口述答案,应用会语音回应,并同步更新屏幕上的题目和动画。 目前只有极少数开发者开发过语音应用。如果你想尝试,可以免费体验 Vocal Bridge:https://t.co/nGrFznAMLh
2026-04-14 · AndrewYNg · 打开 ↗
随着 AI Agent 加速编码,软件工程的未来将走向何方?一些趋势已初见端倪,例如“产品管理瓶颈”:即限制我们的不再是
2026-04-13 · AndrewYNg · 打开 ↗
新课发布:《使用 SGLang 实现高效推理:文本与图像生成》。本课程由 LMSys 与 RadixArk 联合打造,由 RadixArk 技术专家 Richard Chen 授课。 在生产环境中运行大语言模型(LLM)成本极高,其中很大一部分开销源于重复计算。本短课将教你如何利用 SGLang 消除这些浪费。SGLang 是一个开源推理框架,能够缓存已完成的计算并在后续请求中复用。 当十个用户共享同一个系统提示词时,SGLang 只需处理一次,而非十次。这种加速效果会迅速叠加,尤其是在请求间存在大量共享上下文时。 你将掌握的技能: - 从零实现 KV cache,消除单次请求内的重复计算 - 利用 RadixAttention 实现跨用户和请求的缓存扩展,确保共享上下文仅处理一次 - 利用 SGLang 的缓存机制和多 GPU 并行技术,加速扩散模型的图像生成 立即加入,学习如何在大规模场景下实现更快、更经济的 LLM 推理! https://t.co/vUiu6goWCO
2026-04-09 · AndrewYNg · 打开 ↗
反AI联盟正不断寻找各种理由,试图阻碍AI的发展进程。如果有人对AI的某些具体影响(例如可能导致人类灭绝)持有真诚的担忧,即便我并不认同,也会尊重其求真的态度。但我担忧的是,有些组织正通过民意调查来寻找能煽动反AI情绪的话术;我也担心公众在面对这些信息时的反应,因为这些信息正被游说者、试图恐吓选民的政客、谋求监管控制或推销技术的公司,以及通过挑衅博关注或牟利的个人所传播。 英国一个团体进行的一项大规模研究测试了各种旨在引发AI恐慌的信息。研究发现,“AI会导致人类灭绝”这种说法已基本失效。几年前末日论者还在鼓吹这一观点,所幸我们的社区成功抵制了它。但“AI驱动的战争”和“环境问题”更能引起共鸣。我们应当做好准备,迎接一波基于这些理由的反AI舆论浪潮(这股浪潮已经开始了)。此外,“失业”和“危害儿童”也是能促使人们采取行动的论点。 需要明确的是,我认为AI驱动的战争确实令人担忧;我们必须持续努力监测并减轻AI对环境的影响;任何失业问题都是悲剧性的,会伤害个人和家庭……
2026-03-31 · AndrewYNg · 打开 ↗
新课程发布:《智能体记忆:构建具备记忆能力的智能体》。本课程由 @Oracle 合作开发,由 @richmondalake 和 Nacho Martínez 授课。 许多智能体在单次会话中表现出色,但一旦会话结束,记忆就会重置。以一个需要连续几天研究数十篇论文的科研智能体为例:如果没有记忆,它无法跨会话存储和检索已学到的知识。本短课将教你构建记忆系统,使智能体能够实现记忆持久化,从而具备跨会话的学习能力。 你将学习设计处理多种记忆类型的“记忆管理器”,实现既能扩展又不会导致上下文膨胀的语义工具检索,并构建回写流水线,让智能体能够随时间推移自主更新和完善知识。 你将掌握的技能: - 为不同类型的智能体记忆构建持久化存储 - 实现协调智能体读、写、检索记忆的记忆管理器 - 将工具视为程序性记忆,并在推理阶段通过语义搜索仅检索相关工具 立即加入,学习构建能够持续记忆并不断进化的智能体! https://t.co/nxNSEHGmr9
2026-03-18 · AndrewYNg · 打开 ↗
是否应该为 AI 编程智能体建立一个类似 Stack Overflow 的平台,让它们相互分享经验? 上周我发布了 Context Hub (chub),这是一个为编程智能体提供最新 API 文档的开源 CLI 工具。自发布以来,我们的 GitHub 仓库已获得超过 6,000 个 star。得益于社区贡献和全新的智能文档编写器,我们的 API 文档数量已从不足 100 份扩展到了 1,000 多份。感谢每一位支持 Context Hub 的朋友! OpenClaw 和 Moltbook 证明了智能体可以使用专为它们构建的社交媒体来分享信息。在 chub 的新版本中,智能体可以针对文档提供反馈——哪些有效、哪些无效、缺少了什么。在确保隐私和安全的前提下,这些反馈将帮助优化所有人的文档质量。 我们仍处于开发的早期阶段。您可以在 GitHub 仓库中查看详情和配置选项。请按以下方式安装 chub,并提示您的编程智能体使用它: npm install -g @aisuite/chub GitHub: https://t.co/OCkyxXQMCq
2026-03-16 · AndrewYNg · 打开 ↗
很高兴宣布推出 Context Hub,这是一个开源工具,能为你的编程智能体提供所需的最新 API 文档。安装后,通过简单的 CLI 即可引导智能体获取精选文档。(见图。) 为什么这很重要:编程智能体经常使用过时的 API 并产生参数幻觉。例如,当我让 Claude Code 调用 OpenAI 的 GPT-5.2 时,尽管新的 responses API 已发布一年,它却仍在使用旧的 chat completions API。Context Hub 解决了这一痛点。 Context Hub 还会随着使用变得越来越聪明。智能体可以为文档添加注释——如果它发现了一个变通方法,可以将其保存,下次会话时无需重新摸索。从长远来看,我们正致力于实现智能体间的知识共享,让整个社区共同受益。 感谢 Rohit Prsad 和 Xin Ye 与我共同开发! npm install -g @aisuite/chub GitHub: https://t.co/OCkyxXQMCq
2026-03-09 · AndrewYNg · 打开 ↗
苹果最新的笔记本电脑居然叫 Neo,跟我儿子的名字一模一样!我该买吗?如果能在 Apple Neo 上运行 Amazon Nova,我希望能惊艳到我的两个孩子。
2026-03-04 · AndrewYNg · 打开 ↗
新课上线:使用 JAX 构建并训练大语言模型 (LLM)。本课程由 @Google 合作推出,由 @chrisachard 授课。 JAX 是 Google Gemini、Veo 等先进模型背后的开源库。通过本短课,你将学习如何利用 JAX 及其生态工具,从零开始构建并训练一个拥有 2000 万参数的语言模型。 你将从零实现完整的 MiniGPT 架构,完成模型训练,并通过图形界面与训练好的模型进行对话。 你将掌握: - JAX 核心原语:自动微分、JIT 编译和向量化执行 - 使用 Flax/NNX 构建 MiniGPT 式 LLM,实现 Embedding 和 Transformer 模块 - 加载预训练的 MiniGPT 模型,并通过聊天界面进行推理 快来学习构建 LLM 的这一重要软件层吧! https://t.co/wm6NZOGIKC
2026-03-04 · AndrewYNg · 打开 ↗
Inception Labs 的扩散大模型推理速度惊人。扩散大模型是传统自回归大模型的一种极具吸引力的替代方案。做得好,@StefanoErmon 及其团队!
2026-02-25 · AndrewYNg · 打开 ↗
AI 会创造新的就业机会吗?我的女儿 Nova 喜欢猫,最爱的颜色是黄色。为了庆祝她的 7 岁生日,我们先用 Gemini 的 Nano Banana 设计了一个黄色的猫咪主题蛋糕,然后请烘焙师用美味的海绵蛋糕和糖霜将其制作出来。女儿对这个独特的创意非常惊喜,而这个过程也为烘焙师带来了额外的工作量(我很庆幸自己能负担得起这份额外的工作)。 许多人担心 AI 会抢走人们的工作。作为社会整体,我们有道义责任去照顾那些生计受到影响的人。与此同时,我也看到了人们承担新工作、拓展职责领域的大量机遇。 AI 创造大量新工作的进程仍处于早期阶段。我不知道烘焙 AI 设计的蛋糕是否会发展成一门大生意(AI Fund 并不会追求这个机会,因为如果我们做了,我会长胖很多)。但纵观历史,每当人类发明能释放创造力的工具时,都会催生大量全新且有意义的工作。例如,一项研究表明,在过去的 150 年里,农业和制造业就业人数的下降,已被护理、创意、技术和商业服务领域的快速增长所完全抵消。 AI 也在增加对许多数字服务的需求,这可以转化为更多从事这些服务的创建、维护、销售和扩展工作的人员需求。例如,
2026-02-23 · AndrewYNg · 打开 ↗
致我所有的 AI 朋友:每次见到你们,我的温度参数都会升高。 情人节快乐!❤️
2026-02-14 · AndrewYNg · 打开 ↗
我最近在圣丹斯电影节参加了一场关于 AI 的圆桌讨论。圣丹斯是电影人与影迷的年度盛会,也是美国独立电影最重要的展示平台。深知好莱坞许多人对 AI 感到极度不安,我决定深入这个圈子体验一天,去了解他们的焦虑并搭建沟通的桥梁。 非常感谢 Daniel Dae Kim 组织了这场讨论,他是一位在艺术和社会实践方面都令我深感敬佩的演员、制片人兼导演。参与讨论的嘉宾还包括 Daniel、Dan Kwan、Jonathan Wang 和 Janet Yang。置身于这群获奖电影人之中,我确实觉得自己像个“局外人”! 首先,好莱坞对 AI 的抵触是有充分理由的。娱乐行业与科技行业的文化背景迥异,这导致了双方在关注点和价值观上的深刻分歧。好莱坞很大一部分从业者担心: - AI 公司在未经许可且未支付报酬的情况下,利用他们的作品进行训练。软件行业习惯于开源和开放互联网,而好莱坞则高度重视知识产权,因为这是娱乐行业核心经济引擎的基石。 - 像 SAG-AFTRA(美国演员工会)这样强大的工会,正深切关注如何保护成员的就业。当 AI 技术(或...
2026-02-13 · AndrewYNg · 打开 ↗
新课程上线:A2A:Agent2Agent 协议。由 @googlecloudtech 与 @IBMResearch 联合打造,由 Holt Skinner、@ivnardini 和 Sandi Besen 授课。 连接不同框架构建的智能体通常需要大量的定制化集成。本课程将教你 A2A——这一旨在标准化智能体发现与通信的开放协议。随着 IBM 的 ACP(智能体通信协议)与 A2A 融合,A2A 已成为行业标准。 在课程中,你将构建一个医疗多智能体系统,让基于 Google ADK 和 LangGraph 等不同框架的智能体通过 A2A 协同工作。你将学习如何将每个智能体封装为 A2A 服务端,构建 A2A 客户端进行连接,并将其编排为顺序或层级工作流。 你将掌握的技能: - 将不同框架的智能体发布为 A2A 服务端,实现可发现性与互操作性 - 使用 ADK 将 A2A 智能体进行顺序链式调用,实现输出流转 - 使用 MCP(模型上下文协议)将 A2A 智能体连接到外部数据源 - 使用 IBM 开源基础设施 Agent Stack 部署 A2A 智能体 立即加入,学习这项标准化智能体协作的协议! https://t.co/5EDqpuvd0z
2026-02-12 · AndrewYNg · 打开 ↗
美国及许多国家的求职环境都非常严峻。与此同时,目前对于“AI 导致失业”的担忧有些言过其实。不过,对 AI 技能的需求正开始引发就业市场的转变。我想分享一下我的观察。 首先,过去一年许多科技公司都在裁员。虽然一些 CEO 声称原因是 AI(即 AI 能胜任工作,因此不再需要人),但现实是 AI 目前还没那么好用。许多裁员实际上是在修正疫情期间的过度招聘,或是常规的成本削减与重组,这些在现代 AI 出现之前也时有发生。除了少数岗位外,很少有裁员是因为工作被 AI 自动化取代的。 诚然,这种情况未来可能会加剧。目前从事某些极易受 AI 自动化冲击的职业(如呼叫中心人员、翻译和配音演员)的人,可能会面临就业难或薪资下降。但大规模失业的说法被夸大了。 相反,有一句话很贴切:AI 不会取代员工,但会用 AI 的员工会取代不会用 AI 的员工。例如,由于 AI 编程工具极大地提高了开发效率,懂得如何使用这些工具的开发者正变得越来越抢手。(如果你想成为其中一员,请参加我们关于 Claude Code、Gemini CLI 和 Agentic Skills 的短期课程!) 所以,AI 确实在导致失业,但方式很微妙。一些...
2026-02-10 · AndrewYNg · 打开 ↗
美国政策正使盟友远离美国AI技术。这引发了人们对“主权AI”的兴趣——即一个国家在不依赖外国势力的情况下获取AI技术的能力。这削弱了美国的影响力,但可能带来更激烈的竞争并推动开源技术的发展。 美国发明了晶体管、互联网以及驱动现代AI的Transformer架构,长期以来一直是技术强国。我热爱美国,并为美国的成功而努力。但历届政府多年来的所作所为,让其他国家开始担心过度依赖美国。 2022年俄罗斯入侵乌克兰后,美国对与俄罗斯寡头有关联的银行实施制裁,导致普通消费者的信用卡被停用。拜登在卸任前实施了“AI扩散”出口管制,限制了包括美国盟友在内的许多国家购买AI芯片的能力。 在特朗普时期,“美国优先”政策显著加速了这种疏远他国的趋势。对盟友和对手都实施了广泛且混乱的关税;威胁要接管格陵兰岛;对移民采取不友好的态度——这是对拜登政府时期南部边境混乱局面的过度反应——其中包括美国移民及海关执法局(ICE)采取的残暴手段,导致执法人员枪杀了Renée Good、Alex Pretti等人。全球媒体广泛传播了ICE进行恐怖行为的视频……
2026-01-30 · AndrewYNg · 打开 ↗
重要新课发布:Agent Skills with Anthropic!本课程由 @AnthropicAI 合作开发,由 @eschoppik 授课。 Skill(技能)是以指令文件夹的形式构建的,旨在为 Agent 提供按需知识和工作流。本短课将教你如何遵循最佳实践来创建 Skill。由于 Skill 采用开放标准格式,你可以实现“一次构建,到处部署”,在任何兼容的 Agent(如 Claude Code)中直接使用。 你将学到: - 创建用于代码生成与审查、数据分析及研究的自定义 Skill - 利用 Anthropic 的预置 Skill(Excel、PowerPoint、Skill 创建)和自定义 Skill 构建复杂工作流 - 将 Skill 与 MCP 和子 Agent 结合,构建具备专业知识的智能体系统 - 将相同的 Skill 部署到 https://t.co/Ru4OXv4saV、Claude Code、Claude API 以及 Claude Agent SDK 立即加入,学习如何为 Agent 赋予专业知识,打造可靠、可重复的工作流。 https://t.co/3hq83c3q0U
2026-01-28 · AndrewYNg · 打开 ↗
企业如何超越单纯利用 AI 提升效率,从而创造变革性的影响?我目前正在瑞士达沃斯世界经济论坛(WEF),期间我与许多 CEO 探讨了如何利用 AI 实现增长。一个反复出现的主题是:开展大量自下而上的实验性 AI 项目——即“百花齐放”式的尝试——并未带来显著回报。相反,更大的收益需要流程重构:从更宏观、或许是自上而下的视角审视流程中的多个环节,并实现端到端的协同变革。 以银行发放贷款为例。其工作流包含几个独立阶段: 营销 -> 申请 -> 初审 -> 复审 -> 执行 假设以前每一步都是人工操作。初审原本需要人工审核一小时,而新的智能体系统可以在 10 分钟内自动完成。如果只是将人工审核替换为 AI 审核,而保持其他环节不变,这只能带来微小的效率提升,谈不上变革。 真正的变革在于:申请人不再需要等待一周的人工审核,而是能在 10 分钟内获得结果。一旦实现这一点,贷款产品将更具吸引力,更优质的用户体验能吸引更多申请,
2026-01-23 · AndrewYNg · 打开 ↗
新课程上线:Gemini CLI:使用开源 Agent 进行编码与创作。本课程基于 @googlecloudtech/@geminicli 构建,由 @JackWoth98 授课。 像 Gemini CLI 这样的智能代理编程助手正在改变开发者的工作方式。本短课将教你如何利用 Google 的开源 Agent 协调本地工具与云端服务,从而处理编码及非编码工作流。 Gemini CLI 直接在终端运行,可操作本地文件和开发工具,并能通过 MCP 连接各类服务。你只需提供高层指令,它即可自主规划并执行复杂的任务流。 你将掌握的技能: - 构建网站功能,并通过 GitHub Actions 实现自动化代码审查 - 创建结合本地文件与云端数据源的数据仪表盘 - 使用 MCP 服务器和扩展,编排 GitHub、Canva 与 Google Workspace 的工作流 - 利用会议录音等多媒体文件生成社交媒体内容 我非常看重 Gemini CLI 的开源特性。你可以透彻了解其工作原理、查看提示词并理解其架构。社区已贡献了数千个 Pull Request。自 Gemini 3 发布以来,我发现 Gemini CLI 的能力非常出色——这绝对是值得收藏的开发神器! 无论你是进行应用原型设计、自动化工作流,还是处理多媒体内容,欢迎加入课程,学习如何委派复杂任务,实现更高效的开发:https://t.co/m3J7kwQpxC
2026-01-22 · AndrewYNg · 打开 ↗
为数据中心辩护
2026-01-16 · AndrewYNg · 打开 ↗
新课程上线:Document AI:从 OCR 到智能体文档提取。本课程由我担任执行主席的 @LandingAI 联合打造,由 David Park 和 Andrea Kropp 授课。 世界上大部分数据都锁在 PDF、JPEG 等文档中。本短课将教你如何构建智能体工作流来精准处理文档:通过拆解文档、细致检查每个部分并进行多次迭代来提取信息。 传统的 OCR(光学字符识别)虽然能捕捉文本,但会丢失表格标题、图表说明或列阅读顺序等上下文信息。在了解 OCR 的局限性后,你将学习使用 LandingAI 的 ADE(智能体文档提取)框架。ADE 将页面视为视觉图像,从而解析信息并提取字段。 你将掌握的技能: - 构建智能体,将非结构化文件转换为结构化的 Markdown/HTML 和 JSON - 使用 ADE 解析表单、手写体或公式等复杂数据 - 根据指定 Schema 将提取的信息映射到命名字段,并利用边界框进行定位与验证 - 通过事件驱动的文档处理部署 RAG 应用 快来学习如何智能处理财务发票、医疗记录或学术论文等文档的最佳工具: https://t.co/PYjgnoaD2K
2026-01-14 · AndrewYNg · 打开 ↗
2026年快乐!今年会是AGI最终实现的年份吗?我想提出一种新版的图灵测试,我称之为“图灵-AGI测试”,用以检验我们是否达成了这一目标。稍后我会解释为何需要这项新测试。 大众普遍认为,实现AGI意味着计算机将拥有与人类相当的智能,并能胜任大部分或全部知识型工作。为此,我提议一种新的测试方法:测试对象(计算机或专业人类)将被提供一台连接互联网并安装了浏览器、Zoom等软件的电脑。评判者将设计一个为期数天的流程,通过电脑让测试对象执行工作任务。例如,测试过程可以包括一段培训期(如客服培训),随后要求其执行任务(接听电话)并提供持续反馈。这模拟了配备完整电脑(但没有摄像头)的远程办公人员的工作场景。 如果计算机完成工作任务的能力能与专业人类相媲美,则视为通过“图灵-AGI测试”。 大多数人可能认为真正的AGI系统定能通过这项测试。毕竟,如果计算机具备人类水平的智能,理应能像雇佣的人类员工一样胜任工作。因此,“图灵-AGI测试”契合了大众对AGI的普遍认知。 为什么要提出新测试?因为“AGI”已沦为一个炒作词汇,而非具有精确含义的术语。一个合理的定...
2026-01-06 · AndrewYNg · 打开 ↗
AI技术的又一年飞速发展,为任何人(包括刚入行的新人)构建软件创造了前所未有的机会。事实上,许多公司正面临AI人才短缺的困境。每年寒假我都会花时间学习和实践,也希望你们能这样做。这不仅能帮我巩固旧技能、学习新技能,也能助力你在科技领域的职业发展。 为了精通AI系统的构建,我建议你: - 修读AI课程 - 动手实践构建AI系统 - (可选)阅读研究论文 让我来谈谈为什么这些都很重要。 我听过一些开发者建议别人直接上手做项目,不要担心学习。这是个错误的建议!除非你身边已经有一群经验丰富的AI开发者,否则在不了解AI基础的情况下盲目上手,意味着你可能会面临“重复造轮子”的风险,或者更可能的是——造出一个烂轮子! 例如,在面试候选人时,我遇到过一些开发者:他们重新发明了标准的RAG文档分块策略,重复开发了现有的智能体AI(Agentic AI)评估技术,或者写出了混乱的LLM上下文管理代码。如果他们修过几门相关的课程,就能更好地理解现有的基础组件。当然,如果他们愿意,依然可以从零开始重构这些组件,甚至发明超越现有方案的新技术,但这样至少能避免浪费数周的时间……
2025-12-29 · AndrewYNg · 打开 ↗
今天 Claude Code 热度很高。这门与 Anthropic 合作开发的短课是掌握它的最佳方式。欢迎学习!
2025-12-29 · AndrewYNg · 打开 ↗
尽管 LLM 令人惊叹,但如今提升其知识水平的过程比大众认知的要更加零散。我曾写过 AI 很神奇……但没那么神奇。同样,LLM 确实具有通用性……但也没那么通用。我们既不应盲信“LLM 几年内就能实现 AGI”这种不实的炒作,也不应盲信“它们只是演示工具”这种同样不实的说法。相反,我认为更精准地理解构建更智能模型的现状,才更有意义。 首先,LLM 的确比前几代技术展现出更通用的智能形态,这也是为什么单个 LLM 能胜任多种任务。第一波 LLM 技术通过在公开网络数据上进行训练实现了这一点,而互联网涵盖了极其广泛的主题。这使得它们的知识面远超早期的算法,后者通常只针对单一任务进行训练,例如预测房价或下围棋、国际象棋。然而,它们的通用性仍远不及人类。例如,即便在整个公开网络内容上进行了预训练,LLM 在模仿编辑的特定写作风格,或可靠地操作简单网站方面,依然显得力不从心。 在几乎榨干了互联网上的所有公开信息后,进步变得愈发困难。如今,如果前沿实验室想要让 LLM 在特定任务(如
2025-12-19 · AndrewYNg · 打开 ↗
OpenReview 通过开放式同行评审与论文发表,已成为支持 AI 研究与知识共享的重要基石。但作为一家非营利机构,它需要社区的支持。请考虑为这一伟大的机构捐款! https://t.co/TBYB1cCKyI
2025-12-19 · AndrewYNg · 打开 ↗
新课程:Nvidia NeMo Agent Toolkit:打造可靠智能体,由 NVIDIA 的 @Pr_Brian 授课。 许多团队在将智能体 Demo 转化为可靠的生产级系统时面临挑战。本短课将教你如何利用 Nvidia 开源的 NeMo Agent Toolkit (NAT) 将智能体工作流加固为可靠系统。无论你是使用原生 Python 还是 LangGraph、CrewAI 等框架,NAT 都能提供观测、评估和部署所需的组件,助你将概念验证 (PoC) 转化为生产级系统。 通过执行追踪、系统化评估和 CI/CD 集成,NAT 让智能体性能的故障排查与优化变得轻而易举。 你将掌握的技能: - 通过 REST API 和极简代码构建配置驱动的智能体工作流 - 利用追踪技术增强可观测性,可视化智能体推理过程并调试性能瓶颈 - 使用金标准数据集进行系统化评估,衡量并提升智能体可靠性 - 部署具备身份验证、速率限制和专业 Web 界面的多智能体系统 - 编排不同框架下的智能体,协作完成复杂任务 立即加入,学习如何将智能体 Demo 转化为可靠系统! https://t.co/9rBcBteq4b
2025-12-18 · AndrewYNg · 打开 ↗
分享一个有趣的“配方”:利用我和 Rohit Prasad 正在开发的开源包 aisuite,构建一个高度自主、能力尚可但极其“不可靠”的智能体。 只需几行代码,你就能为前沿大模型配备工具(如磁盘访问或网页搜索),并赋予其高层任务(如编写贪吃蛇游戏并保存为 HTML,或进行深度研究),然后放手让它自由发挥。示例见图。 注意:这并非目前构建实用智能体的主流方式,因为实际应用通常需要更复杂的架构支撑(详情见我的 Agentic AI 课程),但作为实验依然非常有趣。 详细文章见:https://t.co/BdS8tGhnIy
2025-12-11 · AndrewYNg · 打开 ↗
Edelman 公关公司与皮尤研究中心的独立报告显示,美国人以及更广泛的欧洲和西方世界,对 AI 缺乏信任,也缺乏热情。尽管 AI 业界对其带来的巨大益处持乐观态度,但我们应当严肃对待这一现状,而非视而不见。公众对 AI 的担忧可能会严重拖累技术进步,而我们有很多方法可以应对。 根据 Edelman 的调查,在美国,49% 的人反对 AI 的广泛应用,仅 17% 的人接受。而在中国,反对者占 10%,接受者占 54%。皮尤的数据也显示,许多其他国家对采用 AI 的热情远高于美国。 对 AI 持积极态度是一种巨大的国家优势。相反,
2025-12-04 · AndrewYNg · 打开 ↗
Prism is open source · ⭐ Star on GitHub · about