研究实习生级别AI即将落地 | Jakub Pachocki | OpenAI首席科学家 | AGI路线图 | 强化学习 | 人机交互终极形态 | 持续学习 | 思维链监测

AGI研发路线图与核心能力跃迁

OpenAI首席科学家雅各布·帕乔斯基披露了内部核心研发策略与AGI落地时间表：2026年9月推出研究实习生级AI，2028年3月正式落地全自动AI研究员。该时间表未作调整，且技术落地取得超预期进展。推动进化的核心动力是内部编程模型Codex的爆发式转型，目前团队内部绝大多数代码编写已由Codex独立完成。在能力界定上，研究实习生级AI与全自动研究员的核心区别在于自主工作时长与任务指令适配能力。前者虽无法处理高度抽象的无边界任务，但已具备完整执行具体技术优化与定制化评估的能力。数学与物理等基础学科研发被置于与AGI同等重要的位置。帕乔斯基指出，数学是衡量通用智能的北极星指标，其解答结果客观可量化且难度无上限。模型已攻克国际数学奥林匹克竞赛（IMO）第六题，正式迈入研究级数学能力门槛。数理推理能力的提升具备极强的技术迁移效应，将直接赋能AI科研能力升级。研发重心正从单一基准测试优化转向现实世界落地，覆盖科研、高经济价值产业等全场景。

技术演进路径：强化学习、持续学习与工具交互

针对强化学习（RL）在医疗、法律等通用领域的适用性，帕乔斯基持乐观态度。通用复杂任务与长周期科研任务的核心难点重合，均在于解决开放式任务的阶段性推进。通过提升模型长周期工作能力与自主评估阶段性进展的能力，即使不依赖RL规模化升级，仅通过预训练优化也能自然延长任务执行周期。在技术路线选择上，上下文学习（In-context learning）被证明是比强化学习更高效的范式。开发者无需复刻复杂RL流水线，只需聚焦核心指标定义与数据样本收集，即可通过上下文输入实现模型定制化优化。持续学习（Continual Learning）并非全新赛道，而是GPT-3时代已具备的上下文持续学习能力，RL的核心价值在于提升该学习效率。当前研发重心已从教会模型自主推理，转向教会模型使用环境中的各类工具甚至操控物理实体。视觉感知与物理互动成为刚需技术，大模型与实体机器人的融合将催生行业核心风口。

算力分配策略、AI对齐与安全监测

面对海量算力需求，OpenAI制定不可动摇的核心原则：预留绝大部分算力优先分配给最具可扩展性的技术方法。决策严格评估技术可理解性、长期扩展潜力与底层架构复用价值，坚决放弃一次性优化方案，以支撑AGI长期发展。在AI安全领域，团队核心研究成果为思维链监测（Chain of Thought Monitoring）。随着推理模型落地，模型输出虽符合人类价值观，但内部思维链缺乏直接监督。思维链以自然语言呈现，是窥探模型真实动机与决策逻辑的最佳窗口。隐藏o1-preview模型思维链的核心决策旨在保护AI对齐质量（防止思维链被训练得符合人类审美而失去无监督特性）及防止知识蒸馏。未来将推出思维总结方案与实时推理交互以平衡安全与需求。长期价值对齐研究的本质是模型泛化能力的研究。风险主要源于模型面对全新场景与智能大幅提升后的价值观偏移。OpenAI正聚焦模型泛化与预训练数据的关联研究，认为对齐难题已从模糊概念转变为可通过技术方案逐步解决的具体问题。

社会影响、治理挑战与未来展望

智力工作的全面自动化将引发就业结构重构与财富快速集中，全自动科研实验室的落地可能导致极少数人掌控超强科研能力。帕乔斯基强调，全球政策制定者需提前布局，应对技术变革带来的社会冲击，并探索新型合规治理模式以保障全人类共同利益。在下一代教育方向上，人类的核心使命是牢牢掌握发展自主权与方向设定权。未来人类重视的技术技能可能沦为消遣，真正的核心能力在于判断事物价值与设定技术发展核心方向。基础教育与技术认知普及依然是不可或缺的基础。实体机器人将迎来属于自己的ChatGPT时刻，虽然落地周期晚于纯虚拟AI，但核心算法已突破，技术爆发近在眼前。OpenAI的所有动作正围绕通用智能落地、安全可控与长期对齐三大核心推进，社会需全面准备迎接智力劳动自动化带来的全方位变革。

“数学是衡量通用智能水平最精准、最客观的北极星指标。” “通用人工智能的核心，是要构建能够长期迭代、支撑全场景技术落地的底层底座。” “长期价值对齐研究，本质上是模型泛化能力的研究。” “人类的核心使命，是在人工智能时代牢牢掌握发展自主权与方向设定权。”

研究实习生级别AI即将落地 | Jakub Pachocki | OpenAI首席科学家 | AGI路线图 | 强化学习 | 人机交互终极形态 | 持续学习 | 思维链监测 | AI对齐

AGI研发路线图与核心能力跃迁

技术演进路径：强化学习、持续学习与工具交互

算力分配策略、AI对齐与安全监测

社会影响、治理挑战与未来展望

关键引用