老黄的精力与创业者的“爬坑哲学”
贾鹏开篇分享了对黄仁勋(老黄)的观察:老黄每天四五点起床,不是读邮件就是读论文;他甚至曾测量自己与太太额头的温差,发现自己的体温高出一度,由此得出“大脑全天高速运转”的结论。这种极致的专注与投入,也影响了他对创业者的启发——没有任何人可以避开坑,但关键在于谁爬坑的能力更快。他特别认同小哥(理想团队成员)的一句话:“要掉坑就一起掉,不要有人在外面说风凉话”。这种务实、共担、快速迭代的创业心态,也成为他后来创立至简动力的核心价值观。
“没有任何人可以避开坑,但是一定比他最后是谁爬坑能力更快。” “要掉坑就一起掉,不要有人在外面说风凉话。”
从HPC到自动驾驶:中国NV团队的拓荒者
贾鹏的职业轨迹始于高性能计算(HPC)领域。2008至2012年,他在读研期间就已开始自主拼装含数万节点的超算集群,并在GPU加速方向积累了深厚经验——这为他后来加入英伟达埋下伏笔。2015年底,他成为英伟达中国自动驾驶团队的第一位正式员工。彼时英伟达市值约100亿美元,全球员工不足七八千人,北京团队仅百人左右。老黄当时正试图将芯片从数据中心拓展至端侧,而智能汽车因其电动化起步、功耗与散热要求较低,被视作理想入口。
加入后,贾鹏身兼数职:从扛着PS1/PS2开发板跑车厂、互联网公司做硬件推广,逐步转向算法与底层SDK开发。他强调,中国团队做了大量本地化工作,涵盖传感器标定、感知、定位、地图等模块——因为中美道路环境差异巨大,无法照搬方案。当时客户几乎覆盖所有L4玩家:小马智行、文远知行、百度Apollo、极氪线控、蔚来、小鹏等,行业整体仍处“to A”阶段——以Demo和研究为主,缺乏量产验证。
“我大概经历了其中呃一百亿到一千亿的过程,大概十倍的这个过程。” “发财报的前一天就开始买股票啊,第二天卖掉……大家明显感觉到这家公司是每天在超越的成长。”
路线之争:生态构建 vs 数据驱动
在英伟达期间,贾鹏亲历了其从“与AMD不相上下”到“市值逼近英特尔”的跃升期,并观察到英伟达的软件生态建设始终偏重L4路线:收购Deep Map、组建庞大规控团队、聚焦场景枚举与高精地图……这种思路虽利于构建技术护城河,却与新势力的量产逻辑渐行渐远。他指出,英伟达的核心诉求是打造类似CUDA的自动驾驶SDK生态,而非直接交付用户产品。
相比之下,贾鹏更认同特斯拉路线:“你得让用户去骂,因为最终是数据驱动问题”。他特别提到Elon Musk在2016–2017年就已明确“FSD芯片必须标配,哪怕没人订阅也要预埋硬件”,并为此重构电子电气架构以摊薄成本。这种为长期数据积累牺牲短期商业回报的战略定力,让贾鹏深受触动——“有点类似现在大家在讲scaling law,七八年前就能讲出这样的话,非常少见。”
“你肯定要直接面向用户……这个事情最后肯定是个数据驱动问题。” “即使没人用,我也要标配……为额外增加的FSD芯片提供了空间。”
从英伟达到理想:选择背后的战略考量
理想汽车在2019年才开始交付首款量产车,相比蔚来、小鹏等同期初创公司,其量产节奏明显偏晚。这一方面源于早期产品策略的调整——理想曾短暂尝试一款小型车,但最终聚焦于增程式电动车路线;另一方面,2020年理想尚未使用英伟达芯片,而是采用地平线征程三方案。值得注意的是,理想实为最早与英伟达建立战略合作的车企之一,只是L9才正式落地NV芯片方案。在贾鹏看来,加入理想并非一时冲动,而是基于两个核心判断:其一,个人能否在团队中发挥关键作用、理念是否一致;其二,公司是否真正将智能化视为生死线。他敏锐地意识到,电动化只是上半场,智能化才是决定新能源车最终格局的核心战场。因此,增程技术不仅是过渡方案,更是构建“移动机器人”这一愿景的第一步——只有当车辆具备基础智能能力,才能真正成为用户的“第二个家”,并进一步延伸至家庭服务机器人场景。这种以“车+家”为闭环的长期构想,深深打动了他。
他觉得增驾是一定是其中最重要的……他就是他的为什么叫车和家?啊,我觉得这也是他的vision。
他觉得一定要先把先把车上的智能先搞定。哦,那增驾肯定是第一个,就是你至少先让它变成一个可以移动的机器人,对吧?
逆袭之路:认知一致、项目制作战与技术前瞻布局
2020年贾鹏加入理想时,团队正处于低谷:首款车失败后仅靠增程车型勉强支撑,自动驾驶团队仅二三十人,无自研能力,技术底子薄弱,外界甚至戏称其“脱裤子放屁”。然而,短短四五年间,理想实现了从“菜鸡团队”到行业标杆的跃迁。贾鹏将其归因于三大关键因素:首先是核心团队认知高度统一——李想、王凯、郎博、贾鹏等人一致认同“必须学特斯拉”,以数据驱动为核心路径推进智能化;其次是组织方式的创新——理想几乎摒弃传统组织架构,采用纯项目制运作:每个项目独立命名、跨部门抽调精英、封闭集训开发,形成“打仗”文化。团队常观看纪录片《全营一杆枪》,汲取“将几分钟反应时间压缩至8秒”的极致协同精神;第三是技术前瞻的持续投入——即便在高强度交付压力下,仍坚持保留专人从事前沿研究(如端到端、WLA、双系统等方向),确保论文产出与顶会影响力持续领先。这种“战时研发”双轨制,使理想在2022年后技术爆发式增长,最终实现从追赶者到引领者的转变。
我们真的是打仗……大家还是以项目的概念……从全公司去挑精英团队,然后我们进到这个项目里头,然后大家就找个酒店封闭开发。
你一定要有人跳出这个这个打仗这个氛围,嗯,去看一看,哎,有没有其他更好的选择?
第一仗与生态协同:Underdog的破局之道
在理想智能化团队的“第一次亮相”中,贾鹏团队面临生死考验:2021年仅用100天,从零代码起步,完成高速NOA功能量产交付。当时团队从20余人迅速扩至80人,所有人将时间“掰成三份”,以极致并行与高强度投入实现不可能任务。这一胜利不仅依赖个人拼搏,更源于战略选择上的魄力——理想成为地平线征程3/5/6、禾赛激光雷达、森斯泰克毫米波雷达的全球首发量产客户。贾鹏强调,这种选择背后有明确方法论:优先与行业“老二、老三”深度绑定——对他们而言,项目失败即意味着生存危机,反而能激发最强协同意愿。供应商常派核心工程师常驻理想,形成“联合战队”。与此同时,理想高层(如李想、沈亚楠)亲自协调生态伙伴,确保全链条认知对齐:“做不成,咱都得死”。这种“共同背水一战”的氛围,让理想与合作伙伴在资源有限的逆境中迸发出惊人合力。
我觉得你不能选那个行业老大……你一定要选一个行业的老二、老三,就是这件事做不成,他也是死,嗯啊,这样的话大家才能真正的最终能把这件事做成。
我还是比较信的,嗯,就是一群 underdog,但是憋着一股劲儿,对,憋着一股劲儿,我我一定要做成,对我做不成,这个团队也好,这个公司也好,就会死。
信任与组织协同:理想对至简的底层赋能
在贾鹏看来,理想汽车对至简科技(原理想自动驾驶团队)最核心的支持体现在两个方面:充分的信任与高层协同的深度拉通。所谓信任,是指“这件事就交给你们做了,我不打搅、不逼逼,你们想要什么资源我都给”——这种放手式的授权,为团队提供了关键的自主空间。而高层协同层面,李想、王凯(小哥)、李创(台哥)等核心管理者亲自下场,与地面团队深入沟通,推动跨公司(理想、地平线、至简)形成统一认知:“做不成,咱都得死”。这种高度一致的目标感,极大提升了组织协同效率。此外,理想对地平线的组织文化与工具链也产生了显著影响:地平线从钉钉转向飞书,甚至在战略方法论上也沿用了理想内部的 LIC/LSA(Lean Auto Strategy Analysis)体系——即从行业阶段、用户需求、问题定义、解法路径、组织架构、预算分配六个维度系统推演项目可行性。这套方法论后来直接迁移到至简的创业实践中,成为其早期决策的底层逻辑。
“做不成咱咱咱都得死。” “没有任何人可以避开坑,你可能是只能说比别人少少少少掉坑一点点,但是每个人都要掉坑,但是一定比他最后是谁爬坑能力更快。”
从有图到无图:一场被迫的“败仗”与战略跃迁
贾鹏坦言,从有图切换到无图是团队经历的“比较大的一个败仗”,发生于2023年。当时行业普遍以“开城数量”为竞争指标,但李想敏锐指出:依赖高德、百度等地图供应商,意味着产品能力被外部卡脖子——地图覆盖不均(如仅一线及部分二线城市主干道可用),导致三四线城市用户无法享受功能。这对追求极致产品体验的小哥而言是不可接受的。于是团队果断决定:“把高跟鞋跑掉”,即彻底放弃高清地图依赖。尽管初期无图方案在复杂路段表现尚可(如深圳高架+小道密集场景),但全面切换后产品力短期明显下滑,叠加2023年4–5月理想整体裁员潮,团队承受巨大压力。贾鹏与交付负责人佳佳成为“扛压最多”的核心。李想甚至直言:“这个东西再不行,这个团队就解散了,就滚蛋。”
但团队通过数据闭环驱动的透明沟通扭转局面:针对每个问题,提供具体数据归因、明确迭代时间线(如“这条问题一周后会变好”),并在2–3周内快速验证效果。当用户发现“任意小道、园区、高速都能开”且体验流畅后,产品口碑迅速回升,甚至促成大规模人员召回。这一转型也成为理想后续追上行业的关键转折点。
“为什么我花用户花了同样的钱?有的用户可以享受到超声波,有的用户享受不到,那这件事对用户是不可接受的。” “掉错一起错,因为只有这样,你只有大家一起错的时候,大家才哎错了,好,大家一起爬,你才能形成这个共识。”
产品成功与商业化验证:从认可到盈利
至简团队将自动驾驶业务的成功归结为三大维度:产品认可度、商业化能力、行业地位。产品层面,端到端双系统交付(2024年底成熟)标志着质变——用户日活持续增长、通勤中智驾使用占比(留存率)显著提升、NPS(净推荐值)表现优异,用户主动向亲友推荐。商业化层面,高配版Max的占比从初期不足20%跃升至超70%,证明用户愿为智驾功能支付溢价,团队从“纯烧钱”转向“实打实赚钱”。行业层面,理想已稳居第一梯队(与华为、小鹏并列),实现从“落后者”到“领跑者”的跨越。贾鹏认为,这一跃迁得益于无历史包袱的敏捷组织与PDRD(预言+研发+数据)高效协同机制——预言团队早期验证无图可行性,团队能果断推翻旧架构;而端到端、跨模态世界模型等新技术方向(如VLA)落地顺畅,论文产出密集(年均20–30篇顶会),体系化能力已全面跑通。
“我觉得这个产品呢,立马就上了一个台阶。” “最后比的是谁爬出能力更强。”
创业环境差异:具身智能的高门槛
对比大模型与自动驾驶两大赛道,贾鹏指出,前者拥有OpenAI范式、海量数据与高容错率的应用场景;后者则有特斯拉引领方向、持续数据输入与人类驾驶员接管机制,这些构成了极具吸引力的创业温床。而具身智能目前尚不具备这些条件:技术范式尚未收敛、冷启动阶段缺乏数据优势、且应用场景要求近乎100%的可靠性——用户无法像自动驾驶中那样随时接管。正因如此,具身智能的窗口期可能更长,但一旦突破,将进入更可持续的发展阶段。
“你反看具身,说实在,你这些条件都不具备。”
“它可能就这个周期会非常非常长,所以它这个第一批的这个窗口持续的时间也会比较长。”
从A到C:具身智能的三阶段演进路径
贾鹏将具身智能的发展类比自动驾驶的演进节奏:to A阶段(技术验证)约2021–2024年,以Optimus发布为标志,2023年为创业公司爆发元年;to B阶段(商业落地)预计2024年底或2025年初开启,由业务需求驱动,强调产品闭环与规模化能力;to C阶段(大众消费)则尚远。他强调,真正的突围窗口正在收窄,进入to B阶段意味着必须构建完整的商业逻辑,而非仅靠技术亮点或Demo吸引关注。
“我自己的感受就是……可能今年年底或者明年初,我觉得就差不多。”
“到to B阶段,你不仅仅是技术支撑,单点技术就可以你比别人对吧?我做个demo对吧?我模型比别人牛,我我就可以那就很牛啊!”
至简:全栈自研背后的底层逻辑
贾鹏与合伙人王凯、王佳佳共同创立“至简”(Simplicity),其命名源于三大核心理念:模型极简(减少人为设计以提升scaling能力)、产品极简(开箱即用)、组织极简(扁平高效、项目驱动)。这一理念也映射到其战略选择——坚持全栈自研,从本体设计、数据采集硬件到核心算法,全部自主掌控。他指出,参考自动驾驶行业终局,只有软硬结合、数据闭环与规模效应形成正向循环的企业才能存活;而具身智能的终局也将是“六边形战士”主导:技术、产品、商业、品牌、组织、战略缺一不可。
“我们还是偏,我觉得我们是个六边形战士……技术、战略、产品、品牌、组织、商业都要很强。”
“你一定要把这个模型跟你的本体去做结合,甚至是定义你的本体,这样你的模型才能迭代起来。”
终局判断:非垄断式、多垂域分散格局
不同于智能手机或新能源车的寡头垄断格局,贾鹏认为具身智能的终局更可能是“分散式垄断”:人形机器人作为最大垂域占据通用场景,而大量专用形态(如轮式、四足、上半身人形+专用底盘)将在细分领域高效共存。他进一步从人口结构出发提出深层动因:中国出生人口十年腰斩,未来劳动力短缺将催生家庭级服务机器人刚需,但市场不会被单一形态垄断,而是由多个垂直领域的“几家头部+生态协同”构成。
“我觉得它跟自动驾驶也好,跟智能手机也好……它的中局不是个垄断的中局。”
“可能最终可能它是偏这种分散的、分散垄断的终局啊,可能每个垂直领域那么几家。”
具身智能的生态格局:开放与闭环并存
在探讨具身智能的产业链发展路径时,贾鹏指出,未来很可能会形成两种并行的生态模式:一种是以大厂为核心的开放生态,另一种是以头部企业为代表的垂直闭环生态。前者类似当前手机行业的 Android 与 iOS 分野,其底层依赖于像字节、阿里、腾讯或微软 Azure 这类巨头构建的通用仿真平台与基础模型,上层开发者则基于此进行垂域适配与二次开发;而后者则以 Tesla 为典型代表,强调全栈自研与闭环控制,从硬件本体到 AI 模型全部自主掌控。
“我觉得最终可能具身也是类似,可能会有一个比较开放的生态……这个开放生态是建立在比如像字节、阿里、腾讯,对吧?这些比较大厂的这个它的仿真 model 之上,大家基于它去做一些后续的开发。”
“那也有可能像 Tesla 这种,我也不用别人的,都所有东西我都自己做啊,那也有可能是是这两两派,我觉得都会存在。”
贾鹏进一步强调,开放生态的构建门槛极高——无论是算力基础设施、大规模仿真系统,还是多模态基座模型的训练与维护,都需要天文数字级的投入,因此不太可能由初创公司主导。而真正具备落地能力的,将是那些在底层基础设施上已有深厚积累的科技巨头。与此同时,垂域数据与工作流的深度结合,将成为差异化竞争的关键:即“底层通用模型 + 上层垂域数据 + 本体定制化 workflow”的组合,构成具身智能 Agent 的核心竞争力。
技术分层与模型演进:从 Infra 到大系统统一
贾鹏将至简的技术研发体系划分为三层:AI Infra(基础架构)、基础模型、应用层(Agent 适配)。过去半年,团队重心集中于最底层的基础设施建设——包括云端世界模型、本体设计、零部件选型、训练与推理框架优化等,因为“最后的竞争都在最底层”,而底层能力直接决定了系统迭代速度。他以 Tesla 和理想为例指出,正是前期在数据闭环、GPU 集群、训练框架上的重投入,才支撑了后期产品的快速演进。
在基础模型层面,至简采取了与行业主流不同的路径:拒绝双系统割裂设计(如 VLM 与 VLA 分离),而是从早期就探索一体化世界-语言-动作联合建模。早在 2025 年 I8 量产时,团队已实现单模型同时支持文本 CoT 推理与视频帧预测(next frame generation),并让模型自主决定何时启用“慢思考”(free-body planning)与“快响应”(reactive control),从而天然解决双系统帧率不匹配与联合训练困难的问题。
“我们后来就想,是不是让模型自己去决定我什么时候走自由体,什么时候不走……模型自己学会之后,那就你就可以天然的,它就学会了批判思考。”
贾鹏认为,这一趋势正呼应了整个大模型领域的“统一化(unification)范式”:OpenAI 从早期四线并行(COT/非COT、理解/生成、CLIP/Sora),到 GPT-4o 实现多模态理解与生成统一;Google Gemini 则进一步将 3D 世界建模、语言推理与动作生成整合为单一系统。而至简在 I8 上的落地实践,使其成为行业首个将大系统模型部署于端侧并实际运行的团队。
数据战略:真实场景是核心,商业化即数据引擎
尽管数据在访谈中未被高频提及,贾鹏却将其置于战略核心位置。他认为,具身智能的数据获取瓶颈正在被半真机采集(如穿戴式设备)与大规模真实场景数据协同突破——尤其在与 Sunday 等团队交流后,他确认了该路径的可行性与 scaling 效果。但更重要的是,他强调了真实用户场景数据不可替代的价值:
“你所有通过你的半真机也好,通过你的合成数据也好,通过我的自己手搭的采集场的数据也好,它跟真实场景的数据都有巨大的 gap……最复杂的东西都在现实场景里,最好听的故事都是在真实场景里。”
他进一步提出,商业化与数据化本质一体两面:规模化交付不仅是收入来源,更是获取真实长尾场景数据的唯一高效途径。而 Tesla 的“影子模式”则提供了关键方法论——通过双芯片标配(主芯片运行用户模型 + 辅芯片并行运行新模型并对比人类行为),实现: 1. 端侧实时数据采集与标注(尤其非 O case); 2. 大规模 A/B test(不同用户推送不同模型版本); 3. 零干扰的端侧模型验证(新模型上线前在真实场景中试运行)。
因此,至简坚持双芯片设计,不仅为保障推理性能(inference-first),更是为构建闭环数据飞轮:产品 → 用户 → 真实数据 → 模型迭代 → 更优产品。贾鹏明确表示:“数据的来源,尤其是长尾数据、真实场景里的数据的来源一定要做好!这个东西是跟咱的产品力直接相关的。”
双芯片架构:端侧验证与影子模式的核心逻辑
在具身智能系统的工程实践中,双芯片标配并非冗余设计,而是实现端侧数据采集、实时验证与模型迭代闭环的关键基础设施。贾鹏强调,第一块芯片负责稳定运行当前生产版本的推理(inference),确保用户无感知的正常使用;第二块芯片则用于部署新模型,在影子模式(shadow mode)下同步运行——即在不干扰实际业务的前提下,将新模型与旧模型并行输出,并对比轨迹、决策等关键指标,量化评估新模型在真实场景中的表现优劣。这种架构使得团队能基于真实数据快速验证模型改进的有效性,避免“纸上谈兵”。
所以那个是模拟的,那个对你就是跑的影子,所以叫影子模式嘛。
我就把我自己的结果去跟老的去做对比来看……到底这两版哪个好,哪个坏?
合成数据:辅助工具而非主力引擎
尽管合成数据在极端 case 扩增(如罕见碰撞场景)和仿真验证环节中已被行业广泛采用,但其作为训练主力的可行性仍存疑。贾鹏指出,即使是相对简单的任务(如避障),合成数据也难以覆盖复杂工况的长尾分布;真正落地的模型仍需大量真实数据支撑。他以自身实践为例:在增加时项目中,合成数据虽能将单条 hard case 扩增至百条用于训练,但若指望其解决 90% 的常规问题,则“到目前还是不太合适”。英伟达虽力推合成数据在具身智能中的应用,但其优势主要集中在运动学层面的 locomotion/navigation(不涉及物理接触),以及闭环测试验证场景;一旦涉及操作(manipulation),合成数据的物理保真度瓶颈便凸显。
合成数据好的一点就是说,它比如说我有一个 hard case,它非常少见,但是我可以通过合成的 pipeline 它去做扩增,我一条变成一百条……这在增加时我们是验证过的是没问题的。
但是你要指望用它去解决前面百分之九十的问题,到目前还是不太合适。
硬件成熟度:To B 转型的第一道真实门槛
贾鹏认为,当前行业对“硬件成熟”的认知存在严重误判。所谓量产,多数仍处于手搓阶段——缺乏工艺标准化、一致性控制与可靠性验证体系。他举例指出:即使是同型号、同厂商的两台机器人,A 的数据在 B 上 replay 后行为显著不同,暴露了个体一致性差的核心问题;而返修率接近 100%、平均无故障时长有限,更说明硬件远未达车规级可靠性。相比之下,他高度评价某头部企业(暗指小米)在春晚展示的执行力:高难度动作零失误、节奏高度统一,反映出其全链路自研+工艺流程化管控带来的系统级稳定性。在他看来,硬件一致性、可靠性、可维护性是 To B 商业化的前提,否则“小批量+高返修”将无法支撑规模化落地。
现在大家我去很多这种,大家还是处于手搓的阶段,这个还没有形成大规模的生产力,真的大家去追求工艺、追求一致性、追求稳定性。
你没有说哪一个真的能持续工作很长时间,我基本不用修。但技术返修率是百分之百啊!
大模型公司如何布局具身智能?
当前,包括阿里在内的大公司正积极投入具身智能模型(如LLM/多模态基础模型)的研发。阿里内部已成立专门团队,聚焦为具身智能定制的多模态模型开发;通义实验室也在强化相关能力。这一趋势与Google的Gemini路径高度相似:以原生多模态大模型为底座,再叠加领域数据与任务适配,形成面向不同应用场景的子模型。例如,Gemini Robotics、Gemini View等应用均构建于统一底层模型之上,通过领域微调实现功能分化。中国互联网公司普遍将此视为理想范式,希望构建一个通用基础模型,支撑上层各类具身应用。
“上面所有应用……包括可能像我们这种Robotics团队,可能将来也能基于它这个原生多模态去做上面的应用。”
但关键问题在于:原生VLM(视觉语言模型)直接用于VLA(视觉语言动作)任务,可能是一条“死胡同”。原因在于,VLM训练数据主要来自互联网图文,缺乏具身任务所需的核心能力——如三维空间理解、空间推理、3D生成能力等。因此,真正通用的具身模型必须对现有大模型进行深度改造,将世界建模、动作生成、交互推理等能力深度融合进来,而非简单加一个动作头。这决定了创业公司仍有独立演进路径,但中长期仍难逃被大厂基础模型覆盖的命运。
“你如果说拿原生的VLM去做VLA,啊去做具身,那我觉得目前大家已经看到了这条路不是那么好走。啊,甚至有可能是个死胡同。”
创业公司的破局点:端到端垂域落地
面对大厂的模型优势,创业公司的核心策略是聚焦垂域、做端到端任务、构建自有数据闭环。首先,必须拥有自有本体(robot body)——大厂无法替代创业公司对自身硬件数据的掌控。目前,包括理想、C公司在内的团队均已自建本体平台。其次,优先选择可标准化、可复用的端到端任务场景,而非嵌入已有高节拍、低容错的流水线(如拧螺丝)。后者对硬件可靠性、算法响应速度、系统鲁棒性要求极高,且易陷入同质化定制陷阱。
“我跟说老哥,这我们做不了,我们不想做类似的这样的场景。”
理想场景应具备:完整任务链(如取料→上料→质检→去毛刺→回仓)、支持自主流程重构、允许模型统一迭代、便于跨客户复用。这类任务虽非“高精尖”,却更契合当前技术阶段——即通用移动 + 简单操作(抓取/搬运) + 物品泛化识别的组合能力。欧洲制造业对柔性生产、高人力成本的现实压力,使该类场景具备显著商业潜力;商超补货、仓储整理等服务场景亦是早期落地优选。
“最终肯定是个又脏又累的活……他一定是这样,就垂域去去去去去做应用啊。”
商业化路径:从工厂到家庭的渐进式演进
具身智能的商业化需分阶段推进:当前阶段聚焦通用移动+简单操作+物品泛化;中期目标是操作泛化(依赖灵巧手技术成熟);远期才是安全交互泛化与家庭落地。操作泛化高度依赖高自由度灵巧手,但当前仍面临一致性、收敛性、成本等瓶颈,预计2–3年后才可能趋于成熟。而家庭场景的开放性交互对安全性提出极高要求——任何事故都可能造成人身伤害,必须敬畏。因此,家庭落地需严格遵循“封闭→半封闭→开放”路径:从工厂、商超等结构化环境起步,逐步过渡至酒店、餐厅等半服务场景,最终进入家庭。
“进家一定要一个交互……这个东西是需要敬畏的,因为我们坐车的人对于这个事儿是非常敬畏的。”
作者预估,家庭级通用服务机器人可能需20–30年才能普及,但早期实验性应用(如叠被、简单搬运)已在部分家庭试点。技术演进类似自动驾驶L2→L4的渐进路径:通过持续拓展安全边界、完善兜底机制,逐步逼近全场景通用能力。当前阶段的商业化重点,是验证“小闭环+可复用”的垂域模型-硬件协同范式,为后续规模化铺路。
硬件迭代:从轮式半人形到简化优先
至简科技成立半年多以来,已完成两次硬件迭代,当前产品为半人形结构——上半身保留双臂操作能力,下半身采用轮式底盘以提升移动效率与稳定性。团队认为,这种构型在现有应用场景下兼顾了通用性与实用性,且更契合当下模型能力水平。与特斯拉坚持一步到位的全人形路线不同,至简选择“先简化、再扩展”的路径:硬件设计必须围绕当前模型能力边界展开,避免因过度追求自由度而造成软硬脱节。正如创始人所言,硬件团队若脱离算法实际需求“自嗨式”开发,最终无法形成有效产品。
“我们叫至简科技,我还是想着先把硬件本身做简化,根据此时此刻模型的需求去定义这个问题,而不是说让本体的人自己就狂奔了去自嗨了,那没有任何意义。”
在供应链层面,团队正积极借助英伟达等合作伙伴的成熟资源,例如一体化关节模块,大幅缩短研发周期;同时,苏州本地生产布局(靠近绿地)确保了问题可当日响应、快速闭环,极大提升了迭代效率。值得注意的是,特斯拉、宇树等先行者正推动整个硬件供应链加速成熟,为后来者创造了有利环境。
组织协同:三人铁三角与节奏感融资
团队核心由三位长期共事的合伙人构成:创始人贾鹏(算法与模型)、佳佳(硬件与交付)、凯哥(战略与资源)。这种分工延续自理想汽车时期的成功协作——贾鹏与佳佳已配合近五年,主导了从Go3到WLA等多个关键项目;凯哥则在HIO战略层面持续提供支持。目前公司80余人,组织结构高度扁平:无中层架构,所有成员直接汇报至三位创始人,重大决策由战略委员会集体讨论形成。
融资策略上,团队提出“三波节奏论”:首波聚焦顶级财务投资人(如远景、红杉、蓝驰),建立信任基础;第二波引入战略方(如阿里、腾讯),强化生态协同;第三波则引入产业场景方与供应链伙伴,确保落地闭环。这种分阶段引入策略,既控制股权稀释,又保障资源质量。凯哥强调:“融资和研发一样,必须有节奏感。”团队目前进展顺利,得益于每月一迭代的高强度产出节奏——连续两轮快速试错不仅积累了宝贵硬件经验,也向投资人传递出清晰的执行力信号。
“你第一波投资人是什么样的人,你要定义清楚……尤其是能给你带来技术上或者是生态上的好处的这些战略方。”
数据挑战与文化构建:从穿戴设备到认知共识
当前团队数据积累约一万小时,主要来自半真机仿真环境,真实穿戴设备数据占比极小。该设备为定制化高精度手势手套,需联合外部厂商开发,面临电磁干扰导致数据跳变等技术难点——初期约三分之一数据不可用,经多轮迭代后已提升至90%可用率。尽管进展略低于预期,但团队视其为必经过程。
在文化层面,至简尚未正式发布愿景与价值观,但已将“simple scale”作为工作方法论内核。创始人强调,早期招聘中首要考察候选人对具身智能本质的认同度:是否相信其社会价值?是否愿长期投入?“技术能力可培养,信念缺失难弥补”是团队共识。面试中,创始人常以核心问题切入:“你对具身这件事儿到底怎么看?你相信它会带来什么改变?”这种前置认知校准,确保团队在高速奔跑中不偏离初心。
拓荒者心态:在无框架中定义角色
在早期创业阶段,组织尚未形成清晰的岗位分工与流程体系,每个人的角色高度动态、非标准化。贾鹏强调,“开荒的荒地” 是当前阶段的核心特征——团队成员往往需要同时负责一两件彼此关联但非本职的工作,甚至临时跨领域协作。他以理想汽车早期的“荒地理论”为例:李铁曾提出“我就是个荒地”,鼓励新人跳出原有舒适区,在未被定义的领域主动拓荒。这种模式依赖于候选人的基础能力扎实与主动探索意愿的双重匹配。面试中,他最关注两点:一是专业是否足够 solid,二是是否愿意跳出原有领域尝试新任务。“你能不能接受角色不固定?能不能跳出自己的舒适区?” 是关键拷问。若答案是否定的,则可能难以适应当前阶段的高强度灵活性与自驱要求。
“他基础很强。他都已经来你这边面试了,他也不轻狂。”
“就像西部大开发的那种感觉。”
从NV与理想到特斯拉:组织效率的演进路径
贾鹏回顾了自己在英伟达(NV)与理想汽车的组织实践,指出NV的持续创新源于其作为通用计算平台的底层一致性——无论游戏、比特币、数据中心还是自动驾驶,上层应用虽不断迭代,但底层工具链与知识体系一脉相承,使团队能长期保持“开荒式”敏捷性。而在理想汽车,尽管后期引入了华为式的标准化流程(如研发流程体系、跨部门协作机制),但支架研发等项目仍以项目制为核心,保持了一定灵活性;代价是沟通类额外工作显著增加——从纵向项目内共识转向横向跨部门价值拆解(如ROI、资源投入评估),这曾让他作为一线工程师感到排斥,但创业后意识到其对组织长期“solidity”的必要性。
他明确表示,当前至简阶段应优先保障团队敏捷性,“此时此刻不着急用流程”;但未来若达到理想规模,需系统性构建支撑产品与商业闭环的流程体系。其理想组织模型是特斯拉Autopilot团队:仅约200人,却打造出全球领先的自动驾驶产品——核心在于极简架构、一人多岗、强AI导向、快速迭代,而非复杂分工。
“他们也是一个就是强强强AI的团队。哦,我不需要讲究太多流程啊,然后不需要讲究太多的这个这个这个这个大家之间这个组织的划分啊……我觉得这是我我我可能初期想想想要的一个比较好的状态。”
具身智能的瓶颈与突破点:硬件、推理与自进化
谈及行业共识之外的“被忽视真相”,贾鹏反复强调:硬件远未成熟。尽管普遍认为缺数据、缺算法,但实际硬件(如人形机器人手部结构)仍存在寿命低、不可单件维修、缺乏标准化与工艺沉淀等深层问题——他推荐《晚点》对Optimus的供应链深度报道,印证了硬件是当前最大“坑”。
关于具身智能能力何时成熟,他判断2026–2027年可能出现关键信号,核心取决于两大突破: 1. 统一化(unification):尤其是多模态推理能力(如视觉Chain-of-Thought),即不仅理解多模态输入,还能基于推理生成动作; 2. 自进化(self-evolution):模型具备闭环迭代能力——在生成模型基础上,能自我驱动数据生成→模型更新→验证反馈的完整循环。
他指出,当前多模态模型(如Gemini、Silence)在理解与生成上进展显著,但视觉COT尚未突破;而自进化已有初步探索(如IP生成与模型训练的互馈),至简亦在推进类似方向。至于科研级难题,他认为空间已大幅收窄:硬件构型趋同、数据冷启动路径相似,长尾场景的泛化能力(尤其现实世界复杂case)与世界模型 vs LLM 的路线之争,成为当前主要未解题。
“你真的真的自己做硬件之后,你就发现哇,这个坑太大了。”
“总结成两个词,一个是 unification……第二个呢,可能有点类似 self 的 evolution。”
技术路径趋同:从分歧到收敛
当前具身智能领域在多个维度上正显现出明显的收敛趋势。硬件构型虽有差异,但核心零部件高度趋同;数据冷启动阶段的差异也已不大,真正决定胜负的,是对长尾场景(long tail cases)的处理能力——尤其在真实世界中如何系统性解决这些边缘问题。自动驾驶行业已为此趟出一条可行路径,值得借鉴。模型层面虽仍有争议(世界模型 vs. LLM),但一体化(unification)已成为大势所趋,越来越多团队意识到统一架构的必要性。在模型落地环节,SFD(Sim-to-Real Fine-tuning)+ 真机模仿学习(IL) 的范式正逐步形成共识,尽管效率问题仍被广泛吐槽。至于商业化路径,虽存在To B(如物流、商超)与To C(家庭服务)之争,但各方普遍认同:垂直领域各有适配空间,需因地制宜。整体来看,从硬件、软件、算法到数据与商业模式,行业已从混沌走向初步共识,标志着行业正从探索期迈入“To B到To C”的关键转折阶段。
原话:“我隐隐约约觉得这是个To B到To C的一个shift的阶段,因为一旦这些东西有大概的目标和方式之后,可能在接下来大家就是开始怎么把它真正做商业化。”
原话:“一旦到了百家争鸣这个阶段,可能泡沫就来了……你可以看到智能手机也好、新能源也好、自动驾驶也好,都一样。”
巨头入局窗口:时间窗口与生存法则
中国互联网巨头在具身智能领域的深度入局虽尚未全面展开,但趋势已清晰可见。华为、小米、理想、小鹏等具备软硬件基因的企业,迟早都会将具身智能作为第二曲线——因其天然契合现有生态布局。然而,巨头的碾压式入场需满足一个前提:产品-市场匹配(PMF)确立、供应链成熟、市场路径清晰。正如新能源汽车发展史所示,小米造车正是在魏小李等新势力验证了路径、供应链高度成熟后才果断出手。巨头优势在于品牌、生态与供应链整合能力,而非底层技术原创;其策略是“后发制人”:等待创业者跑通模型、验证需求、成熟供应链后,再以资本与规模优势快速收割。
因此,对初创公司而言,PMF出现前的窗口期极为关键。若以灵巧手稳定量产、精细操作落地为PMF标志,2028年可能是关键节点——此后行业将从“极客小众市场”迈入“早期大众阶段”,巨头必然全面进场。届时,能否从创业团队蜕变为具备中型组织战斗力的公司,将成为生死线。
原话:“你必须是个六边形战士才行,全战不能有短板,这个短板其实还包括资金的短板。”
硬件之困:标准化缺失下的体系战
当前最具不确定性、也最制约行业发展的,是硬件的工程化与量产能力。相比新能源车百年积累的标准化供应链,具身智能仍处于“前工业化”阶段:构型多样、零部件无统一标准、制造工艺参差、可靠性验证体系缺失。这直接导致核心问题——真机数据一致性差:同一型号机器人A与B采集的数据差异巨大,噪声甚至超过信号本身,使模型训练失效。规模化是破局关键:工业机器人历经数十年、百万级出货量才实现标准化,而具身智能尚处万级以下试产阶段,成本与质量均难控制。
因此,硬件不仅是成本问题,更是体系能力问题。未来融资需求将集中于四方面:GPU算力(占研发费用1/3以上)、高质量数据采集、顶尖人才薪酬、硬件迭代与备货。其中硬件投入因量产规模未定,最难预估。真正的壁垒不在于单点技术(如模型易被复制),而在于组织战斗力、商业造血能力与全栈协同效率。在资本效率与巨头碾压的双重压力下,能否在PMF前完成从“单点突破”到“体系作战”的跃迁,将决定生死。
原话:“我们自己做完之后就发现坑很多……尤其是你坐过车之后,再回来看,两个行业差距非常大。”
从工程师到 CEO:责任与 mindset 的转变
创业半年多来,贾鹏最大的变化是责任感的显著加重——从过去仅聚焦技术研发,转向全面承担起人事、资金、组织文化乃至员工生活细节的责任。他形容这种转变像“做家长的感觉”,比如要考虑员工孩子生病时能否帮忙联系医生、办公位怎么安排、甚至喝什么水。这种转变并非源于主动选择,而是形势所逼:作为初创公司一号位,必须从“事”转向“人”,从执行者变为战略决策者。
在能力层面,他意识到战略观(即“要什么、不要什么”)比技术本身更重要。尤其在高度不确定的具身智能领域,诱惑众多(如是否做零销售、是否进家庭场景),必须清晰取舍。他坦言自己原本是典型的工程师思维——专注单点、追求极致、精力吝啬,甚至自嘲“比较懒”,只愿把一件事做到位。正因如此,找到凯哥、佳佳这样的合伙人让他如释重负,得以将部分职责放心托付。
“你可能就是比如说,我们原来像家长的那种感觉,对,有点像做家长的感觉啊。你就感觉好像突然觉得这份责任就在你肩上了,而不是说原来只是我只要把技术做好,把产品做好就行了的。”
“我可能是喜欢打这种零到一的,啊,有点偏逆风的这种感觉,就是别人不太看好,或者别人认为是个狠心,呃,类似这样的行业。”
谨慎 vs. 扩张:PMF 前夜的战略博弈
贾鹏坦承,目前公司仍处于高度谨慎状态,尚未像部分同行那样高调铺开。他承认外界可能因此觉得“抠”,但认为这是早期阶段的理性选择——先聚焦几个小场景跑通闭环,再收敛方法论后扩张。然而他也意识到,随着行业进入 To B 阶段,谨慎未必是优势;“可能给我们的时间不会特别多了”, soon 将进入“推刺刀”的拼杀期,亟需提升快速扩张能力。
他将当前战略视为一个关键“bet”:不确定是否最优,但仍是当前最可行路径。未来能否成为范式发现者,取决于两个维度:一是保底目标——当他人率先找到 PMF(如特斯拉 FSD 验证端到端大模型产品力),团队能迅速跟进;二是理想目标——凭借过往经验,自己成为 PMF 的创造者,定义新范式。
“如果比较感性的来描述,嗯,你创业七八个月到现在是一个什么样的过程?……我我发现我回顾我过去这十五年的工作,我觉得我踩点踩的都很好,而且还都比较顺利。”
“我更期望的是,从一个大家不被看好,或者从零的一个状态,我能把它带到一个很好的状态,这让我是有很很大成就感的一件事儿。”