刚开始毕业那时候其实还是比较懵懂,第一份工作选国家核电,呃,去了之后日本的福岛核电站它就炸了嘛。因为这个市场空间太小了,工业机器人在二零二四年全球一共卖了五十万台,平均一台两万美金,也就一百亿美金的市场,相当于理想汽车卖半年的车。这怎么黑了?发一些水稿吗?找一些水军去留评论吗?对对对对,还有人黑我跟高阳不和,这是我听过的最离谱的黑点。
这个行业内还有很多投资人在说,OK,二六年是具身落地什么生死之年,落不了地这个行业就没了。我们是非常不认同这个观点。具身的核心还是模型,二六年具模型是爆发的元年。欢迎收听晚点聊,我是曼奇。本期嘉宾是新近完成近二十亿元融资、估值突破一百亿元的具身智能公司千寻智能的创始人和 CEO 韩峰涛。此前,千寻的联创高阳也两次做客晚点聊,分别是一百一十二期和一百四十八期。
九零后的高阳从伯克利回国后加入清华插院,是典型的新锐 AI
技术力量。和他搭档的八零后韩峰涛则代表中国具身领域的另一条路。他是一位在2016年第一轮AI热潮时开始做智能机器人的创业老兵。他见证过被抢着要份额的热潮,正如现在的具身赛道,也一度背负个人连带债务,度过行业的冬天。这期节目我们回顾了过去十五年韩峰涛亲历的中国工业机器人、智能机器人再到具身智能的变化,也聊了近期具身领域数笔大额融资背后的行业转折和二六年的竞争主题。
我们提到了一次 VLA 零次世界模型,但提到了好多好多次客户,这是韩峰涛的肌肉记忆。但他也反复说,二六年不会是具身行业的落地生死之年,而是具身模型的性能快速爆发的一年。这是一个经历过上一轮起伏的创业者转变的决心。我们正式进入本期节目吧。嗨,峰涛,欢迎做客晚点聊。你可以和我们的听友简单打个招呼,简单的自我介绍一下。
大家好,我是千寻智能CEO韩峰涛。这次采访之前,我特意去看了一下微信记录,我们是二零年六月加上的,那个时候你是在上一次创业。OK,我在落实。对,在落实那会儿做CTO也是落实的联创。嗯,然后这一次你刚一官宣创业的时候,我就从朋友圈看到了,应该是二四年四月的一条朋友圈,你写的特别有历史感,所以我当时就截图保存了。
我可以先念一下,因为正好我觉得是一个你自己的经历和中国机器人行业的一个脉络的。简要的概括,我们后面可以顺着这个展开。OK,你当时写的是十五年前,就是二零零九年,一边在实验室里敲着神经网络加遗传算法加蚁群的混合算法。一边看所里研究的人形机器人学会打乒乓球,九年前投身于机器人创业大潮,见证了中国工业机器人产业链的崛起。
六年前,力控协作机器人和3D视觉引领的第一次智能机器人热潮,中国机器人产业开始从进口替代走向自主创新。两年前,GPT 3.5发布,填补了AI在通识领域的空白。第一次真正意义上具备了开发通用智能机器人的全栈技术基础。一个月前,Figure联合OpenAI展示了具身模型和机器人深度融合后的惊人效果。两天前,波士顿动力发布了全新的电动Atlas,再次为世界树立了机器人技术的新标杆。
今天,Spirit AI千寻智能汇聚了一群充满创造力与激情的科学家、工程师和连续创业者。我们致力于创造行业领先的通用机器人和下一代具身大模型与学习算法。驱动世界迈入智能机器人的新时代,非常豪言壮语的一个宣言啊!我们可以从头来聊聊这个经历。你当时也提到十五年前你就在做机器人嘛?当时行业和技术是一个什么情况?
对,我是零八年。到一一年,在浙大控制学院读的研究生,当时我的专业是模式识别与智能控制。我的导师是国内最早一批研究神经网络的。当然,这个也来源于原来我在本科的时候,那时候搞足球机器人,当然买不起那么好的机器人,我们就用一些大概十五厘米乘十五厘米这么一个立方体的一个小车。然后用高尔夫球来模仿足球,然后在桌子上大家踢,所有的规则都是手写的,其实很痛苦,因为你手写无法涵盖所有的 corner case。
所以读研的时候,我们从传统自动化或者从现代控制,有没有更好的控制方案?一看有个专业叫模式识别与智能控制,一听哎就很好。然后就选了这个专业,当然进去之后才发现,其实那时候神经网络正处于一个低谷期,没有人搞神经网络,大家都觉得神经网络已经没什么可搞的了。我们那时候甚至有人开始把多层的神经网络给简化成一层,把多个神经元简化成一个神经元,用单个神经元搞控制。
然后大家就就开玩笑说,那单个神经元不就是一种PID吗?所以也没办法啊,但是一一年毕业没有赶上深度学习第一波,到二零一二年底 AlexNet 出来,二零一二零一三年深度学习直接在在全球引爆了深度学习这一波热潮,但确实也没赶上啊,因为毕业之后就暂时脱离了机器人和 AI 这个行业,暂时脱离这个行业是因为找不到工作吗?
一一年时中国机器人行业是个什么情况?对那个时候,其实国内搞机器人的很少,可能工业里面的像埃弗特,我不知道有有没有听过这家公司。我知道,对埃弗特是零八年开始做的,嗯,埃斯顿呢是一零年开始做的。而汇川这些做自动化的,汇川在一三年左右开始做机器人,所以那时候就是很少有机器人的岗位,所以我们这专业客观讲,那个时候找不到工作。
你当时没有想过要去创业?当时还没有,当时那个时候创业比较多的是第一波的智能硬件,一零年前后,我有同学出去创业的,但那时候对于创业这个事认知还不够清楚,而且我确实是我对智能硬件第一个我做的不太多,第二我我还是对机器人感兴趣。你从小是学霸吗?还行,班里基本上排前三、前五吧。啊,但是我确实不是那种非常努力的人。
上高中的时候,我们是个军事化管理的学校,啊,每周有半天让我们大家出去去外面去买买东西、洗个澡、吃吃饭。我那半天儿一般都是去网吧泡着,然后泡到晚上八点集合,七点五十五我就跑回教室。你什么地方人啊?我在河北正定,河北正定中学读的书,就是正定是常山赵子龙待的地方。我知道赵子龙哦,那我老家是那个长坂坡啊。是啊,哦,河北的高考也挺难的,竞争挺激烈。
国内高考其实最难的还是山东,我觉得河北能排第二。那你当时后来本科你去的是什么地方?去的华科,华中科技大学。所以你在华科的时候,其实你是自己给自己找了很多事儿,对吧?比如去参加机器人比赛这种。对我当时去搞学生会,参加机器人比赛,去组织骑自行车,就是骑自行车从武汉骑到石家庄,去踢球,去给学校拉赞助,搞外联,反正当时做了很多事儿。
嗯,就是在学习上投入精力确实不多,但是我确实喜欢折腾。所以其实有人问我为什么选择连续创业,除了说大家原来说的,你一旦开始创业你就回不去。第二个,我本质上我还是非常喜欢折腾的人,啊,我喜欢有挑战的,我就特别不喜欢,就是做过的事情再让我做一遍,我觉得很没意思。比方说这次创业,如果正常来讲,我原来做硬件的,那我这次创业,我先去搞关节,我先去搞本体,然后把它卖给这些做大脑的。
但是这个是第一个。以前做过啊,没啥意思。当然,第二个还有很重要一点是,这次创业最本质的最大的机会还是大脑,所以我们应该去做大脑,而不应该去做做硬件为主。学生时代这么活跃,为什么你第一份工作是去了国企啊?就你一一年毕业之后,应该是先去了国家核电,对吧?后来又去了中国机械工业集团。这客观讲,我们现在回头看是。
生活所迫,因为我们的专业确实找不到工作,但是好歹我是学控制学自动化的,啊,核电厂这样的流程工业还是需要这样的人,所以就就先去了国家核电。你当时在国家核电,包括后来去国机,是怎么又开始做机器人的呀?刚开始毕业那时候其实还是比较懵懂,第一份工作选国家核电,当时也比较倒霉,呃,去了之后日本的福岛核电站它就炸了嘛,炸了之后这个全球的核电站它就不让干了。
所以那个时候我们就,啊一边把手头的项目接着往前推,一边去做垃圾焚烧电站、太阳能光伏电站,然后风力发电、核电站,然后那时候我们去消化美国的第三代核电站技术,所以主要做翻译。把英文图纸翻译成中文图,当然你也得做国产化的适配,所以一直到做了将近两年吧,正好有个机会,有个机会,国际的一个领导跟我的其中一个朋友他们认识,说我要搞机器人了,你有没有靠谱的小伙帮我推荐一下,就把我给推荐过去了。
然后我一听又要做机器人,就很就很开心。然后又跑到那儿去做工业机器人,所以本科和研究生都跟机器人还是有关系的。就中间国家核电稍微 gaps 大概两年,然后一三年又回到了机器人行业。从零九到一二年,那个时候啊,如果像我这个年纪的,应该还还有印象,那时候大家讲用工荒,就是到处招不到人。所以国家都特别想,OK,我要做工业机器人,我要做工业母机。
我们国家要从制造业大国变成制造业强国。所以那个时候,一些央企上市公司就要搞机器人。所以我又回到了国际去搞工业机器人。啊,所以一三年,一三年又回到了机器人行业,接着来搞,对,一直搞到了二零一五年。然后到一五年开始创业的时候,是看到了什么新的机会啊?那会儿你是和国机的同事妥华一起做落实,对对,有妥华,有曹华,我们三个人啊,我是搞算法的,妥华是搞软件的,曹华是搞硬件的。
那个时候其实有两个机会点,第一个呢,二零一四年中国中国这个大陆市场变成全球最大的工业机器人单一市场。啊,就是超过日本。原来是日本是最大的这个单一市场,后来二零一四年变成了中国,所以二零一四年被媒体称为中国工业机器人元年。它超过日本成为单一最大市场是一年能卖多少了?在中国工业机器人那个时候很少,那时候一四年我印象中应该是一年卖八万台,二四年大概中国一年卖三十万台。
所以在一四年那个时间点,其实全球的工业机器人的总销量也没有特别多,那时候只有几万台的量。那时候我们都说做机器人五百台打平,一千台盈利,就是在一六一七年的时候,大家都在喊这个口号。后来发现,从五百变成一千,一千变成两千,两千变成三千,现在大家一年卖一万台工业机器人仍然不盈利。对,这个市场啊,嗯,当然那时候也在鼓励创业。
那时候在中关村创业大街啊,三大三W咖啡有很多年轻人跟投资人一杯咖啡就搞搞就开始创业了。所以那时候第一个看到这个机会,因为我们做机器人的,所以国家支持这个事情。然后我们又在这个行业里边,因为那个时候客观讲。我觉得这一路从毕业到一路走过来创业,其实是一个认知不断成长的过程。一开始,实话说。更客观的讲,叫无知者无畏。
我们当时觉得,哎呀,三年创业,五年上市啊,财务自由,大家这个走上人生巅峰。所以那时候觉得创业很简单啊,我们又有技术,对吧?我们把技术搞出来,我们这么好的技术,只要把东西搞出来就可以卖。甚至那时候我们都还不知道去拿融资。我们第一篇的这个商业计划书B P是是用Word写的,写了有。这个应该有六十多页,我印象中。
然后还发给了军联,嗯,然后军联有个朋友说,说我们现在B P都不用Word啊,你们P P
T写就好了。对,所以在那时候其实确实是无知者无畏啊,因为那时候我们都觉得自己挺厉害,自己手头有技术,那就往前冲,就开始创业。但是客观讲,我觉得过去的十年也算见证了中国工业机器人的崛起。然后这一路走过来,有融资融得好,然后大家都过来去抢份额的时候,也有企业发展不顺利,然后投资人就天天问哦,OK,你们不是搞机器人吗?
啊,这么高科技的企业,你毛利为啥这么低呢?对,然后就问那今年业绩怎么达成的不好?所以。见证了中国工业机器人的崛起。我们工业机器人原来整个国产工业机器人从二零一四年的市场占有率不到百分之三,到二零二四年的市场占有率超过百分之五十。但是总体上,工业机器人还是个很小的市场。曼奇肯定是你是你是经历了你看了很多机器人三D视觉缺陷检测,用AI让机器人试图让机器变得更聪明。
这一路走过来,其实我们一直想做的事情就是想让机器人能干更多的事儿。你只要能干更多的事儿,实际上你就能创造一个更大的市场。所以我们原来其实在做俩事儿,第一个呢,做更好的硬件。所以原来的机器人是叫没有力觉的,所以我们在那时候做力控的协作机器人,其实就在给硬件增加功能,增加传感器。你给硬件增加更多的传感器,它的上限就会更高。
所以原来洛石做的这种力控的协作机器人,实际上是给机器人增加力觉。就像我们的手机原来是,啊没有摄像头,增加摄像头它就可以拍照,对吧?啊,增加一些这个三D摄像头,它可以做一些三D扫描。计算机没有显卡的时候,它就没有办法玩三D游戏,应该增加显卡来可以玩三D游戏。有了硬件,硬件是基础,那我们就应该用用更好的软件让机器人发挥更好的作用。
所以最早的软件是用我们传统的控制来手写规则来写的,所以诞生了工业机器人。然后后面在深度学习第一波热潮的时候,我们包括珞石,包括像梅卡曼德。啊,XYZ啊,阿丘、如本这些,包括飞汐,这应该客观讲属于第一批的具身智能公司。他们想用第一代的深度学习、第一代的AI来跟机器人结合,让机器人变得更好。包括原来我们做的缝衣服、磨刀,其实都是。
AI加力控加小脑一块来来做,然后然后做一些原来靠传统自动化、靠传统控制、靠规则控制无法实现的东西,但确实受限于上一代AI实在太弱了,我们没有办法构建一个通用的大脑。所以直到二零二零二三年ChatGPT出来,我就看到这个机会。大模型这次是一个真正的技术革命啊!原来听有一次活动,王坚院士就是阿里云的王坚院士,他说过一句话。
他说,真正的技术革命一定会诞生伟大的公司,啊,就像原来的互联网技术,从咱们国内的三大门户网易、新浪、搜狐,到之前的雅虎,再到搜索引擎 Google、百度,然后再到这种信息的推荐,像字节,对吧?啊,包括移动互联网,我们的移动互联网加 LBS,像滴滴、美团外卖这些,然后再到四G 通信开始了这种短视频。客观讲,第一次的深度学习不能称之为技术革命,它是个技术进步。
它最大的应用点,像这种C V里边就是人脸识别,就变成一个通用,就变成一个小的功能点,包括一些基于L P的做一些音箱。但是它不能称之为革命性的技术,技术革命。所以上一代的跟A I相关的公司并没有产生特别大的公司,虽然也有一些创业还不错的,但是没有产生伟大的公司。但是大模型是真正的技术革命,这个其实我觉得大家应该是有充分的啊认知上的统一的。
大模型技术是技术革命,所以千寻做的事情其实也很简单。就是把大模型的技术革命从虚拟世界带到物理世界来,我们来去构建一个物理世界的通用的模型或者基座,然后来控制将来控制各种各样的机器人来干各种各样的活儿。嗯,因为你说你你们第一次创业的时候,其实把创业想得比较简单,觉得比较快可能就能盈利,比较快就能上市。
那当时是没有看到这个技术上的差距,还是说那个时候觉得以当时的技术也是可以做一些商业化的应用的,只是在商业化上跟你们的想象是不一样的。我觉得主要是第二种,就是。因为工业机器人技术,它是一个相对成熟的技术。我们做的工作主要是在国产替代。嗯,这个其实不光发生在工业机器人的技术上。疫情之前的几乎所有中国的硬科技创业都在干一个事儿:进口替代或者国产化替代。
对,包括半导体,包括一些高端的零部件、设备等等。对,半导体零部件、工业母机、机器人、汽车。啊,甚至包括无人机、运动相机、家电,其实都在干进口替代的事情。所以,其实我们是我们第一次创业那一代创业的人,其实还挺苦的。你你上面有进口厂商。对吧?它的品牌比你好,渠道比你好,就毛利比你高。你还有国内一堆卷王跟你一块卷,竟然还是挺苦的。
但是我觉得那是我们上一代创业人的,咱给自己贴贴金。上一代创业的人的使命就是,至少你现在京东商城去看,几乎所有的硬科技都是国产品牌了。你回到家里,你再去看,其实很少有有进口品牌。我们身边可能除了这个 iPhone 手机,我觉得这也是过去的十到十五年中国上一批像我们我们第一次创业那批创业者的历史使命完成的还挺好的。
为什么工业机器人这个门类的国产替代并没有带来商业成功了?因为有些产品的国产替代,我觉得它是商业成功的。某种程度上,我觉得是有商业化成功的,像汇川和埃斯顿,总体上他们的出货量和利润都还可以,只是因为这个市场空间太小了。工业机器人在二零二四年全球一共卖了五十万台。平均一台两万美金,其实还没有国产机型,现在没有这么贵,也就一百亿美金的市场。
一百亿美金就是A P P方太科原来说四代家族,包括国内的汇川、艾斯顿,包括洛石四零,所有的工业机型加到一块,全球一百亿美金。一百亿美金相当于理想汽车卖半年的车,它是个很小的市场,然后它又是个充分竞争的一个一个市场,所以大家其实某种层面上取得了商业上的成功,只是大家都不挣钱。嗯,所以就是如果你自己去总结一下第一次创业的有一个误判,就是你们当时并没有在出发的时候特别仔细的去思考这个商业空间的问题。
我们其实也思考一点,我们一开始最开始是只做机器人控制器,就是觉得哎,机器人控制器是机器人的核心。那个时候没有AI,我们的机器人控制器其实就是机器人大脑。那其实那个我们很快就发现,第一个机器人只做机器人控制器,它的市场空间很小,是第一个。第二个,因为机器人是软硬结合的,所以你想做好机器人控制器,一定要跟本体结合。
所以我们很快就就转到了硬件和软件都做这么一个路上来。所以机器人控制器当时的机器人控制器主要是软件是吗?是个软件系统为主的。对,是软件系统,就是现在我们说的小脑这个事情。其实,在自动驾驶行业,大家也发现也也是个道理。原来有很多公司说我只做自动驾驶,我不做车,以后车厂就是给我打铁的。然后现在发现车厂爸爸还是车厂爸爸,对吧?
自动驾驶的汽车它也是车,所以你还得软硬都做。嗯,其实,在这一轮的具身智能创业之中,也有这样的。不同的选择,比如说美国有一些公司像派,它就是不怎么做本体的,它主要是用别人的本体来开发它自己的大脑。然后中国的公司,包括千寻,包括你们的绝大部分的同行,都是本体和模型要一起做的。我觉得这个呢,一方面来源于中美两国创业环境的不太一样。
美国是有收购文化的,中国没有。就是美国你做大脑做得好啊,可能直接他卖给谷歌、卖给特斯拉、卖给谁,他就直接退出了。但中国不行,中国的大厂几乎所有东西都会自己做,啊,所以所以在中国你想创业,你一定要先把自己。中等规模的厂,我在公司内部说,OK,千寻的,我们真正的敌人是实际上是这些大厂,其实并不是这些创业公司啊,因为大家都要想办法在在将来活下来,所以你想面对大厂的竞争,只有一条路,先把自己变成一个中等规模的厂,先把自己变成中厂,没有别的办法,你不能说你自己账上钱多,啊,你说我先苟着啊,我等技术路线收敛了,然后我再下场,你也不能说到时候我的人才好像比大厂要多,这其实都是自己在欺骗自己,创业公司只有。
一个优势就是你的速度快,然后你要尽快把自己的阶段性的技术的优势变成某个细分市场的市场的地位的优势。为什么要同时做本体才能变成一个中等规模的厂了?因为我们我们的具身智能的核心是具身大模型,是一个大脑。但是你最终卖的客户能买到的实际上是更智能的机器人,客户不会买我的大脑去买个预设的机器人,然后自己拼一拼装一装,这个至少在行业中早期是几乎不可能的。
它从最终的性能、上手难度,其实都很难。所以你为了保证你的性能,包括你客户体验,保证你的公司跟客户有直接的这个 connection,包括你可以直接的去获取到客户的反馈和数据,你一定要有自己的硬件。嗯,你觉得做到什么程度叫中等规模呀?多大算中等规模?至少一年卖十万台机器人。一年卖十万台机器人,你觉得要在多短的时间里实现这一点了?
这些创业公司才能生存了。新能源车大概用了七年左右的时间,六到七年。我觉得,我觉得我们的时间可能会更短吧,五到六年。所以我们内部的计划是二零三零年。二零三零年,那你觉得二零三零年那个时间点啊,中国整个市场能消化多少人形机器人?呃,或者说通用机器人吧?那当然,你们可能也会出海啊,就是你可以算得更广泛一点。
因为现在中国有非常非常多的具身智能创业公司。那二零三零年真的能做到你说的这种中等规模的,能容下几个公司了?二零三零年应该公司还会。还会比较多,我我觉得终局可能这种综合性的集群大厂也就全球也就五到八家不会特别多。我觉得二零三零年整个全球的市场肯定是百万级别的,千万级别不一定,但百万级别一定是要的。那百万级别的话,能卖十万台,分一分可能也就只有不到十家能做到这个程度,而且它肯定会有一个二八分布的,就头部的应该会卖的更多。
对对,头部的可能加在一块,就跟原来的四大家族包现的手机啊这个行业一样,就是头部的五到八家瓜分了三分之二的市场,剩下可能还有很多小厂瓜分剩下的三分之一的市场。这个中等规模里包含盈利吗?如果我们卖到十万台,肯定是盈利的。肯定是盈利的。为什么工业机器人卖到几万台之后也没有盈利了?你之前说当时大家认为卖到一千台就可以盈利,最后可能一个公司一年能出货到上万台了,还是不盈利?
为什么这个事情不会在具身智能领域重演了?这里面的因素很多。第一个呢是工业机器人整个的出货量还没那么大。第二个,工业机器人已经属于一个行业的,它整个已经同质化很严重了。在一个行业的后半段,同质化很严重的时候,你也很难盈利。但是具身,因为它用大脑可以解决规模的问题。因为如果我们有很好的大脑,因为工业机器人原来我经常跟我们的投资人讲,工业机器人中国的保有量大概在三百万台,每年的新增销量是三十万台。
但是中国有一个亿的制造业工人,所以工业机器人大家都以为很成熟,但它渗透率其实很低。按照保有量来计算,它的渗透率只有百分之三;按照每年的销量来算的话,渗透率只有百分之零点三。这里边主要原因是机器太笨了,它只能干非常简单的活。如果我们用大脑让,用具身模型让机器变得更聪明,它可以干可能百分之三十的活,所以它的量会有一个至少一个数量级上的上升。
这种批量生产的东西,我们可以靠规模化取胜,这是第一个。第二个,有了大脑之后,机器人就可以从工厂走向我们的服务领域,甚至走向家庭领域。所以千寻的我们的目标肯定还是奔着服务机型和家用机型去的,嗯啊,只是说一开始在技术早期、行业早期,我们先选一些简单的场景,那就是先工业。所以千寻内部这个我们在二四年底,我们说我们要去给公司定一个中期的目标,就大家得有一个中期目标去往,去引领大家往前跑。
然后高阳就提了一个“双十计划”,就是十年让全球百分之十的人拥有自己的机器人。所以你想十年卖出这么多机器人来啊?那你一定还得是服务机器人或者家用机器人,靠工业机器人是不行的。嗯,回到这次创业的起点,你当时看到大模型带来的新的变革性的机会的时候,除了创业,有什么别的方式抓住这个机会吗?比如说继续在落实去做这件事情,或者加入一个资源更多的大公司去做?
就当时小鹏这些中国的公司也已经在做具身智能。对,当时也想过,我甚至还考虑过去当投资人啊。我觉得我市场洞察能力还可以,但是后来仔细想了想,就是任何一个高科技的创业,你其实最主要的先找到那个会干这个事情的人。这些人都在哪?这些人都在创业公司,就是这些人几乎不会加入到一个成熟的公司。这个其实,在国内其实也可以看到,对吧?
无论是伯克利的硅谷四四,还是国内这些巨神的头部企业,这些顶尖的科学家、顶尖的技术人才,一般都会自己创业。所以我也跟一些人也聊了聊,发现最核心的人的问题,你得先解决创业公司的生存的机会的窗口期很短,一般三到五年。你想在这三到五年里取得比较好的身位,你一定要去识别这个核心的卡点是啥。你只有解决这个卡点,你才有可能推动这个赛道往前跑,你才有可能获得一些先发优势,使得你比别人跑得更快,最终才跑出来。
所以具身赛道的核心卡点就是大佬。所以你你创业,你得先找到一个厉害的。全球顶尖的这个 AI 的人才,这些人才不会再大厂,也不会加入一些传统的行业,所以我那个时候就开始到处,寻摸我的 AI 的合伙人。嗯,你和高阳后来是怎么相互找到、相互认可的?你们之前是不认识的啊。高阳就是你说的伯克利归国四子之一,对,后面有了这么一个称号啊。
对对,那时候还没有。就刚才讲这次创业。那我考虑的更多的是,不是我会干啥,我会干机器人,我会干一体化关节,我我会干机器人整机,但是做这个东西,客观讲,并不是这次这次巨声赛道最大的机会。最大的机会还是大佬,所以当时我我就到处去找,找我认识的人帮我去介绍。OK,谁做大佬比较厉害?我当时微信里面大概有六千多个人,我就从从A到Z。
我就一个个去看谁有可能帮我去介绍,反正大家一共大概给我介绍了一百多个人,我他前前后后见了一百多个人。你在什么时间到什么时间见了一百多个人?一共花了多长时间?就是二三年大半年的时间,有的是线上,有的线下,有的是视频。高阳是你见的第几个人?比较后期了。高阳我俩认识都已经到二三年的六月份还是七月份了,相对比较后期了。
当然那个时候高阳也在找有产业和硬件背景的人。就是国内这些客观讲,就是二三年和二四年成立的具身智能公司的首席科学家,我我基本上都聊过,然后这些公司的CEO高阳也基本都聊过。所以我俩认识是有一个共同的朋友,是他伯克利的同学,因为我当时好多人帮我介绍,就介绍的高阳,然后高阳我俩见面之后,也算是我们内部开玩笑叫双向奔赴,就他在找CEO,我在找CTO,所以就是AI加机器人,我俩从见面到最后最终决定在一块来创业,大概聊了十几次。
你见这一百多个人的过程中间,就是有些什么心情的起伏,或者说认知上的一些变化和收获。我觉得最大的感受就是靠谱的人太少了,骗子太多了。就是大家看到这个赛道有可能要火,有的人想出来来骗投资那点钱,有的人就很固执,就觉得自己原来做了十几年AI,那AI赛道这个机会来了,我也想出来做一做。但是他的整个技术线其实跟大模型又不太一样。
啊,有的人就就想,我要加入你可以,但是我带很多人过来,这人到底适不适合新公司也不一定,反正我得带一堆我的人过来,反正有好多种,就是靠谱的人太少了,所以为什么建了一百多个人?因为选创始人或者选自己的联创、选合伙人是个非常重要的事情。具身是一个至少我觉得得。二十年以上的事儿,啊,我还是想去去做一家伟大的公司的。
我第一次创业,实际上,洛石虽然今年应该会上市,因为它报了港股啊,应该会上市,也是也是一家上市公司。但是我觉得,我们应该有在具身这个赛道,以及在中美AI大战这个大的时代背景下,我们是有机会去做一家伟大的公司的。所以,你想选这个合伙人,一定能跟着我们一块儿往前并肩战斗二十年。所以,所以选这个过程中,第一个当然它的技术线要靠谱。
当然那个时候我们其实还我对AI的认知还没有那么多,所以二四年刚开始融资的时候,跟很多投资人聊,最后他们这个业界就说千寻的CEO不懂AI,但是那时候我有一点是确定的,OK,那既然是大模型的机会,那这个人一定知道怎么去搞大模型。所以高阳那时候他通过做互联网视频训练做大规模训练,包括高阳在一七一八年就开始研究端到端自动驾驶。
那时候他又搞端到端,又又又知道怎么做大规模训练。我觉得OK,技术上至少是靠谱的。第二个呢,为啥我俩聊了十几次?其实还是要确认,就是你的创始团队能不能长期十年二十年一块往前跑?最根本的一个要求叫三观一致,或者用我们这个另外一个联创郑总的话叫价值观趋同。因为大家最终能不能走到一块去,或者能不能长期合作的好,不是说你吵不上架,就一定会吵架的。
因为你创业过程中一定会有大家去去争吵的过程中,最终影响这公司的团队,有可能会会分裂的是在创业过程中一定会有很多考验人性的点,需要你做决策。考验人性的时候,一定是看价值观。聊到什么时候?聊了什么事情让你比较确认你们的价值观是趋同的?其实我们聊了很多东西,我觉得这个信任或者大家相互的这个认可是一步一步来。
从聊大家的分工,聊对创业的看法,聊你准备在千寻干多长时间,聊对做科研和做落地的区别。聊如果以后咱们拍桌子,相互都拍桌子,甚至相互骂娘啊,我们应该怎么处理这个事儿?聊如果我们有分歧的时候应该怎么处理?我跟高阳聊,他说他对你的第一印象是觉得你有一些像生意人,因为你说话特别豪爽,而且对很多人和事儿有自己的很犀利的观点。
然后后来他跟你聊的次数比较多之后,他发现你也挺懂技术的。对我原来我也觉得我挺懂技术的啊,直到后来被早期的一些投资人说千寻的CEO不懂AI,所以所以那时候发愤图强啊,认真学AI。嗯,你对他的印象是什么呀?我对他的印象是,第一个,他对于措辞。很严谨,就刚刚说话,有的时候你你问他个问题,他如果没有第一时间回答你,他会思考一下,然后给你一个很准确的描述。
他非常严谨,然后后面相处的多了之后,我觉得刚刚是一个后来我自己总结的叫极度聪明。然后纯粹正直的人啊,这是当时大概能看到的。当然后面发现,其实高阳也挺感性的啊。高阳在我们刚过去的年会上还被他的同事给说哭了。其实高阳是我们日常开会的时候,高阳的情绪非常稳定。你给高阳提几乎任何意见和任何他需要改进地方,他会。
坦然接受,然后告诉你他下一步会怎么办啊!所以我们原来都一直以为高岩是一个钢铁直男,没有任何情绪。然后后来发现年会上高岩还被同事们给说哭了,说啊,高老师也有这个柔软的一面。当你们真的就是决定开始创业的时候,你们整个创始团队有哪些核心的共识,以及如果你们当时的价值观总结下的话是什么?当时因为这是第二次创业,所以其实对于公司的一些早期的要做的事情,包括可能面临的困难,我都跟他们讲过。
然后核心的共识,我在啊,包括价值观这事,在公司开业的时候,就是我发朋友圈那天,因为一开始我们只有四五个人,我们前两次融资都是在一个孵化期完成的。我我发朋友圈那天是我们第一个办公室装修好了,大家去搬到办公室里。那时候公司有十一个人,其中还包括一个高老师的实习生。然后那天开业,我讲话我说了两个点,我说我我们应该去打造一个什么样的企业文化价值观。
第一个点是信任,一个团队只有有信任的团队才会有战斗力。而且,这个信任的定义很简单。这个信任的定义是:当你的同事给你提出意见或者建议的时候。你要把你的同事的话当成善意的,而不要过分的小心翼翼或者防备。这句话非常非常简单,但是在绝大部分公司是做不到。大家一提意见会就觉得哦,你针对我。第二个追求卓越,就是在现在这个市场的,无论是融资市场,还是企业竞争市场,还是将来我们要变成一个伟大的公司,只有卓越的公司才有可能活下来,并且活得好。
当时开业我就主要说了这两个信任和卓越。你刚才提到,你觉得高阳比较正直,你觉得正直在这个行业里意味着什么做法呀?那不正直的做法是什么?正直做法就很简单,就是你应该做什么,这是不是你做的?对吧?啊,你说的好坏这些,你是不是如实的向向外界传达?就是这是正直,不正直其实就很多了嘛,对吧?无论是从技术上,你去套一些开源的技术是你自己做的,你还是去给你的竞争对手造谣,还是说去夸大一些你做的事儿?
浙大的校训叫求是,是不是尊重客观事实?我觉得这是最根本的。这个东西,无论是你在做技术的时候,第二个去评价其他公司、评价其他人的时候,你说是是不是基于你得到的客观的事实去评价别人?嗯,因为我自己的感觉是,具身智能行业是非常喧嚣的,非常喧嚣。尤其是过去的一个月啊,因为这次我们融资的过程也发生了很多故事,有好几个投资人跟我说,说具身智能将来你们之间相互喧嚣的程度。
会远超当年的自动驾驶和半导体和大模型,因为这个赛道的玩家太多了,当然融资的竞争也更激烈。所以你指的是公司之间可能会相互怎么说呢?在市场里传一些别人的不好的事儿。对,这个已经开始了啊,比如说找公关公司去去黑别人。这怎么黑了?发一些水稿吗?找一些水军去留评论吗?对对对对,还有人黑我跟高阳不和啊!对我说你这。
我说对,因为曼奇跟高阳也聊过两次,我们也聊过很多次。我说这是我听过的最离谱的黑点。你要说黑韩峰涛不懂AI,我也认了,我确实不如高阳懂AI。那你要说高阳我俩还还经常拍桌子吵架,那那你肯定是没见过高阳。哦,所以具身智能的竞争已经进化到这种程度了。对这个点很难证明。就像问你吃了几碗粉,对吧?我除了把肚子割开,那我没别的办法。
嗯,它在竞争其实有很多都已经不是技术上的竞争了。你觉得这是为什么呢?因为我觉得一般就是这种比较激烈的竞争啊,可能发生在一个规模已经比较大,然后实际的商业竞争已经比较激烈的行业,比如说像当年手机是这样的,包括新能源汽车也会到后期也会是这样。但是具身智能其实是一个绝大部分公司都没有在规模落地的一个状态,就整个行业还是挺早期的。
对具身智能,我觉得。虽然行业很早期,但是大家估值增长的很快,就身处在一个黎明前的黑暗这么一个阶段。然后在这么一个阶段呢,有的人在搞大脑,有的人呢。搞落地,有的人去搞,反正其他各种路径,就会导致对这个赛道有不同判断的人,他对于整个技术行业发展的节奏不一样。然后,投资人呢收到的信息又比较多,所以为了让投资人过来去投自己,很多人就会想各种各样的招,因为大家都看不清。
我觉得客观上肯定跟这个行业的公司特别多有关,而且相比于大语言模型的话,大语言模型在二三年下半年新公司成立或者启动资金的窗口就关闭了。对,是的。但是具身,我们可以看到到二四年、二五年一直都有新的公司出现,尤其是二五年出现的新公司,其实他们的启动资金比你们当时融第一轮的启动资金应该要大了很多,嗯。对对,我觉得二六年的巨神会非非常像二三年的大模型,就是二六年如果。
你拿不到很多钱,跑不到这个赛道的头部,你可能就没有上牌桌的机会了。对,二四年和二五年拿到钱少,是因为那时候,啊,就大家完全没有投资的共识。有投零部件的,有投硬件的,有投大脑的,有投具体落地的,有投这种大脑和身体都做的很多,有投传感器的。就是几乎所有跟军事智能沾边的企业都能拿到钱,甚至有的还拿到很多。
但是在二五年下半年,尤其是过去的几个月,行业的认知迅速的收敛到了要投大脑。对,这里面当然主要原因是制约具身模型性能开始爆发的核心的卡点,数据的这个卡点,在个过去几个月大家形成的共识已经被解决了。所以二六年是具身模型性能开始爆发的元年,也是融资的爆发的元年。二六年如果你上不了牌桌,你不是头部。大概率再新出来的公司就没有太多希望了。
你可以观察到,其实二五年出来的这些公司,大部分都还在讲大脑的故事。你们当时第一轮融资是多少金额呀?我们第一轮只有三千万人民币。三千万人民币,那估值是数亿元人民币。对,三个亿。估值三个亿,对,因为你看,像二五年,像踏实,像质检,其实很多公司可能最开始的一两轮就融到十几亿人民币。我是只融了十几亿人民币啊,是是,对,这就相当于是整个大家的认知开始慢慢收敛,大家要开始往大脑方向去投。
你觉得这是因为行业看到就是砸资源可以出成果的一个信号,对吧?可以讲讲,就是这个数据的瓶颈是被怎么突破的?OK,我刚才讲,你在一个行业创业的时候,你先要找到这个行业的卡点是啥,在这个卡点没有解决之前,你要聚焦于解决这个卡点。所以具身赛道就是卡点就是数据,没有数据。如果完整的说一下的话,就第一个卡点是数据,那再往后可能是什么?
第一个是数据,因为具身模型它其实是物理世界的大模型,或者叫具身大模型,它本质还是大模型,所以我们首先要解决数据的卡点的问题,然后开始具身的scaling,然后你解决数据卡点问题问题之后,你要把具身模型的性能从类比于GPT二。你要爬到至少 GPT 三点五,把基模的能力,你只有做出 GPT 三点五水平的基模,你才有可能去做 ChatGPT,你才有可能在这个基模的基础上,你去做可用的 agent。
所以第一个卡点是数据的卡点,第二个卡点是当你解决数据完卡点之后,你的 scaling 的速度是不是足够快?然后第三个当然是你有了技术之后,你能不能把这个类似于 GPT 三点五性能的这个具身大脑,就是批量型的落到某一个具体的应用上去?嗯,那可以讲讲你们是怎么去解决数据的这个卡点?对,当时啊,二四年,首先你得选择你面临的是仿真合成数据还是真实数据,所以我们实际上从最开始就没怎么选仿真合成数据啊。
这里面的判断,一方面从技术上,sim to real 的 gap 很难去解决,很难被弥补,这是从技术上的判断。从其他行业参考,其实我们可以参考自动驾驶,因为自动驾驶的汽车是最简单的机器人。而且自动驾驶是要避免跟环境做接触,而自动驾驶里面用仿真数据的量也很少,自动驾驶仍然还是主要是真实数据,所以如果连最简单的自动驾驶都。
基本不用仿真数据,那机器人想要干活还要跟环境进行接触,它仿真数据的可用性就会更差。所以我们二四年就先选了真实数据这个路径。真实数据当时有两个主要来源,第一个是视频数据,就是让模型去看人类网上人类干活的视频,来去学一些动作,学一些常识。这个高阳在过去做了很多年。所以,所以我们那个时候就用视频数据做预训练。
所以,过去的两年,我们积攒了有二十万小时的视频数据。然后,第二个是遥操作。就是二四年的,包括二五年上半年,大家主流的采数的方式就是摇操作。对,Optimus最开始就是摇操作。对,对,对,对。遥操作的好处是,数据质量很高,但是它成本很高,采集的效率低,所以遥操作没有办法 scaling。所以,所以我们当时是视频数据做预训练,遥操作做微调。
但是我们还需要一种可以低成本大批量采集的真实数据的方案,来把这数据的事儿给 scaling 起来。所以当时,当时我们就想,OK,怎么解决这个问题?我们又又去参考自动驾驶。自动驾驶一开始是也是没有数据的。它跟大语言模型不一样,大语言模型本质上在数据层面是吃了互联网过去二十多年的发展在互联网上积攒的大量的数据,它已经有了。
我们只是把数据拿回来清洗、标注,然后做数据的工程、数据算法。自动驾驶一开始也没有数据,那自动驾驶怎么解决的?自动驾驶是先把车卖出去。一边开车一边采数,所以我们就想,OK,那能不能让人一边干活一边采数据?所以当时我们就开始搞可穿戴式设备。当时的可穿戴式设备有很多种,有这个五米,有这种外骨骼。有动补,所以我们就二四年大概五月份左右,我们就开始研究我们的整个的这个素材的设备,包括背后的素材的数据的算法、数据的管线。
所以从二四年五月份一直到二五年十一月份、十二月份,我们迭代了四代,迭代了大几十个小的版本,一直在迭代我们可穿戴式的设备。那可穿戴是是设备,你刚说这几种里面,五米就是 U M
I,然后还有外骨骼,还有动捕,你们是都用了,还是你们是怎么选择、怎么判断的?判断逻辑是什么?我们现在也都用。啊,但是它有个我们叫数据都有个配方嘛,因为可穿戴设备它不同的设备有不同的优点,比方说五米这种方式,它只能采手部的动作,但你身上的动作你就没法采,所以如果你只是做训双臂的话,用五米是可以的,但如果你你训一个完整的人形机器人,它就缺少了很多数据,包括只用五米,其实你也并不知道你你的胳膊。
它的构型怎么动?因为机械臂是一个七自由度的这种鱼自由度的机械臂,所以它会有臂角,它会有零空间的运动。你只用五米,你是拿不到这些数据的。你想拿到这种数据,你可能得用外骨骼。你如果采到更精确的这些全身的数据,你可能需要同步。所以,我们是一个数据的配方啊,我我们叫可穿戴的设备,我们并不是叫个五米,我们是用你可以叫全身的五米,就是一些很相对低成本的传感器,加上一些算法的设计。
我们让人穿上,然后我们过去两年解决的主要问题,第一个解决可穿戴式设备的数据可用性问题。一开始这些设备的采回来的数据质量很低,它只有百分之二,相对于摇操作,它只有百分之二十到百分之三十的可用性。它低在哪儿?就是现在你你让他去学一个动作。它可能需要三到五倍的数据量才能学会一个动作,维度也少,然后整个采集的数据的位置的精度也低。
视频的视觉的精度也低,所以它整个的可用性就只有百分之二十到三十。所以过去的一年半的时间内,我们通过近百次的迭代,我们把可穿戴式设备的数据的可用性从百分之三十提升到了百分之九十五。它主要是靠什么方向的改进啊?是靠比如说模型结构做一些相应的变化吗?还是靠什么了?啊,都有。首先你得去设计你的可穿戴式的这个设备。
嗯,设备本身的优化啊。嗯,设备本身的优化,对你比方说你拿个五米这样的设备,啊,它虽然简单,但那个设备其实是没法干活的,它只能做做学术上的研究。它的摄像头也很大,夹爪也很大,然后那夹爪只是非常简单的平行夹爪,啊,然后它还只能采手部的动作,它不能采身上动作。就设备本身你要迭代,然后这个数据回来之后,你怎么对数据进行切段、标注、质检,啊,整个的数据的管线。
你也要去做很多很多工作。我们现在都是用AI来做,完了之后你的模型的,因为它数据质量相对比较低,你怎么从这些相对比较低的数据里面学到比较好的模型的效果?你的算法上也要做很多很多的一些创新和改进。嗯,那你们做这件事情的团队就是他们怎么去学会做这个事情了?就哪些相关的经验是可以帮团队去做好这件事情的?客观讲。
我们从自动驾驶招了一些人啊,就他们原来做数据的一些工程化的经验是有用的,但是绝大部分是我们的AI团队和机器人团队一块来踩坑踩出来的。因为这个东西它没有特别多的可参考的经验,因为机器人的数据到底什么是实际性的好数据?这个数据该怎么处理?然后怎么去学?这个过程没有没有什么可参考的经验。这个过程中,整个行业全球整个行业的进展有哪些地方是能帮到你们的吗?
因为其实像 Google、像派、像 Generalist,包括 Aloha 那个团队,后来 Sunday,嗯,很少,因为直到二五年的下半年,呃,八月份 Generalist 发了他的那个 blog。然后 Sunday 是二五年的十一月份正式公开了他们的设计。我们也是在 Sunday 和 Generalist 公布了他们的设计,他们的这个 blog 之后,发现哦,我们做的事情其实很像。
嗯,就相当于他们在公布这个之前,你们也已经做了应该有一年的时间了,差不多。对对,做了一年多的时间了。对对,我我们只是觉得还挺开心的啊。原来也有人跟我们做的事情是一样的,而且做的还是挺不错的。那你们现在的数据配比里面,你们用来做预训练的主要的数据,已经是你们通过可穿戴设备采的真实场景里的真实干活的数据了,是吗?
可穿戴的设备,我们大概从一月份开始慢慢开始往呃开始铺量,所以它有个数据爬坡的一个过程,所以到Q二。可穿戴设备啊,就会有将近十几万小时的数据。到到今年年底,预训练就会变成视频数据加可穿戴式设设备采集数据。我们今年要采一百万小时的可穿戴式设备的数据。那以哪个为主?这个可以透露吗?就最后你们的预训练的数据结构里面。
都要用视频数据和可穿戴式数据都要用,视频要多一些。视频多一些的原因是因为视频还是量更大,然后成本更低,是吗?对,量更大,然后成本更低,同时它能涵盖的很多场景会更多。不过视频数据是不是也有可用性的问题啊?对,所以只用设备不行,所以你要配这种精度特别高的可穿戴式设备。嗯,然后遥操的数据你们就主要做微调。
嗯,对,然后最后再靠强化学习。你说的强化学习,那就是获得一些 roll out 的数据。对,就是让它在真实场景下干活,然后去收那些 failure case。对,就相当于是他自己 self play 获得的一些数据。对对对。呃,你怎么看?就是同样是大家在探索这个去解决数据的瓶颈,你们刚才也提到三 D
generalist 这些公司,然后他们做的事儿可能跟你们是类似的方向,也是类似的,但是他们在整个投资市场造成的这种引领性的心智影响力,要比中国公司强很多。
比如说你说到的这个方法,很多投资人就会跟我说,这是三队开创的,或者这是 Generalist 开创的,觉得中国公司还是在 copy 他们。对这个内部我们也也讨论过,就是因为在中国创业,你很难说你没有一个 demo,或者没有一些技术之外的东西来支撑你,你能搞到钱的。但是美国的资本市场是可以的。如果二四年你给我五亿美金,我啥都不干,我肯定我就直接就开始做。
啊,就是 all in 做这个数据的事儿了。但是在中国,其实如果你没有一些 demo,你没有一些商业化的一些东西,可能你很难持续融资。所以我觉得这也是中美两国在创业文化和资本环境。这个情况下,大家不同的选择。所以你的意思是,千寻成立的第一天就知道数据是最大的瓶颈和卡点,对,这是你们集中要解决的事情。
但同时,你们也有一些精力要去做,就是你刚才说的 demo
和商业化的探索。如果第一天有人给我两亿美金、三亿美金,我就第一天就就奥运搞数据。嗯,你觉得那样你的进度会更快?这个问题,我觉得其实确实是跟中美两国这个融资环境不太一样。就是相信这个事情的投资人很少,客观讲,尤其是二四年。嗯,二四年你告诉投资人说,OK,我要搞具身大模型,我就要搞数据,你别问我商业化,也别问我demo,什么都别看,我就是我们因为有高阳的AI,因为我有我的硬件,你相信我一定会能把它搞出来的。
我觉得没有人投资人会会相信这个事儿。对,包括在今天这个时间节点,我说二六年到二七年。是,或者到二八年会重现大语言模型,二三年到二五年,整个这个这三年的时间,也不是有很多投资人会相信这个事儿,但这个是。大概率会浮现。嗯,我觉得有的人不相信,可能是他们并没有看到,就是你刚刚说的性能要爆发的这个信号。确实,每个人的判断不一样。
对,总体上美国对于AI的投资还是。非常的激进的,所以他们投这种大厂,一投几百亿美金都出去了。对于一个相对民营性的创业公司,先扔个几亿美金,你慢慢去做。你觉得评估一下的话,你们大概花了多少精力和资源放在突破数据瓶颈这件事情上?百分之八十以上。嗯,那讲讲剩下百分之二十,就是你说的一些做一些 demo 或一些商业化的探索,这个是从什么时候开始的?
其实你们现在已经有一些客户了,比如说像宁德时代。对宁德时代,我们是在二五年元旦正式开始来做这个事儿。这里面有一个行业背景,刚才我也提,就是具身赛道的核心是大脑,就是具身大模型。所以我们看具身大模型这个赛道。就是具身这个赛道的逻辑,应该按照大模型逻辑来看。大模型就是分了这么几个阶段嘛,就是预训练阶段,然后呃微调,然后开始做推理,然后现在开始搞 agent,所以。
具身还处在马上开始搞大规模预训练这个阶段,具身模型的整个的能力现在基本上类似于 GPT 二的水平,就是看起来好像有一点点智能了,但是你基于它去做 agent 或者基于它做落地会很痛苦,它的基本能力太弱了。所以站在大模型的角度,我们现在就应该。把所有的精力全都放在基模能力的提升上。我有了 GPT 三点五,我在做差的 GPT,我的后续来的工作量就会小很多。
那所以我们二零二七年,我们百分之九十的精力都会放在基模能力提升上,就是 scaling,scaling 我的预训练。但是为什么我们要要做商业化?这是因为虽然具身的技术的进化是按照大模型的思路来,但是它跟大语言模型有个很大的区别是,大语言模型它没有硬件。大语言模型的技术本身就等于产品,就是我的基本能力提升了之后,我只要增加个对话框,我就是个 chatbot。
但是机器人不一样,机器人模型只是产品的一部分,所以当我去我的模型在快速提升的时候,当它提升三点五的时候,我到底我第一个落地的场景是什么?我要做个电池机器人、汽车机器人、保洁机器人,还是按摩机器人,还是零售机器人?这个的市场的需求,机型的形态,这些东西你要提前去去做商业化的探索。这个不能等到说我三点五之后我再去做,那时候你就晚了。
所以我们要同步在模型快速爬升的时候,我要做一些商业化探索。这是第一个,第二个还有一个很主要原因是,大语言模型里面很少有私有化数据,但是具身行业有具身行业,比方说您的时代工厂的数据,比方说京东中转厂的数据,就有很多这样的数据,你不是谁都可以进去采的。但是你想把机器人用到这些场景里面去,这些数据你一定是需要的。
所以,我们一方借着商业探索,我们要先把这些数据要先踩,要先去占数据的坑。像您的时代这样的客户,他会允许你在他的场景里获得的数据用于反哺你们自己模型的研发吗?基模型还是可以的,因为你如果不去采这个数据,这是个先有鸡先有蛋的问题。一开始大家一定是相当于是数据共享,然后我们训我们的基模。但是当把这个基模训练好之后,您的时代或者这种大的To
B客户,他们再去落地的时候,他们自己采的一些高精度的微调的数据,就是客户自己的了。
嗯,因为你们一方面还在去解决数据的瓶颈,然后还在去推高性能,去追求达到类似于大语言模型 GPT 3.5 的状态,然后一方面已经有客户了,那你们现在客户里面实际上用的那些方案后面是什么技术?现在在现场做的用的也是端到端的
VRA,只是我们选的场景要简单一些,我们选的是电池最后的插拔检测环节。就是用的是整个的端到端的 VLA,但是用的模型因为是我们上一代的模型,所以在做落地的时候还是做了很多后训练和工程化的一些东西。
如果用我们现在最新的模型,整个后训练的工作量会减少很多。你可以描述一下,就之前上代模型后训练和工程化、现场部署大概要花多少人多少时间?如果是现在的模型的话,是一个什么情况?宁德时代,我们从接触到最后验收,我们大概花了十一个月。当然,这十个月里边有很多非模型的东西,因为你要落地,你还要搞一些非模型的东西。
就是基于二五年上半年的模型,大概你要去做宁德这个落地,可能大概需要两到三个月的时间。基于我们现在最新的模型,可能我觉得一个月应该就能搞完。嗯,像宁德这种客户,他当时是在行业里招标的吗?他不是招标,他会把需求发给几乎所有的具身智能公司。但是因为去了之后,宁德会把行业内的所有的具身智能公司拉过来,来去看需求,然后让他做方案,然后去试。
当时是一个什么情景呀?我把高阳拉着,那天高阳大概走了两万多步,高阳戴的安全帽啊,穿的这些安全服,再再把整个这些工厂全都看了一遍。因为你作为技术负责人,一定要了解现场。他一定要掌握两种语言,一个是客户语言,一个是技术语言,所以他一定要到客户现场去。他应该还挺喜欢这种探访的这种机会的,因为他跟我说,他跟你聊,他觉得很有收获的就是你会跟他讲很多产业的事情。
他以前还是更多在学校嘛,然后这些产业上的实际落地的事儿,他觉得以前在学校里一些细节是想不到的,就会让他有很多认知上的收获。这也是我我之前说为什么说高阳是一个纯粹的人,高阳就,他说我会,他就告诉你我会;他说我不会,他就告诉你这个事情,这个我不知道,这个我可能要去查一下,然后这个我可能需要学一下。就是我们很多同事第一次听到高阳说这个我不知道,都是还挺惊讶的。
像灵的时代把这些公司都叫去试这些场景,是他同时会一次只有一个公司去,还是一次会有好几个具身智能公司一起去啊?大家都是分开去的,几乎所有的公司都去了。反正你能听到的,尤其是二四年成立的都去了。其实因为宁德本身是要这些大厂,宁德也好,华为也好,京东也好,这些大厂,它是要拥抱具身智能技术,然后用这些具身智能技术来帮他们解决问题,所以它一定是欢迎新技术的。
啊,当然也也跟这个客户关系有关系啊,他会释放一些需求让大家来选。所以具身落地核心卡点是模型能力。但是,它也跟你原来有没有做过机型落地密切相关。你选的场景如果不适合机型落地,或者你选的场景过小。那你最终你真的在批量交付的时候,你发现,要么它模型虽然能做了,但是卡在硬件上够够不了。要么你虽然模型和硬件都做了,但是一个工厂可能只卖三台机器人,或者说你选这个场景,不光要解决模型和硬件问题,你还要去解决工厂的各个业务部门之间的这个问题。
所以对于场景的选择,依也非常依赖于原来有没有做过这种真正的机器人商业化落地,啊,所以原来因为我做过这个事儿嘛,所以我们选的场景应该是所有的具身智能公司里最适合。第一批落地,你可以讲下当时的情景吗?当然,有的公司从刚聊完就被 passed 了,就是去了之后,他就讲他的技术的优势,客户说你这玩意跟我没关系啊。
啊,你给我讲讲对这个场景是怎么理解的?你们准备用什么方案来搞?就大家聊都聊不到一块去。还有一种是,第一聊了也还行,然后选选场景的时候就选了一个比较小的场景。你之前在落实的时候,应该也做了很多新能源工厂的一些服务。对对,所以原来我们讲千寻是一个真正的全站具身智能公司,但是。很多人理解不了什么叫全栈,反而有时候觉得全栈是一个弱点,说的你没有特点。
但其实我们想表达的是,我们的 AI 能力和机器人和商业化能力其实都强,都是中国顶尖的。但是你还在没有真的把这个流程跑通之前,大家理解不了,因为你只有 AI 硬件和 To B 销售能力都强,你才能把整个流程跑通。任何一点不行,你都跑不通。嗯,那你们选的这个场景它好在哪儿呢?就是你说最后插拔的这个检测,它。
既用到了端到端的模型,我们不需要对现场做非标自动化改造,把人撤下来,机器人放上去就能干活。第二个,他又用到了力控技术,因为插拔需要力控。第三个,整个这个生产的节拍比较慢,就适合在技术早期来做第一步的落地。第四个,因为有前面这三个,这使得机器人可以上真实产线干活,你可以收集强化学习的数据。就可以,他可以把我整个的流程跑通。
这个场景的容错率如何呀?容错率也很高啊,因为你插完,你第一次没插进去,你机器再重新试一次就好了。而且那个插头很大,它也不会把那个插头损坏掉。那如果你去插很小的插头,你可能第一次没插到,你把插头就损坏了。其实当时宁德给我们提供了将近两百个工序,就一个电池从原料最后造出来,大概两百个工序,每一个工序其实。
我们都可以去考虑用机器人,所以我们是从两百工序里选了一个当时的技术可以达到,而且用当时的端到端的模型可以达到,然后节拍也可以达到,容错率相对比较高,然后还能让机器人上真实产线,把我们整个的强化学习这个链路跑通的一个场景。这个其实是需要你有很强的这个场景选择能力。你们做这个场景落地的过程中间有遇到什么波折吗?
怎么解决的?其实大的波折没有特别多吧,因为这是端到端的模型第一次落地,我们也没也没落过,所以其实你你第一个要控制一下客户预期,告诉他这是一个全新的事情,从来没有人做过。然后呢,第二个就是我们的技术人员有段时间是长期在宁德现场,现场写代码,现场现场改模型,现场来做。所以你你真在落地的时候,你要跟客户在一块儿,当然可能到不了吃住在一块儿,但你一定要。
在客户身边,你来做这个落地,这也是原来做落地过程中的一些经验啊!你不能在北京做研发,然后把模型发过去,让现场的F A E来搞这个事,不行,研发要到现场去。你说就是在这些商业化的探索和一些demo上,你们花了只有不到百分之二十的精力。但是听起来他好像也是一个很重的服务过程啊。对,对,你怎么平衡这种客户的一些可能很急的需求?
而灵德时代是出了名的。还是一个比较严格的客户的,然后你自己还有一些长长期研发的目标,怎么平衡这个?对,对于宁德时代,这个我们是有专门的一个宁德小分队的,这个小分队就直接就是全心服务宁德。当然,如果这个小分队需要公司内部支持的时候,公司内部也要第一优先级支持。但是,但总体上,因为我们专门有一个团队来做这个事儿,所以跟这个研发跟落地还是平衡的比较好。
但是为什么需要一个小分队,需要研发的现场才能去落地?因为基模太弱了。我需要,甚至都不能叫微调,甚至可能我得专门采很多这样的数据,来针对这个场景要做很多工程化的工作,这就成本很高。为了减少这种落地的。成本,我们主要优先级要先把基模提升起来。如果我有很好的一个基模,有个 GPT 三点五的基模,加上我的机器人,我再教会客户怎么去采数做微调,我就可以卖标品了。
我就不需要做最后一百米交付了,所以二六年我们跟我们很多产投,你看千寻拿了很多国内这种实业产投。对吧?这个所谓的中国的大厂里边,我们拿的是华为、小米、京东,啊,都是这种有实业的产投。一方面,我们刚才说我们要去搞这些数据;另一方面,我们还要我们这些产投他们都会有自己的具身部门,啊,包括一些有实力的大厂,包括像汇川这样的,他有自己的具身部门,但他没有模型,但他会用,他知道我们可以教给他你怎么去微调我的具身模型,使得可以做你下游的具体的任务。
这样的话,我们将来我们就要卖这个标准的模型加机器人,加数据管理平台这么一个大的平台,然后客户拿到我们这个。集群之后,他自己做微调,自己做落地,就相当于是客户在我们的物理的具身模型上做物理的 agent。嗯,所以百分之九十的精力我们做基模,因为核心是基模。如果你没有一个三点五的基模,你是做不了这个事儿的。
第二个,我们做这种最后一百米交付,我们肯定要先服务好宁德啊,宁德是我们这个现在最重要的客户,我们自己的研发人员上。但是这种方式是不能低成本的复制的。第一,我们的复制是我们要做标品,所以我这轮融资我们又又有好几个比较大的产投进来,哎,我们就希望我们将来提供标准的机器人加模型加数采能力,然后客户在我们上面做机器人的 agent。
接下来,比如说在林德这个场景啊,除了像插拔检测这种场景之外,嗯,你觉得你们新的模型还可以支持哪些场景啊?就这种比较广泛的工业制造企业里面,我们那第一个是电池行业,电池行业有钱,就刚才讲整个落地的节奏应该是先 to b 再 to c。啊,to
B里面我们选择的标准,第一个得是个大市场,第二个这个市场在增长,第三个客户集中度要高,你你你得有大客户,第四个客户的付费意愿要强,第五个最好国内外需求都一样,你在国你在中国打磨产品,在这个卖到国外,所以动力电池是其中一个场景。
第二个,这个物流。第三个酒店和零售,我们会重点盯这几个方向,因为工业生产和商业服务里都已经有一些专机和之前的智能机器人了,就是我们前面聊到过的有一些力控或者三D视觉的这种机器人,然后有些方案可能它的成本都已经磨了很久了,包括它各方面的性能啊、节拍、负载、精度等等。那现在就是新的这些具身智能的机器人进入到这些大的场景里面,你觉得比较好的具体的切入点是什么呀?
就是和之前的方案相比有竞争力的具身智能,其实做的不是要替代他们,是做他们干不了的事儿。你比方说零售里面,零售里面或者零售的取物,从货架上取东西,原来靠自动化的话,你那个货架上要摆的非常非常整齐,空中间的间隙很大,然后它要靠一个什么行架机械手,靠个专机一个个去拿,它就只能取和放。然后,因因为它放的位置很固定,然后间隔很大,就使得整个货架的利用率很低,然后取放的效率也很低,然后这个东西它还不能做盘点。
嗯,哎,那用自动售货机这种方案了?自动售货机不是也能取货吗?自动售货机卖的东西太少了,比方说便利蜂或者七幺幺,他那个人在干啥?那个人就在盘货、补货、打扫卫生,在干这个事儿。智能生活机是个固定的。总结下的话,这种以前的机器人干不了的事儿,它的特点是什么?就是需要泛化。你比方说,酒店的清洁,酒店的清洁机器人去洗手间去擦一擦洗手的池,去把毛巾给收起来,或者毛巾洗好了把毛巾给叠起来,就是原来机器人没有这个能力。
它没有这个泛化能力,所有需要对场景和动作泛化的,就是巨神都可以干。我们的原来的专机其实是对场景和动作没有泛化。现在其实有很多新的公司,它是直接瞄准家庭服务这个场景的。你们怎么看这种选择呀?因为听起来,在你们的计划里,这个是可能要比较后才会比较成熟的一个场景。最大的市场肯定是家庭市场,但是我觉得对于一个产品来讲,落地是要讲各个因素的匹配。
我觉得首先模型能达到在家庭环境干活这个事儿,很快就可以达到。我觉得二七年就可以在家庭去洗衣服,简单的打扫卫生,去把儿童房收拾一下,去浇浇水,把这鞋给我摆好。技术上是可以达到的,但是你卖到家庭的时候,你还要考虑隐私安全这些东西。我觉得短时间可能很难达到。举个最简单的例子,比方说现在机器人它都很重,几十公斤。
这个机器人万一倒了,把一个小朋友或者老人给砸倒了,这就一个很很大的一个问题。比方说机器人现在一般配的大概都是电池的容量是我们电动自行车的三倍左右,电动自行车的电池都不让进到家里,你现在搞这么大个电池放到家里。对吧?你至少得等到固态电池相对靠谱一点才有可能,或者你只能放个很小的电池,但就就拖着个线天天充电。
我觉得制约进到家庭里很重要一个点是安全问题,其他问题我还是相对乐观,包括模型到底能干啥,包括价格,包括隐私,我觉得这都是好说的。我觉得进入家庭最主要的一个点是安全问题。在没有解解决好安全问题之前,可能进入到家庭还是比较难。嗯,安全问题的提升,它是需要软件和硬件都要提升的,对吧?对。嗯,而且你刚刚说的,像电池,像这个机器人的负载重量等等,这些可能还有很多是硬件工程机械上的问题。
是的,是的。所以具身的落地,既要考虑软件的卡点,又要考虑硬件的卡点。你要综合来考虑,那这个时间大概能预测吗?因为有一些公司,比如说你二六年成立或者二五年底成立,你做家庭这个市场,就把自己的第一个场景定位为家庭这个场这个场景啊。如果有一些硬件上的卡点迟迟解决不了的话,那这个落地的时间岂不是会被拉得很长?
对我刚才说的是一个类似于通用机器人的机会,相对要比较远。但其实我觉得家庭,尤其是欧美的家庭,其实有很多专用机器人。就比方说,曾经有一个朋友给我提,就叠衣服机器人。就是很多欧美他自己住这个house,他地下室放了洗衣机烘和烘干机,你可能就做一个很便宜的一个GCB,它的作用就是。把衣服从洗衣机里拿出来放到烘干机里,然后烘完之后,他再拿出来给叠好。
这个东西如果卖的相对比较便宜,可能很多人就把它当成一个就是个洗衣服机器人,它也不需要很大电池,可能插电就行。但是现在技术是可以做到的。我觉得这种用上大模型技术,但是解决一两个问题或者少数几个问题这种有泛化能力的专用机器人,我觉得也是一个可能是第一批家庭落地的场景。对,因为它可能在续航,包括它在它活动的这个区域上,它和你说的那种最通用的机器人相比是有区别的,对吧?
我可能不需要它能自己续航很久,它也可以不用跑到人很多的地方。你像Sandy他们做的其实就是一个通用的机器人,对吧?它有一个底盘儿、升降、双臂、这个双手。啊,但是它就很很面临很多安全的问题。但是如果你把它搞得很小,类似于阿罗哈这样的一个机械臂很小,然后再把它小型化,可能就挂在洗衣机边上,可能卖个一千美金,可能有人就会买。
你们给自己的二六年的目标是怎么设计的呀?你刚才已经说了其中一部分肯定是继续把基模做好,除了这个之外还有了。最主要的目标是因为二六年是模型性能爆发的元年,那我们给自己定的目标是一百万小时的数据。这一百万小时虽然是用可穿戴设备采的,但它的数据的有效性是遥操作的百分之九十到九十五,所以。所以这是个什么量级的数据呢?
你像派和千寻,我们过去发的最好的开源模型,只用了一万小时的要操作数据训练的,这是大概采了两年采的。所以二六年我们要用一百倍的数据,我们会得到一百倍的数据,所以整个模型性能会有一个非常大幅的提升。所以整个公司主要的精力是放在了一一百万小时的数据,以及围绕着一百小时的数据模型整个的迭代和进化上,对工作上。
啊,当然还有百分之十的,还有一部分精力,少部分精力放在跟我们这些产投,啊,我们去帮助我们产投来建立如何用具身模型,用具身机器人。去在他们的场景里面落地的这个能力,我们提供基模和机器人,让他们来用。那这一块你们有什么量化的目标吗?呃,二六年我们整个这个方向的营收大概我们规划了一个亿,其他的有一些像低质量的,像一些蔬菜工厂啥的这种,因为不可持续,所以而且对于我们整个模型能力爬坡没有没有帮助,所以这些我们都很清醒的放弃了。
我觉得在同估值规模,因为你们现在估值也超过一百亿了,嗯,的公司里面,你们对营收的规划非常克制。有的公司的营收已经做的很大了,嗯。对,因为这里边几个原因,第一个,大模型的营收,所有成功公司的营收,它都是一一开始很少,但是一旦突破那个涌现那个点,它营收会会暴涨,就是都是一个很陡峭的一个曲线。巨深也一样,就是巨深你的基模如果到不了三点五或者三点零。
你干任何一个事情都要大量的后训练、大量的微调的工作,你的机器人不可能放凉的。但是我们把机器人的大脑做到三点五或者四,你把一个机器人放到任何一个新环境,它自己zero shot它可以实现百分之七八十的成功率,然后你再随便教教它,它可以到很高的成功率。这个机型就可以快速放量,所以这是第一个,这是行业的一个特点。
第二个,其实客观讲,我们说现在现在具身行业很乱,乱的点是大家都在讲落地,但实际上你想,就落地就两种,一种是基于原来传统自动化。传统AI来落地,一种是基于巨深模型落地。我们刚才讲,巨深模型现在还在GPT二,不可能批量落地的。所以,要么他们在用传统方式在落地,要么就是签了个签了个大的订单,其实并没有落地。
啊,或者还有一部分人在卖唱歌跳舞,当然唱歌跳舞它其实也是个细分市场啊,只是我们没有去做那部分市场,所以具身。这个行业内还有很多投资人在说,OK,二六年是具身落地什么生死之年啊!如果二六年落不了地,这个行业就没了。我们是非常不认同这个观点啊,因为具身的核心还是模型,二六年具模型才是爆发的元年,所以具身真的大规模落地应该在二七年下半年到二八年。
所以你认为就是二六年的行业主题其实是数据量达到一定量级、模型性能的突破,而不是落地和收入的竞争。对。不是落地,你觉得你的这个思路在现在的融资竞争环境下,包括在中国这个特殊的创业环境之中,它能保持多久啊?我觉得二六年肯定会保持,因为这个本质上是社会或者行业要看到变化。就你讲今年是模型性能爆发之年,那你应该是阶段性的发布几版模型,大家都能看到这个模型性能的提升,或者能看到更清晰的
scaling law 这个曲线画的越来越好。
对,就大家只要能看到变化,都都不会影响大家的信心。其实你可以看美国的具身公司。除了 Nvidia,其他其实都在用真实数据,而且大家有有了 Sunday 和 Generics 之后,大家也都归纳到了。这个可穿戴的设备,所以美国那边其实我觉得它的模型也会进化的非常非常快,所以只要大家能看到变化,能看到进展,我觉得大家的信心会一直持续。
我觉得至少二六年肯定是没有问题的,所以二六年是就类似于二三年,二六年如果你上不了牌桌,我觉得就没戏了。这也是为什么新出来的这几家为什么一开始融钱很多,因为你不融这点钱你上不了牌桌。嗯,那你觉得之后可能会遇到什么变化了?就是你刚设想的这个发展曲线,就我前面可能在研发阶段,我实际的收入是比较少的,然后后面会有一个快速的放量。
就这个东西,它可能会遇到的一些阻力和干扰是什么?这个问题我们内部讨论很多次,我觉得没有什么太大的阻力。你只要是模型在快速爆发,因为相对来讲,我们的硬件已经相对比较成熟了。客户有需求,硬件相对成熟,供应链成熟,公司有钱,就卡在模型上。而且模型我们用弱的模型已经可以落地了,所以我们的卡点就一个,就把基本能力往上提。
而这个基本能力提升的速度,我们看到还是比较乐观的。你们内部讨论这个问题很多次的背景是什么呀?因为我们经常会讨论,我们会怎么失败。可以讲讲你们可能会怎么示范?你们怎么讨论的?就是脑暴嘛,大家用脑暴,包括有可能啊,接入线,就是对于科技型创业公司很重要一点,可能接入路线偏了。技术线偏了,可能就直接就挂掉了;,也可能技术进展不及我们预期。
我们觉得二六年、二七年应该到 G P T 三三点五,但是其实到不了,或者落地有可能不及预期。就是我们经常会周期性的来讨论这件事,包括大厂去下场,他下场比我们早,我们怎么办?嗯,所以你们的结论了?我们结论是二六和二七年模型能力一定会快速的去爆发。然后二六年我们要做到具身大脑这个行业的绝对的头部。我们给自己内部定的目标是全球 top 三啊,我们也不说全中国第一,就是全球 top 三。
对一百万小时的数据,全球 top top 三的模型能力,然后公司的身位融资都要在中国的头部。所以对我们来讲,其实我们觉得没什么太大卡点。如果模型到了三点五,我们选的第一类的。落地场景,你刚才讲,你得需要泛化。还有一个角度来来判断这个事,就是用原来的传统的机器人和上一代的AI技术,能完成百分之九十。但就卡在最后百分之十上,你需要用用大模型的泛化能力来解决。
就比方说这个就叠衣服,叠衣服原来机械臂和那个夹爪这都很成熟,包括视觉都很成熟,对吧?你给它个坐标,让它去夹个衣服,它都能夹起来,但它就是不知道这个衣服什么叫褶皱,什么叫铺平,它并不知道。大模型其实是只解决了一个事儿,就是告诉他这衣服是平的还是皱的。这是这是衣服角,这是衣服袖子,包括我们在插拔的过程中,原来你要做这个插拔,你得有有工装卡具去固定好电池,固定好插头,然后用这个写死的程序到固定的位置去拿。
所有这些机械臂、这些夹爪、这些摄像头也都是成熟的,只有一个点。就是用AI来解决,就是这个位置,如果位置变化了,我的AI能不能就是根据位置变化来实时的调整我的动作?这个事儿是用大模型解决的。所以,我们对于落地也非常乐观。只要大模型技术到了三点五,落地也会非常非常快。嗯,按照你现在的判断和假设,就是二六年会是一个模型能力竞争,然后分出谁真的在模型性能上上牌桌的阶段。
你觉得能上牌桌的公司应该具备什么特点啊?就他现在应该已经做到了什么,才比较有可能上牌桌?第一个肯定要有很强的AI的背景。因为大家二六年是大脑之争,所以你肯定要有很强的AI的背景。不管这个AI背景是来源于你成立的早,过去两年你你你积攒了很多。还是有些最近融到钱的,原来自动驾驶背景的,有这种东物态背景的,对吧?
你有很强的 AI 背景。第二个估值得得上个台阶儿,如果你现在估值还是十亿、二十亿人民币,估计选对你账上的钱足够多。第三个,在中国,大家虽然应该是所有经历都要爬梯摩,但在中国你还是要有商业化的计划和落地和基础,所以你还得有很强大的创投以及商业化的能力。嗯,已经积攒的数据量是个指标吗?是一个指标,数据收集的加速度更重要。
这个加速度来源于过去的一两年,你有没有在数采设备、数据管理平台、整个模型训练的 pipeline 管线的效率迭代,以及相应的数据算法上有没有积累?因为这个决定了你的采采收速度有多快。你觉得二五年下半年才成立的公司有机会吗?就时间相对比较短的。如果他拿了很多钱是可以的,就至少你拿上一两亿美金吧,对吧?
如果拿了很多钱,可以在时间上去解决,就是数据积累的这个问题吗?也就是有很多No号,实际上我们踩了一年半的坑,他可能比方他们只要踩七八个月,因为很多坑我们替他踩过了。但是仍然大家可能会有几个月的差距,但这几个月差距就像我刚才说的,就是就像自动驾驶还有好多,中国有好多家大模型,中国还有六小虎,对吧?它一定会有很多家出来。
那在不同的阶段,模型有个两三个月的差距,可能很多人看不出来,因为市场上钱也很多,创业公司也很多,所以具身再到大脑也会出现出来好几家。所以不可能只有千寻一家啊?你觉得二六年能继续上牌桌的公司会有多少?你觉得谁是有潜力的?不过反倒觉得可能二五年出来的这些把大的做成的概率会更高一些啊,因为没有历史包袱嘛,他就可以就是聚焦到这儿来做。
那你们自己不也是二四年成立的吗?对,但是二四年我们第一天我们就在就在一直聚焦主航道。我们面对很多竞争对手,他们到了之后都说:“哎,千寻,为什么千寻你们这么淡定?就是我们被谁谁卷的不要不要了,我们我们做商业化卷的不要不要。”我说。原因很简单啊,因为在你解决卡点之前,你要聚焦;在你解决卡点之后,你要看速度。
所以二四年、二五年,其实我们都在一直在解决卡点,你还没有到焦虑的时候。然后到现在,我们为啥说那天见雷总的时候,雷总问高阳说:“你你觉得你的技术在国内领先多久?”高阳说:“六个月吧。”啊,那为啥领先是六个月?就是过去两年我们一直在聚焦解决这些很核心的卡点的问题。嗯,你们见雷军是因为小米投资,所以最后见了一下。
对对对,顺为顺为投资,你们现在就是获得的一些产投方的投资,这些产投方自己也在做具身智能,就包括比如说和顺为相关的小米,包括林德自己可能也在做一些具身相关的探索。你怎么看?就是大公司进来之后对你们的影响?我觉得像华为、小米这样就软硬都做的企业。他们有更大可能会把具身给做得更好。对,理想也最近在内部全员会上说,理想也是会做具身智能的,一定会做人形机器人。
对,但是大厂只要不像特斯拉一样把它当成战略在做。这些其实对他们来讲是工作,对我们来讲,对创业公司来讲,这是我们的命。你们觉得什么时候会遭遇就中国的大公司里把这个事情当做一个非常重要的战略这一类公司和你们的直接竞争?我觉得二八年之后,二八二九年,二八二九年。如果二六年就模型性能的大突破的话,我觉得像理想这些公司,它很很有可能二六年就会投更多资源来做这件事情。
为什么是二八二九年了?这是一个企业基因和选择的问题,所以这些是个很小的市场。哪怕模型开始爬坡,对他来讲,因为你还没有商业化变现,还没有开始大规模商业化,大厂不会放太多精力的。你觉得那个时候对大厂来说其实不晚,是吗?不晚,大厂一定是要是等那时候,然后开始砸海量的资源来做这个事儿。所以我们在内部一直经常讲,速度是我们唯一的优势。
我们一定要在大厂下沉之前,把自己变成中厂。相比一些跟你们同期成立的公司,你们在商业化上是比较淡定的。你始终想等到基模性能突破的这个时间点之后,再去做更多落地的拓展。这种淡定跟你之前第一次创业的一些经验或者说教训有关系吗?有的,因为原来第一次创业的时候,其实做了很多这种很着急,像无头苍蝇一样到处乱搞,最后浪费很多钱。
但其实没什么效果的事情。高阳说:“你经常在公司里自黑的时候会提到你们以前做的魔刀工作站的那个例子。”对,我我们最开始采访二零年的时候,其实我们也是在聊这个事情。我觉得那还是一个很厉害的东西啊。对,它是个技术上很厉害的东西。他用上一代的 AI 加力控加视觉,然后做自动化的轨迹生成,其实是是上一代的,我觉得机器人加 AI 技术结合的巅峰,就是做磨刀做到了全球最好。
当时是最早是京瓷,就是稻盛和夫搞的日本的京瓷集团,京瓷有一种刀叫陶瓷刀。啊,陶瓷刀就是不生锈,也不会有异味儿,所以那个刀相对比较贵,在市场上卖的也还可以。但是陶瓷刀很硬,陶瓷很很硬很脆,所以要想磨这个刀,你得用金刚石的磨盘,不能用普通的磨盘。啊,这两种很硬的、很脆的东西往上一块儿一碰,如果你的力控力控制做得不好,它就会崩掉。
啊,所以当时京瓷说啊,我能不能用机器人技术来做这个事儿?那你想干这个事儿,你的力控制要做得特别好,然后你在磨的过程中,每把刀都不一样,你要去磨到零点五毫米的精度,你要有需要很精确的视觉、力觉和轨迹规划。所以那时候京瓷最开始找的三菱,三菱机器人给他搞完之后卖他很贵,几百万一套。然后模的效果还不太好,还不如人。
后来京瓷就找到了我们,因为我们那时候宣传我们的力控。然后我们一看啊,这个东西好,又有AI,又有力控,又有轨迹规划啊,这个能很好的来来提升我们技术水平,展现我们技术水平。所以我们就接下来了,我们大概也做了一年多,超过了三菱,然后模的也还不错,做到了世界第一。但是全球一共只有八台的需求,就是,相当于我们搞了个屠龙绝技啊!
但是市场空间只有八台,一台一百万,也只有八百万人币,所以它是个很小的市场空间,很小。所以在选整个的市场的时候,你一定要去选大市场。所以刚才我我我在讲我们选市场细分的时候,都是选择大市场,包括我们的产投,你可以看到这些产投为什么能做到中国在中国的硬科技里销售额这么大?他们选的都是大市场,都是电池、手机、汽车、通信,都是大市场。
对,这是一个经验啊。而且我因为为什么你刚才讲这个,我会想到这个案例,是因为我觉得它是一个利用当时的技术,你把一个事儿打磨到一个极致了。对,但是可能你如果有了新的技术,它就能更简单的解决啊。对,是的。所以为什么这就是说,在现在你去做落地,有点像当年去做磨刀。就是因为技术还没有突破到一个比较好的点,你可能需要大量的工程、工程化的这个工作,而这个工作是没法 scaling 的。
我们刚才讲大模型的核心的点是 scaling,我们一方面 scaling 数据、scaling 参数、scaling 算力这些东西完了之后,其实商业化你也要考虑是不是可以 scaling。为什么 DeepSeek 为什么 ChatGPT 可以很快的去去获得一个亿的客户?为什么当年智能手机的增长速度也也非常非常快?
因为他们都是个标品,标品是可以 scaling 的。如果你是面向不同行业定制的不同的东西,你没法 scaling。所以,我们将来做商业化的时候,尽量去卖标品。标品是可以四K零的。前面也提到,第一次创业或者说当时那一批创业都是很苦的。可以讲讲当时遇到哪些问题、挫折,你们是怎么解决的吗?对现在的影响是什么?
实话说,我觉得没有什么经历过特别大的挫折,或者至少在我看来,不是什么巨大的挫折。就是我是一个很乐观,然后对于我感觉我能hold得住的事情,很自信的。你们当时在落实的时候是亏损的状态啊,包括到他后面的发展,其实跟你们最开始创业的时候预期肯定也不太一样嘛。这些时候你没有受挫的感觉吗?有受挫,但是仍然充满斗志。
嗯,这跟你不是 CEO 有关系吗?所以你的压力没有那么大。我觉得也没有,因为现在我是 CEO 嘛,整个千寻在发展过程中肯定也不能说完全的这个一帆风顺。啊,包括宁德时代,我们做了一年,那做到七八个月的时候,压力也也挺大的。那你说你你们都做了做了这么长时间,为啥还没落地呢?在宁德宣发之前,对吧?包括我们说我们很少做demo,我们要得把模型做到不错,让大家知道千寻模型好。
那在打榜之前,大家也会质疑说,那你你们那个模型怎么进展这么慢啊?那你因为你你你没有模型,你没有商业化进展,你融资肯定投资人会问你,哎,你你们怎怎么最近好像也不融资呢?怎么?那这个时候,再如果换成别人,可能会觉得,哇,这公司现在感觉很差啊!哎,我觉得倒也还好,因为本质上,相当于内心里对这个情况是有内心是有把控力的。
我觉得你说这个情况不是真正的危机,嗯,因为是外界他没有看到你们的进展,但是你自己是心里有这个进度表的,啊,对,原来在落实的时候有三次差点倒闭,倒也还好,倒闭了就就大不了从头再来呗。落实差点三次倒闭,主要是因为什么原因了?就是因为决策失误导致资金链没有规划好,然后盲目扩张、盲目堆库存啊,就导致。呃,资金链差点断了,只能裁员。
然后,呃,当时包括我们去跟投资人借钱,签这个无限连带,包括找政府要钱,包括跟朋友借钱。我主要想听你描述一下你自己怎么度过这个危机的。但在这种情况下,你自己是背了债务的。对你当时什么心情了?实话说,没有什么心情,因为觉得你既然事情已经做到这儿了,你作为公司的联创,公司做成这样,然后公司就是需要这笔钱才有可能挺过去,那你只能往前冲。
你背了多少债?我们当时三个人背一千多万嘛,啊,但是那时候一个月只拿八千块钱,其实一这大几百万也是不少钱哦。那是创业到哪一年啊?一七年,就是创业的第二年、第三年的样子,对对。这件事情你告诉家人了吗?告诉了,家人还挺家,就是家里还挺支持的。嗯,那还挺难得的,没有在家里受到嫌弃和埋怨啊。对对对对,你当时是因为你心里觉得这些事情是可以解决的,是吗?
你你没有担心说陷入到比如说个人可能要还几百万的债务的这种境地?我我实话说,当时也没有觉得能解决,但是当时你只能想办法去解决。嗯,那你后来你们这一次危机是怎么挺过来了?就第一次落实差点挂掉,是一五年成立的,一六年一五年成立的时候拿三百多万,其实就只做软件,但是后来我们不是说只做软件不行,做整机,做整机三百多万就不够了,所以那是对于到底你做一个事需要花多少钱这个预算不了解,所以到一六年就差点挂,差点挂呢,后来这个CEO去找他的亲戚借了点钱,因为那时候公司人也少,就就九个人借了点钱度过了两个月。
然后到一六年又拿了一笔钱,一六年拿拿这一笔钱,然后到一七年的时候,一七年是融资的大年,所以那时候资本市场还凑合。然后我们就聊了一个很不错的一个投资人,这投资人拍着胸脯说没问题,你们这是六千万,我都投。然后这投资人也算当时还是挺有知名度的。结果我们就把所有的其他投资人全都拒掉,就只等着这个投资人。结果这投资人最后一刻说,我只投三千万,另外三千万是可转债。
然后还压估值啊,签约要签很多坑爹的协议,所以当时你没办法,因为你把所有的这其他投资人都拒掉了。所以那时候你也不可能拿他的钱,所有投资人也都拒掉了,所以只能先借钱。所以那时候就学到说,OK,你融资的过程中,在没有签完字、最终可融资之前,不要拒拒绝任何一个投资人,你要给自己留后路。所以那是一七年,然后一八年拿了顺位一点六个亿,然后就成立了四个事业部。
到处就是招人,然后人员短时间内翻了将近个三番,然后一年多把中的钱就基本上花完了,然后到一九年底发现账上只够四个月的钱了,才发现哦只剩这么点钱了,就赶紧裁员。所以一九年底从三百人裁到了一百四五十人,裁了一半,然后全员降薪。那时候一九年我们在公司一个月拿三万块钱。然后到裁完员之后全员降薪,我们三个连创就一人拿一万五,拿一万五税后到手就一万一千块钱,一万块钱。
那时候换学区房,换了个学区房,一个月还房贷还四万,所以那年冬天就过得很苦啊!那年冬天特别冷,那时候去买了三千块钱羽绒服,也舍不得。然后就找别人借钱,因为你你公司不够啊,公司不够还房贷,然后把首付也全给搭了。然后那时候有一个落实的一个朋友说你我教你怎么借钱,你你给每个人只借五万,五万说多呢也不多,别人不好意思不借你;说少也不少,你你找十个人借,你能借五十万,够你还一年房贷。
我说你这是好方法啊,我说你先借我五万,所以当时找了很多人借钱。当然,后面也因为有疫情,也算因祸得福。如果没有那个裁员,二零年落是肯定没了。所以其实因为叫企业战略决策不清楚,因为不会融资,因为不知道怎么有序扩张。其实都都因为这个事情差点挂掉,所以这些事情现在想起来,可能有点后怕。但是其实当时没有什么感觉,说OK这事儿是不是很难?
当时就想着怎么解决问题。你这个过程中间有特别焦虑的时候,有失眠的时候吗?没有,人家说不要为。这个八公里外和两小时之后的事情淡些。你现在看一些就是跟你在目前这一批一起创业的很多人,可能是第一次创业,他们可能也很年轻,有很多都是九零后。嗯,你看到这些更年轻的创始人的时候,有时候你会看到一些什么曾经你自己犯过错的那种影子吗?
又或者是反过来啊,有可能人家第一次创业也做得非常好啊。对对对,肯定,因为现在这些小朋友越来越聪明。嗯,其实我我我看到他们更多是看到了一六一七年的我,就是我我有很多活动,我会看到这些公司创始人,尤其是技术背景出身的创始人去讲他们BP,讲他们公司的这些PPT。啊,我我当时我跟高阳、跟跟郑总、跟还有很多人我都说过,我说我看到了十年前的我,就是对自己的技术很很自信,对于行业的判断,从什么地方?
从他们的哪些表达或者表现上看到?就是表达方式,眼里的那个自信,这个感觉很明显,就是自己的手头有很好的技术,然后对这个赛道又比较相信,公司发展也还可以,就是还没有被社会毒打过,但是又又相对还做的还可以,还没有被社会毒打过,充满了美好的想象,一种比较纯粹的天真的自信。这个美好的想象中间哪些部分你觉得是不切实际的想象?
你听到哪些行业里经常呃被很多人表达的一些事儿,其你就你你觉得从落地从商业的角度,或者说从经营一个公司的这种角度,可能是很难实现。我觉得可能很难说一个具体的事儿,但他们都有一个同样一个特点,就是非常笃定的来使用一个论据或者一个说法,或者非常笃定的从只从单一角度来看的一个事儿。但其实你想做好一个事儿啊,这个比方说数据数据来源的问题,对吧?
商业化路径选择的问题。你怎么去搭建团队的团队的问题,就是每一个事儿其实都是个多角度的,根据实际情况是具体情况具体分析。一般第一次创业经历了什么之后,可能在这一点上就会有改变了呀。见过客户之后,见过客户,等客户跟你要你我付了钱东西在哪之后,一定会改变。嗯,你曾经被客户骂的最狠的一次,因为什么事情?对方怎么说的?
你还记得吗?制造业领域的客户应该都挺直接的。对,嗯,当时说我们的机器人是垃圾啊,让我们赶紧拉回去。还好,感觉没有很多。你这个肯定是委婉包装了一下,的估计原话要比这狠。对对对,因为你一旦进去拉到客户现场,你是耽误他的他的事儿。对,因为有一段时间公司的售后也也在我这儿,售后其实被骂的最多的。嗯,说在落实的时候,对销售呢,他卖给客户东西的时候,客户是买东西,人们花钱的时候一般心情都很好,但是售后去的时候都是出问题的时候,都是客户心情不好的时候,所以所以那时候确实挨过很多客户很多骂啊,但是本质上你你要理解这事儿,跟你客户骂你是你东西没有达客户期望,所以那个时候就为什么要做要做好产品,要追求卓越,其实还是很早就被客户教育过。
所以你这次希望就是真的这个技术上有大的变化之后,能真的让客户满意。对。嗯,就是现在有一种观点啊,就是说这个做具身的人,他有两种背景嘛,一个就是像你这种跟机械跟 robotics 比较相关的,还有一个就是像高阳这种偏 AI 背景的,觉得这是两种思维方式。你自己会怎么看这个划分啊?它确实是两种思维方式,一种是基于传统、基于规则、基于建模。
这种思维方式,一种是AI的data追问的这种方式,确实是是两种思维方式,而且这两种思维方式的转变,包括我从原来传统的这个方式往AI方向转,是二四年于我个人来讲一个最大的转变。就是原来看具身行业,虽然是我当时知道要找个全球顶尖的AI的合伙人,但是在做很多决策的时候,还是受到了很多原来机器人行业的认知上的一些影响。
啊,到二四年下半年才慢慢认识到,哦,具身智能还是AI赛道,我们要以AI的视角来看这个赛道。呃,比如了,之前是受了哪些传统视角的影响?后来怎么变化的?比方说,具身智能就是大模型跟小脑之间的分界线到底在哪?就是原来我的运动学、逆解、动力学啥的做的这么好,我是不是要尽量多用一用,而不是用AI来学?包括对于数据的重视程度,这也是呃我从高阳身上学的啊,就是对数据的重要程度,其实二四年的上半年还没没有那么看重,觉得数据这盘有这么重要吗?
有很多东西,你只要大模型像Chat GPT给输出一些指令。然后剩下的让小脑靠原来的运动控制来做不就行了?但是慢慢你发现数据的重要性是最重要的,而通过端端端的方式,AI可以学到很多小脑本来小脑干的活。嗯,所以你本来的想法是你觉得以前的方法把小脑做的事儿已经做得很好了,我们应该用起来。但你慢慢的转变就是觉得这些事儿也可以交给深度学习网络去做一个端到端的系统去做。
对对。所以你们现在会把这个大脑和小脑的界限分在哪儿啊?就分到最简单的叫运动的下一个点往哪走,这个小脑就是做最基础的运动学和动力学,其他都不管了,它就有点像。电动汽车那个电控,它就做最基本的运动控制,所有上层的空间理解、轨迹规划都是AI来做的。在这个思维转变的过程中间,就是你刚刚说,可能二四年上半年还没有那么重视数据,后来越来越重视数据,中间有发生什么具体的事情吗?
比如说你们有什么分歧,然后是后来怎么解决,谁说服了谁?当时我们二四年五月份不是开始搞可穿戴式设备吗?可穿戴式设备那个时候数据质量很低。然后我们就想把数据质量提上来之后,再做很多可穿戴设备在采数。然后同时遥操作呢,因为我做硬件的,我我自己做了这么多年机器人,我说我们自己也也得做机器人。所以到二四年下半年的时候,可穿戴式设备正在研发。
自己的机器人也在研发,这就导致我们没有机器人可以采数,没有机器人采数,高阳就没法去模型。我们当时只有一台机器人采数,高阳说:“那这不行啊,我们要不去买点阿罗哈啊,去买点方舟无限的这个币?”我说:“我做机器人的,我还买别人的机器人。”然后就因为这个事耽误了有一个多月吧。然后后来高阳说不行,我们这样虽然这部分数据有可能会被浪费,因为采集数据跟我们机器人它的构型不一样嘛,但是我们模型得迭代,所以那时候买买机型也花了小两百万,我们那时候也没那么多钱啊。
高阳说不行,必须得买,所以后来就买了一些方舟无限的币来做模型迭代。呃,所以你本来的想法是你想等你们开发出你们要用的那个同构的币之后再去采这个数据,但是高阳觉得应该更早开始。更早开始搞数据,就是对你整个数据的要跟我们自己的机型要要解耦啊。那时候我们觉得我做的机型最好的,我不想买别人的。他跟我说不行,我们要搞数据,赶紧搞数据,赶紧买别人的。
后来还是买了别人的。嗯,哎,你们还挺有默契的,因为我昨天也问了他这个问题,他说的也是这个例子。对,因为当时讨论了好好多次,然后这也是创业过程中相互学习的地方。呃,后面你们关于就是类似的事情,你们会来商量的,就是一些共识是什么呢?比如说要做一些这种研发投入的时候,怎么去算这个 ROI 了?怎么去算我要不要投这个钱了?
后面的共识是,只要在我们主航道上,就在主线任务上,就是能提升模型性能的,我们。都是坚决的投的,而且这里面会更多的去依赖于高阳的判断。因为后来慢慢就发现,其实他们都说我是机器人行业老炮儿,我说高阳也是AI行业行业老炮儿啊。高阳从一四年去美国读书,也一直在搞AI,他也搞了十几年了。很多时候,其实我们对未来的判断,其实也是依赖于直觉。
就是我们并没有可能没没有百分之百的把握,或者说非常 solid 的证据说这个事儿一定会发生,我们这么做一定能成。很多时候其实依赖于直觉,就这个直觉依赖于过去你做了很长时间十几年这些事儿,所以你的直觉判断肯定会比别人要更好。所以咱现在在涉及到公司这个模型啊、AI 啊,还有一些大的计划的时候,我们更多去依赖于高阳的一些直觉、高阳的一些判断。
你刚才提到你是机器人行业的老炮,然后高阳也是 AI 的老炮,也做了十几年,你们都有各自的直觉。当面对一个新的共同的问题的时候,直觉有的时候可能是打架的,包括直觉它会给你带来一些正向的经验,可能也会给你带来一些负向的经验。你怎么避免直觉带来的一些可能是错误的判断?怎么去纠错呀?我觉得第一个。可能没有办法完全避免,这一定会会会会会会存在这种情况。
第二个纠错其实也很简单,就是我刚才一直讲千寻的价值观很好,我们讲信任的文化。其实纠错就是你要不自己发现自己错了,要么就是别人给你说你错了,你能接受。就是自己发现自己错了这个事儿还是比较难的,但是更容易做到的,而且更常见的是别人发现你错了,告诉你你能接受。所以,我们为啥一直强调信任,强调信任?就是如果你你你相信别人给你提这个意见,跟你说你错了这个事儿,是为了公司好,是为了你好,就是其实这个纠错就会变得比较简单。
所以在千寻纠错其实还是比较简单的啊。因为你之前创过一次业,所以当这一次来创业,包括也集结了新的合伙人之后,你们当时想建立一个什么样的组织?就是刚才说的这个信任和和追求卓越。因为在这样一个大的时代机遇面前,我们是说不是想做一个伟大的公司的?就是一个人,不管你做什么事儿,你哪怕去开个煎饼果子摊儿,你去开个咖啡馆,你去搞个具身智能创业,你是干啥?
任何一个事情从零到一把它做到很好都很难,所以你不不如做点大的事情。所以我们一开始就想做个大事。那你想做大事的这个原点来自什么了?原点我觉得这个说的可能有点虚,但是我觉得就是人生的意义吧。我想去做这些很厉害的事儿,这些人一块儿把一件很厉害事儿干成,这个对我来讲是有吸引力的。去挣点钱,去什么活动上领个奖啊,这个东西我觉得都没有太大的意思。
对吧?所以原来科幻讲没这个机会,我们原来搞工业机器人哪有这个机会?你搞工业机器人搞到最好,也就是一个很垂类的一个小行业的一点儿事儿,你也没有办法改变世界,你甚至连行业你都改变不了。但是 AI 这个赛道,我们是有可能改变世界。具身赛道过去的,嗯,疫情之前,我们做的所有硬科技,我们都在追美国,我们都是说,我我比美国差多少?
我比美国差多少?我比欧洲差多少?我比日本差多少?具身智能基本上是。第一个中美同时起步的,而且中国在人才、在素材、在场景、在成本上,这些系统化的优势比美国还要好。我觉得这是个大的时代机遇,中国一定会有会有几家优秀的具身智能公司成成长为全球顶级的具身智能公司。那今天非常感谢做客晚点聊,分享了之前做机器人研究,还有创业,然后到第二次创业做千寻的。
这样一个经历,讲了很多二六年的展望,包括你说就是接下来这个行业可能会像大模型的二三年到二五年有这样一个演进,然后模型性能会突破,呃,有些公司会上牌桌,公司之间会分化。然后我觉得这次聊完之后,也是很能很明显地感觉到千寻想做的最壮的事情,就是在接下来一年,你把模型性能突破到一定的阶段,然后去打开更广泛的工业生产、商业服务,最后乃至家庭服务场景里的。
机器人可以去做的事儿,让机器人真的能进入千家万户,帮我们干活。那今天谢谢韩峰涛的分享,今天节目就到这里,各位拜拜。好的,谢谢曼奇,大家拜拜。本期的联剪陈世贤想分享两个内容,第一个还是最近几期节目里反复提到的数据。在访谈踏实创始人陈应伦、河内之后与元力灵机的范浩强,还有千寻的高阳一起聊具身测评的节目里,我们都聊到了数据是具身智能的第一道关卡和卡点。
而现在,一批头部公司也纷纷对外声称,他们已经接近解决这个瓶颈,接下来会看到数据量级。和模型性能的爆发。如果按照真机数据和仿真数据的大类来分的话,在国内的公司里,比较侧重仿真数据的是银河通用,还有 Hailbot。其他多数公司一般更侧重真机数据。二是想分享一下二零一六年前后出发的那批中国机器人创业者的特质,韩峰涛是其中一员。
我和韩峰涛加上是在二零年六月,他给我发的第一条信息是在解答两种力觉传感器的区别。其实当时的机器人已经能干很多绝活,比如针刺气球不破、剥鸡蛋壳、按摩、写书法等等。这是因为上一轮的AI进展中,机器人已经有了一定的智能,而且陆续加上了力控、3D 视觉等新的传感器,所以当时就已经有了智能机器人的概念,它可以做到一些传统的工业机器人无法完成的工作。
这期里提到的磨刀工作站就是一个典型的例子。我可以展开再讲一讲,因为当年做落实的报道时,我对这个东西的印象非常深。这期里面韩峰涛提到,最开始他们是为了日本的京瓷这个客户来做的这个设备。那后来他们为了打开更多的市场,也在国内去推广了这个磨刀工作站。那会儿采访时,首先让我觉得很有意思的是,落实的人对刀具这个产业摸得很清楚,给我科普了中国有四大刀具生产地,包括广东阳江、浙江杭州、重庆的大足,还有山东的青岛。
那在这些不同的地方,有些什么样的公司,他们是一个什么样的历史脉络,落实都搞得很清楚。那会儿我们的同事也有去阳江的刀具厂采访,人力磨刀确实是非常辛苦的工作,就是要在不断有流水的磨刀石上去作业,整个环境有很多粉尘噪音,当地很多工厂是招不到年轻人的,而有经验的老师傅又得花上几年。才能找到磨刀的手感。等这一代工人老了之后,很难补充新的工人。
洛氏当时做的这个工作站,也确实集结了当时能用到的挺先进的技术。它是一个封闭的大箱子,可以全自动化的磨刀。大概的流程是:刀胚会一把一把的进入这个箱子,刀胚进来之后会先做高精度的3D视觉扫描,因为每一个刀胚它会有一些细致的厚薄的差异,然后再根据你对它视觉识别的结果,用机械臂拿着这个刀胚去磨刀石上磨。每一个刀胚其实你都要精细的调整它的角度和力度,它并不是一个一成不变的、写死的、固定性的工作。
同时,你还要考虑稳定性、一致性、速度以及生产的效率。但这个很费劲儿才做出来的挺极致的产品,面对的却是一个很小的市场,而且这个市场也相对固定,它并没有在快速的增长。同时,因为当时的智能能力还是比较特化的。你用在磨刀这个场景的工作站很难复用到别的生产场景,而工业生产场景的一个特点就是不同的门类之间差别比较大。
工业整体上来说是一个非非常庞大的门类。但你具体到一些不同的行业,可能又比较碎片化。这也是为什么上一代公司普遍会经历比较多的挣扎。他们手里一边是有点智能,但又没有那么通用的技术;另一边又是广大的破碎的、单看起来可能比较小的场景。所以,像韩峰涛这样当年服务过这种工业场景和客户的人,他们既有做技术组合和工程实现的能力,同时也对中国制造业的老板心态对选择场景的技巧有更多的认知,对一些过度垂直的短期收入也有刻骨铭心的栽跟头的体验。
这次访谈发布后,这次采访之后,我和韩峰涛和高阳说,我自己确实最认可AI和产业落地经验深度结合的具身团队,因为具身的难点就在于你既需要有能力做前沿的技术探索,又要对服务客户和落地的残酷与苦逼有清醒的认知。虽然结合这两种能力,从组织和协作上肯定非常不容易,会有 trade off 和碰撞,但最后的成果会属于那些啃下了硬骨头的人。
现在具身行业非常喧嚣,今天刚刚有投资人和我说,据统计,估值超过十亿美元的公司就有十五家。上一代智能机器人的创业公司中,目前还没有谁获得大成果。希望现在我们看到的具身的热闹。之后会沉淀出经历周期的价值。本期节目就到这里,感谢收听。如果你对今天聊的话题有观察、好奇或疑问,欢迎在评论区分享想法,这也会成为我们节目的一部分,让整个讨论更完整。
你也可以把我们的节目分享给对这个话题感兴趣的朋友,推荐更多你想听的主题和嘉宾。你可以从小宇宙、苹果Podcast等渠道关注“晚点聊Late Talk”。也欢迎关注我们的公众号“晚点 Late Post”,下期再见。xyz:wdl 152: 访谈千寻创始人韩峰涛:20 亿新融资、具身模型淘汰赛、落地非共识