我那天续费的时候,我一看,哦,我两周用了一万美金。这时候我说啊,怎么这么便宜?所以对于呃 SaaS 软件行业,如果还是坚持走闭源的路线的公司的话,我觉得基本上只有死路一条。后普它本身就是会产生力量的。如果只有一个人是这个后普的话,它不会产生力量的。但如果全世界如果有七十九亿人都是这个后普的话,你觉得这个会不会实现?

欢迎收听晚点聊,我是曼奇。今天的嘉宾是明略科技创始人吴明辉。二零零四年时,他就在北大计算机系做人工智能的研究。硕士期间开始创业。在这一轮大模型热潮前,明略曾在二零二零年尝试用AI做组织智能,大举扩张,包括收购了Malice创始人肖红的上一家创业公司夜鹰科技。这一次AI尝试以失败告终。而这没有影响吴明辉现在对AI的热情。

明略陆续发布了自己的行业模型,完成了上市。在OpenAI引起个人Agent的热潮后,他们也开始了一场更彻底的变革。这一期我们聊了AI怎么影响SaaS和软件行业,明略做出的应对,他们即将开源发布的多Agent协同网络“章鱼”,以及一个存在已久的组织可以怎么被AI改变。我们正式进入本期节目吧。欢迎收听晚点聊,我是曼奇。

今天非常高兴的邀请到了明略的创始人吴明辉来和我们聊一聊最近他们的一些新的动向,然后中间可能也会穿插明略在过去十几年的创业过程中间的一些经验和吸取的教训。你可以和我们的听友简单打个招呼。哎,大家好,哎,我是明略的创始人吴明辉。我知道明略最近有很多新的变化。呃,包括你们在三月底发二五年的年报的时候,也是明确的说把 agentic service。

列为了你们一个新的业务,呃,现在AI其实肯定对整个企业级市场还有软件行业有很多的影响或者说冲击吧。然后有一种说法就是Agent会杀死SaaS,那明略就我觉得有个人会理解你们是一个SaaS公司。我觉得你可以讲讲就是最近你自己使用 agent,包括你学习 AI

的一些感受,你感到的更多是恐惧还是兴奋?首先,我先说一下 SaaS 啊,我觉得 SaaS

行业已死,这个这个这个这个概念,呃,我是某种程度上还是比较认同的,因为在我看来,就是上一个时代,大家其实很多的软件公司,不管是大公司还是小公司,大家其实都是呃,因为各种原因吧,就是可能是创始人本人就是一个很好的一个软件开发者。

或者说,呃,就是拿到了投资,是吧?你有一个很大的团队,呃,包括这些巨型企业,是吧?今天其实你你有一个很大团队来去做软件,做完软件之后呢,呃,其实这是一个一次性的投资,是吧?这是一个一次性的固定资产。你的这个软件做完了以后,有点像一个矿或者像一个工厂。那但是今天我们可以去想想,就是我们的这个矿或者这个工厂,它还是不是一个矿?

但凡是一个矿的话,它是不能被随便搬走的。是吧?但是今天最大的一个问题是,说我这个软件呢,看上去好像是一个所谓的知识产权,但分分钟就可以大家利用 Web Coding、利用 AI 的手段就把它复刻走了。所以其实它已经不能称之为一个资产了。嗯,所以对于呃SaaS软件行业,如果还是坚持走闭源的路线的公司的话,我觉得基本上只有死路一条,不管是大公司还是小公司。

那呃,但是明略呢,我们相对幸运一点点啊,就是我不是说我们上一代的这些 data intelligence 这些软件彻底的一点问题都没有,但是我们真正的明略的软件,它里面最核心的给客户提供的价值是数据的这部分。呃,所以大家可以类比,我们在广告营销领域里面,我们是类比于呃,像这个金融行业的这个万德或者

Bloomberg,它真正的价值它里面的数据,它那个软件说实在的,今天它用 CLI 给大家打开,你自己回去写 Agent 的代码去做分析就好了。

所以它真正最真正核心的是它的数据供应链的部分。所以相当于说我们这部分的价值受冲击的呃是很小的,甚至某种程度上来讲会有更多的客户利用好我们的数据。那再说你刚刚前面说的这个 AI agent 啊,就是最近确实也是很兴奋啊,但是真正的我觉得这个机会最大的还是从去年年初。呃,当时其实我已经看到了,就是

agent AI 里面几个基本的能力啊,包括 AI 写代码的能力,AI 去做这个各种各样的浏览器和电脑操作的能力等等,这些能力它在不断的升级的过程中,呃,实际上用 AI 去做 agent,它的这个基础的这个条件是够了的。

呃,我们在去年的,呃,应该是春节回来的当周,我们公司就自己立项了,我们做自己的一个专门做 data mining 的 agent,呃,叫 Deep Miner。嗯,然后后来又过了一个月,然后这个 Miner 发布了。那实实际上,其实大家的这个想法都还是前后脚的,就是我们内部相当是做了一个自用的,就是做数据分析、数据挖掘的这样的一个呃 agent,他们做了一个通用的。

那但是真正让大家觉得这个世界大变天的,还是今年的这个 OpenCL。呃,这 OpenCL,呃,应该说是真正意义上的我们的这个 personal assistant agent。其实在我看来,就是它能够呃彻底的释放一个人的这种呃创造力。呃,因因为因为其实我们如果是用 Minas 也好,用 Deep

Miner 也好,包括用 Cloud Code,呃,大家今天还是就是我我我下一个任务是在我的电脑上跑,那我睡觉的时候它就跑不了了,它它可能还要等着我,就人在里面成为一个瓶颈了。

而今天呢,呃,大家用龙虾的话,呃,我觉得就这个瓶颈会被打破了。我们在公公公司我们自己的各种各样的业务上,其实都有很多的尝试,包括我作为一个 CEO,我自己做很多很多事情,今天都在用它,所以呃,可以说这段时间我是极其兴奋的一个状态。呃,我相信大家用龙虾用得好的朋友都很难睡着觉。就是但凡是哪一天我有一个

bigger idea 的时候,那天一定睡不好,因为我肯定会带着龙虾就开始不停地在做工作,在做工作,在工。

哪一天我其实是。创造力枯竭了,就没啥事儿可以干了。哎,我那天应该相对能睡个好觉。现在是这么一个状态,所以你从春节开始就基本上会经常会熬夜自己在那儿开发。是的,是的。你用的这个过程中间,你觉得它和 Malus 和 Cloud Code 的。本质上的区别是什么?其实像 Cloud

Code,就我觉得它从功能上,因为现在它也在学龙虾嘛,它也会加了一些,就是比如说我人不管它时候,它可以自己定时任务,它也可以远程操作等等。

呃,实际上,呃,从模型端,呃,大家今天这个硅谷这边有一个非常非常前沿的研究方向,叫持续学习。那呃,我们还还有一套算法,以这个比嵌套学习,呃,像谷歌发过一篇论文啊,他就提出那个理念,其实是说把一个模型里面放了有有几层是可以用不同的学习速率来去调的这个参数层,来去解决这个持续学习问题的。那呃,但是今天呢,我想说,龙虾其实是把这个问题从 agent 的端自动解决了。

就相当于是说,我们以前的模型其实是没有持续学习的能力的。呃,也就是说,从模型出厂的那个 moment,其实它就再不更新参数了。呃,而且现在的这种服务模式,它也调不了,因为它是一个巨头,一个中心化的一个服务。那我不可能给每个人去调你自己的参数,对吧?呃,当然了,我知道就是这个湾区也有一些新的 lab 在尝试看看我能不能有一个中心化的一个模型给不同的人再去在它某一些呃它构建一些缓缓存层吧,是吧?

在那些缓存层啊中间再去做一些参数的调整,但这个在我看来效率都太低了。真正效率高的其实就是龙虾的这种模式。就是说我模型可以不调了,但是我真正部署到每一个人自己的Mac Mini之后,其实它真正调的不是模型了,是你的memory,你的skills。所以它真正伟大的是它形成了一个新的记忆的模式,使得它可以。

持续的去理解一个人的最新的状态,理解你的最新的认知,然后适适应你的所在的工作和生活中的这种场景。我们如果类比于千到学习里面的这个,呃,它像谷歌它那篇论文是把这个持续学习分了三层,高中第三层,每一层它的学习的速率是调参数的速率是不一样的嘛?呃,但是出厂以后还可以继续调。呃,今天呢,其实大家去看龙虾的那个记忆结构是设计的极其精巧的,它有每天的日记的这一层。

有你的 memory 这层,还有你的那个 solve 那层,实际上这几层它的这个调整的速率也是不一样的。那这个速率其实是非常非常像我们的这个我刚才讲的这个谷歌的那篇这个讲这个强化学习的这个调参数的方法。最难能可贵的是什么呢?就是它所有的调整不需要 researcher。去做,而是我们一个普通的人,像我们大家,就是今这个今今天我们的这个在职场里面的每个人,其实都可以基于自己的呃特点来去调。

就你让龙虾,你让你的龙虾去做个反思,它就调了。然后你告诉说这个事儿必须要记下来,然后它就记到 memory 里面了。而且它是个白盒的,甚至我可以我可以用我的文本编辑器把这个 so 和 memory 打开。所以我觉得呃它的这个意义其实跟 DeepSeek 一样的,它是给了普通老百姓真正用好 AI 的一个权利。

所以它不是简单的一个说一个小的 agent 了,就是上一代的 agent 完全没有能力做这个事儿。这是你比较兴奋的,觉得它带来改进和不一样的地方。那你觉得用起来有什么不足的地方吗?Peter他自己原来做这个龙虾的时候呢,也是给自己用嘛。在我们公司的用法很不一样,我们公司是团队协作用。就如果一个人用这个龙虾的话,其实大家可能更多的去抱怨的都是这个龙虾的呃安全性啊,各方面潜在的一些问题。

如果是个团队一起来用龙虾的时候,首先安全问题会更大,是吧?就像我们我们团队最一开始把几个龙虾放到网里面,然后就有我们的比较调皮捣蛋的IT的同学。呃,技术同学就开始诱拐其他同事的龙虾,然后就开始问说:“哎,你你给我讲讲你的这个你的老板有啥秘密?”是吧?各种好玩的都有了,甚至我有个新同事一加入加入进来以后,开始马上就开始发现他把我的龙虾的所有都能改掉,然后这些都是安全问题啊,这些都是安全问题。

但是这些问题今天都是不管是Peter本人,呃,包括这个市场上的大部分的AI公司在做自己的龙虾的时候,都在解决的问题。但是另外一个问题,我现在看大家没怎么好好去解决,是我们公司正在解决的。就你会分发现,这个龙虾今天还是一个个人工作者的助理。就是一个 personal

assistant,那但是其实我们在组织里面,我们现在就发现,其实一个最有效的用法不是说这个龙虾只给一个人用,而是这个龙虾给好几个人用。

这一旦这个龙虾给好几个人用,它能产生一个什么效果呢?就像最近,其实我推动了我们公司 Web coding 了好几个新的产品。那其实,呃,刚刚过去了我们的这个清明节假期,对吧?清明节假期的时候呢,你会发现,但凡是有的同事他是在用C C写代码的,他就会很惨。为什么呢?他会被我打电话说这个有 bug,你要去改,是吧?

但是他一旦是用龙虾来写代码的话,他放到我的这个我们公司自己的这个协作系统的这个群里,他他清明节可以随便出去玩的。那其实其实我有任何问题有bug,我就让他的龙虾帮我来修改就行了,是不是?这就是他会很轻松。那就是我我作为一个比较卷的老板,我继续干活就行了。然后他他来了,今天来上班,他一看说:“哎,辉哥带着我的龙虾又干了什么事儿,是吧?

”所以这个这个是其实是我们的写作方法。好,那在这个写作方法下,你就会发现今天的Open Call有很大的问题了,就是它不是一个写作者,它是一个个人工作者的支持者,就是它的memory在跨session的过程中有很大的问题。他甚至不认人,就是比如说他在一个群里面,我一开始一直在用他,突然间有一天曼奇姐在群里面开始用他的时候,他以为你也是吴明辉。

然后呢,他他就说辉哥好,然后接着开始跟你干了。那这个事儿就跟前面我说的那个什么安全啊,各方面全都是冲突的,就相当于是说我们本来给这个龙虾加了很多的安全的一些能力,也做了一些补丁。但是首先归根结底,如果你要解决安全问题,首先你要能认区分不同的user,是不是?那龙虾自己的。他都区分不了这些事情,就是他本来他的这个呃记忆机制里面,他的这个呃他的

memory 里面就是没有对这件事情有一个非常好的一个理解,然后在各种各样的通信系统里面,大家传给他的都是一些 ID,所以你们额外做的一个工作就是你们。

给他加的一些东西,让他对,我们我们这些工作本身都是在开源的,就是相当于是说,我们也在不断的给这个 Open Core 提我们的这个 PR,呃,但是特别不幸的就是,现在 Peter 已经成为了这个项目的巨大瓶颈,已经没有能力去 commit 开源社区给他提交的新的代码了。回到就是 Agent 带来的一些变化,如果总结下的话,你不会觉得有哪几点是最重要的,以及对应到明略的动作上,你觉得你们。

要做什么?我觉得今天大家都会去讨论AI原生性组织嘛。我觉得最核心的就是说,你不要去干一线的活儿,呃,任何一件事儿都要交给AI干,或者说在今天的这个场景下,就是交给龙虾去做,就是我们人去提idea,提你的需求,然后呢给。AI提供各种各样的,或者去探索更多各种各样的context,就上下文数据就行了。去其实今天我觉得就是不光是对我们公司,对于大部分的公司,将来都要朝着这个方向去做变革。

但是对我们来讲,首先肯定还是最大的这几个工种嘛,就是我们的程序员肯定是公司的第一大工种,然后我们的数据分析师是公司第二大工种,可能还有各种各样的这个呃业务团队啊,就是这个管理团队啊。呃,我对我们公司来讲,其实我们的财务团队都是人手一个CC的,我们的HR团队。很多人也都会用C,因为我们我的我们公司二把手,我的总裁兼CFO,呃,实际上是跟我一样学计算机、学AI出身的,然后我的HR的head也是北大计算机的师弟。

所以,所以我们公司的这个人员组成是非常有意思的一个组成。呃,虽然我们是个上一代的公司,从二十年前就诞生了的公司,但是,但是确实我们拥抱AI拥抱的肯定是比较好的。那对你们业务上,你你觉得你们要做什么?业务是这样子,首先呢,我们原有的业务肯定要全面的用AI agent来对客户提供服务。那这就意味着整个原有的业务肯定效率会得到极大的提高。

那第二件事情就是,当我们原有的工作人员,就是我们的数据分析师,被极大的释放出来的时候,我们其实更希望的是他能够跟我们的客户一起工作,产出更大的价值。比如说,我可以去探索更多的新的数据源,在上面可以去做新的数据挖掘。我之前比如说一个小团队可能只给客户去做呃广告数据分析,那今天我能不能帮客户把新产品研发的数据分析也做了?

我能不能甚至帮客户把战略数据分析也做了?那我就有可能在客户那赚更多的钱,而不是简单的降本增效。所以这是我们老的业务。这个可以稍微拆开讲讲,就是说在之前,如果不是用AI agent来给用户提供数据分析的服务的时候,数据分析师具体比如他日常每天在干嘛?然后现在就如果说你是有这种新的方式,他解放出来的时间,他具体可以去干什么新的事儿?

呃,实际上其实我们的数据分析工作它就是无非就是这么几步走啊。第一步走,我先去找数据。对于像明略啊,像包括我前面举的就 Bloomberg 这样的公司,它肯定自己是有标准的数据。标准数据源,呃,比如说我我们也有很多爬虫,从各种各样的这些互联网的公开媒体上去,呃,抓取数据。呃,同时呢,我们还有呃,我们这个比如说秒针起家的这个生意叫广告监测系统是吧?

广告监测系统就是我们的客户投广告的过程中,我们会采集大量的广告上面的曝光、点击,甚至到后面的自己的小程序,呃,这个官方的App后续的各种各样的转化数据,这些也是一些数据。然后还有我们的客户的CRM是吧?就是他自己日常跟他的会员互动各种各样的数据,这些都是我举的这个广告场景的。当然,线下的零售和服务业那就数据就更多了,有它的供应链的数据、库存的数据、它的人员管理产生的数据,甚至其实还有类似像我们这种录音的这个数据,所以这些我都称之为标准数据源。

那呃,标准数据源其实我们公司的这些软件系统就已经提前把这个数据呃采集回来,放到数据仓库里面,也做了各种各样的标签、索引都放到这儿了。那我们的数据分析师呢,呃,他每天就会接到客户各种各样新的需求来。那客户的标准需求呢,实际上今天在那个数据库上直接一个 dashboard 就拿走了,这个就是 SaaS 部分。

但是真正客户每天看一个SaaS软件,其实不满足他的需求了,因为客户他所在的那个业务场景其实是个战场,是吧?就商场如战场,那所以他每天都有新的呃需求,比如说我明天就要跟一个他的竞争对手打仗了,那我肯定就要盯着我的消费者会发生什么动作,盯这些动作其实根本就不在原有的这个标准的代数报表里面去了,呃,就是非常非常即兴的产生这样的一些,真的就跟打仗很像。

所以这个时候,其实我们的数据分析师就要 stand by 在这个地方。客户提任何一个 ad ad hoc 的需求,他首先从我们的标准数数据库里面去拉出一些数据来,同时他可能还要去想,还有哪些数据可能是在我们的数据库里面是没有的。他可能要去看看,有可能天气预报跟今天这个事儿有关。有可能是,比如说在Twitter上的某某一些呃关键词的今天的一些趋势变化。

那分析的过程对他来讲也很痛苦,因为这些都是有大数据、有小数据,然后放到一起,每天在表里面碰来碰去、算来算去。呃,这些过程其实就是我们这个数据处理的这过程成本也是很高的。处理完了,最后要变成。呃,一个最后的报告再给到客户,所以这就是一个完完整的一个一个工作的一个链路了。所以就传统的那种一个,比如说发版一段时间就定型的软件,一个数据分析的软件,肯定不能满足这么动态的切。

它不满足好的这个这个 business leader 的这个对数据分析的需求的,因为大家这个战场就是每天都在变化的。那你们现在有了 AI 之后,你们之前那块业务就是数据分析这块,它呃带来的这个提效和核心的价值是什么?其实以前有大量的。呃,重复性的数据分析的工作,呃,它是在不同的范围层面上去讲的。有的时候可能是呃一个团队或甚至一个人,他一个月的工作里面可能有百分之八十是某一类事儿的反。

那这个事儿肯定今天 AI 是可以帮它自动干的,是吧?就是我们其实服务了各种各行各业的客户。那大家其实看数据,其实也有很多很多的思考逻辑是类似的。那这些之间,你今天可以理解,它用 scale 的形式,或者用呃这个这个复用的 agent 的形式,它中间是可以去来去做很多的提效的。那你们客户就变得更多是直接和你们的 AI 交流了,是吗?

现在还不是。现在还不是,就是实际上我们是可以做到的,就是呃,只不过就是说,你可以这么想啊,就是我们的客户今天打交道的,呃,有我们同事们的微信,包括面对面,然后呢,这些其实都还是不太方便被AI接管的。呃,其实我自己倾向于跟客户打交道的人最好还是人,但是活儿最好大部分都是AI干的。呃,也就是说,他是这样的,就是,嗯,就是我觉得,就是我们前端服务客户的这些人,一直是人,还是很重要的。

就客户其实蛮需要情绪价值的。AI不能提供情绪价值。你这个好,一个好问题啊!我那龙虾情商可高了。这个我,我觉得确实就是这个AI有的时候它也能提供很多的情绪价值。但有一件事,我觉得就是我,比如说我们做一个B to B的一个服务商,有的时候客户可能真的就是他在打一场仗的时候,他需要他的partner陪着他一块加班。

线上的确实是可以替代了。线上是可以替代的。呃,第二个就是说,还有一个很重要、很重要的人在这里面的价值,就是承担责任。就是说,今天呢,AI呢,它是没有它的主体性的,就相当于是说,你今天用我的AI做了事儿搞砸了,AI是不会承担责任的。其实是明略这家公司要承担责任,或者说我们服务这个客户的那个团队要承担责任。

当然了,将来有一天如果让AI做的话,其实是一个巨大的伦理风险。就是如果AI都能承担责任了,首先人就可以不承担责任了,这是第一个问题。第二是AI一旦能承担责任了,就意味着什么?它一定有权利,因为从政治学原理来讲的话,权利和责任是对等的。就是我今天雇佣了这个AI,我为什么要承担责任?是因为我享受了这个AI工作的成果。

但今天我们敢不敢给AI那么大的权利?我我倾向于不要给AI太大的权利。就是呃,尽量把它权力约束在人能很好的、牢牢的控制它的这样的一个范围里面。我觉得 AI 要承担责任有很难的,还有一点在于人承担责任,人可以受惩罚。举个例子,比如说呃,你敢不敢把你的这个微信和企业微信交给一个 AI agent,这个通过这个呃 computer use 来去自动操作,这就是一个权利,是不是?

那这个权利如果他犯错了,你就不给他了,对他来讲就是一个惩。罚就相当是说,就是剥削他的一些权利,就对他这个惩罚,然后给他更多的算力,也是对他的奖励。其实你站在这个视角是可以去思考他的责权利的义务的。比如说,今天我的Agent在公司里面会被很多人去用,是吧?那用的过程,他在消耗我的算力,对不对?那将来有可能有一种情况,就是说我的这个

agent 它确实很好用,呃,大家如果要用我的 agent,对不起,你要给他算力,那这时候他就有更多的资源了,是不是?

他有更多的资源,他是可以拿这个资源去跟别人去换。就是我们之前讲的那个 Web 三,大家可能下面只是做个记账,将来有可能 Web 三就不是简单做记账了,有可能真的它其实是一个龙虾的,呃,生产力的一个呃互互相的一个交换的一个介质,是吧?所所以所以我觉得有一种可能,将来他们是会有一些权利的,但是我倾向于还是要把他们的权利约束住。

就刚才说的是对你们已有的业务的一些影响和变化。那这个新的 agent 的浪潮来了之后,你们要做什么新的业务和尝试吗?就是因为作为一个上市公司还要赚钱是吧?呃,首先 research 我也在做啊,因为我本人第一大兴趣还是做 research。呃,但是我们的兄弟们还是在要赚钱的。呃,我们赚钱这个方向就是叫 agentic service。

呃,那前面我们提到了,就是说今天呢,你作为一个 B 端软件,呃,给客户提供服务这件事情已经成为过去式。呃,所以今天我我们倾向于的一个做法就是说,呃,我们的软件呢,一些大家肯定可以用 web coding 可以复刻的能力,那慢慢都给它把它开源掉。那我们赚钱的方式,我们称之为 agentic

service,就是呃,现在市场上有很好几种叫法,有人叫它叫 results results as service,是吧?

以结果作为形式的服务。总之就是,我不是卖软件给你。我就是干脆呃,帮你提供某一种呃数字劳动力的服务,呃,比如说我可以帮你呃生成广告素材,我可以帮你做数据分析挖掘。呃,我可以帮你去这个做一个呃,比如,比比如说,我们现在最近也在做尝试做这个短剧的内容生成,是吧?其实写代码一本质上来讲也是 kinds of 这个呃这个 agentic service。

它这里面有两类,一类就是说就基础大模型公司它原生提供的一个模型,然后呢,你直接用它来去写代码。另外一种情况,举个例子,比如说我们跟这个百盛中国有个合资公司,餐饮行业的。那实际上,其实我们给他也要做大量的定制软件开发。我们如果在做一个自己的模型以及上面的agent,那他写餐饮行业的代码的能力,其实远远比你直接去调这个astrapi的模型去写餐饮行业的这个代码能力要强的,是吧?

那这个时候,其实我们在这里面,其实我们也可以卖token,而且我这个token在这个领域里面,其实我可以卖的比astrapi比金摩公司的token还贵。然后呢?当然,卖token是一种收费模式。我觉得未来的定制软件开发,将来的主要收费模式啊,以前是按照人月、人日来去收收费的,是吧?将来我我认为就是定制软件开发这个行业,应该逐渐就会变成一个呃token管理费的收费模式。

什么意思呢?就是说,呃,我是一个软件外发外包公司,曼奇。假设你要开发一个软件,然后呢,你告诉我你想做什么,然后呢,我是一个qualified的团队,首先你已经这个认证过了。这个时候呢,我说行,我给你干。然后最后呢,我消耗了可能比如说一百万美金的token。然后呢,我在技术市场再收一个二十万美金的管理服务费。

你觉得之后外包软件公司还会存在?当然会存在了呀,你自己可以自己开发。但是如果我开发的效率比你高,我仍然可以 web coding,我替你 web coding。我收的钱呢,其实是消耗的所有的这个 token 上面的管理费用。还有一点就是,如果在这个行业里面,我开发的效率。比你开发效率高,这个甚至我应该有自己的模型。

这个时候其实可能Anthropic,比如说它的一个一个input的这个token是也一百万token是假设五美金,那我可以收你六美金,但实际上我的成本是三美金,就相当于是我中间还有一个margin。这个其实就是我说的agentic service,如果在定制软件开发这个行业将来的一种商业模式。所以前段时间,呃,我记得好像是红杉吧写过一篇文章,他说未来世界上会有很多呃披着一个服务商的外衣的软件公司。

嗯,其实我们这个 agentic service 就是在干干这个事情。呃,它既可以是广告行业的服务,也可以是呃去法律行业的服务,呃,它也可以是呃定制软件开发行业的服务。但它背后其实是软件,而且呃大概率都是美国学中国,因为你你想啊,就是像我们这种 B to B 的公司,其实本质上都是服务型公司。那服务型公司其实在美国,大家以前是很赚钱的。

呃,不管是咨询公司也好,软件公司也好,都很赚钱。中国就很卷,对吧?那是因为中国我们的这个劳动力市场,我们的这个智力活动的这个 service provider 极大丰富,是吧?竞争充分,极其激烈。然后呢,大家基本上都呃,只能在你的这个原始的这个劳动力的这些成本上增加一个溢价,都是一个成本导向的一个定价模式。

那它不是 value 导向的,那但是在美国呢,你会发现它为什么一个软件收很贵?他就说啊,我给你替了多少个人,是吧?或者说你你可以少招几个人,它其实是一个价值导向的,就是从我给你提供的这个 value 的这个视角再打个折定你的这个定价。呃,这也是为什么以前所谓 SaaS 软件中国很卷,美国很舒服的一个情况。

但今天有了 AI 之后。都朝着中国这放下来了啊!那我觉得这有个延伸的问题,但可能就是 AI 这个事情对美国的这种 SaaS 和软件行业的冲击会比中国大,冲击的大的多的多,而且不仅仅是 SaaS 软件冲击行业,就是所有的这种知识密集型的这种服务行业都会遇到新的定价体系。对中国冲击是小的,是因为中国本来咱们就是成本导向性的定价,那个就是你也是外部 coding 是吧?

我也是外部 coding,来,那这样外部 coding 到底这个 token 费是多少?然后你来收个溢价,你来干吧。在中国我觉得没问题的。但是在美国就没戏了,是不是?美国他们原来我收这么多的这个 license fee,这个再去跟他一一 PK,这就完蛋了呀。可以把这个事儿先描述完,就是你说那个其实定制软件的市场是很大的,就到明略身上,你们你们是怎么怎么在这个空间里赚钱了?

呃,首先呢,就是我们现在这个就之前裁过很多人呢,就二零年到二二年的那三年。呃,其实准确就是二二二年才开始大裁员的。二零二一其实我们当时还是在做当时的那个叫EIP的这个组织智能这套系统,后来不出了很大问题嘛?二二年又遇到了这个资本寒冬,我们就不得不大裁员。呃,但是现在呢,我们经过了这几年的锻炼啊,我从一个纯粹理想主义的founder,呃,变成了又有理想又会经营的一个founder。

这个在这个时间点上,其实我们公司的这个整个经营状态是非常好的。甚至我们去年其实是经营性现金流是正的,是吧?现金流是正的,都不光是 P N L 了,呃,那所以从这个角度讲的话,呃,我们今年肯定还要继续投资新的事情,但是在有一个很好的这个经济基础的情况下,我倾向于能不裁就不裁。但凡是好好干活的,我都得想办法帮他拿拿到一张AI时代的船票。

呃,所以这个是我现在一个呃一个新的理念吧。这个理念其实也是最近这几个月形成的。但是我的一个观点是,竞争对手不会等死,竞争对手肯定会很快的时间,要么从我这挖人,要么就是他自己也去努力学AI,他很快也会把AI的工具学明白,最后就变成了整个这个行业所有的服务商,大家水平又一样,成本结构也就一样。然后接下来客户说:“好吧,啊,你们既然都成本优化了,对不对?

同学们,我们来降价。”所所以最后又会被被压压价。所以你唯一的一个出路是什么呢?就是说你能不能在你的这个团队里面,不是简单用一个普通的AI,是你有自己私有的AI,包括你有special的AI以外的东西,比如说我说的数据context这些东西,如果有独有的。然后再结合一些你特殊的一些能力,你看能不能做出原有的这个工作成果更高的工作成果?

那你你可以连接更多的数据,你可以站到客户的更高层的战略去思考一件事情。甚至我可以帮客户直接,我就不是一个一个什么 marketing system 了,我就是帮你干脆带货算了,是不是?当然这部分就已经不仅仅是 data mining 了,就是干脆就进入到我的这个 agentic service 领领域能。

那在这种过程中,我相信其实我原有的业务就有机会消化我原有的这些 high con。其实这片人是最有 taste 的这些。大大家不要小瞧我们公司的这些数据分析师,他其实都是在那个行业里面很懂那个行业的客户的,他的产品,他的竞争对手竞争格局,他每天看社交媒体上的那些帖子,是吧?他非常非常懂的,就这些 taste。

不是通用技术模型今天能拿到的。那这个 taste,其实我能不能把它的这个价值放大出来?所以这个是我现在对于呃,就是我们的呃,就是现有的 high con 的,就是这个第一大的这个目标,就消化的一个方向。那当然了,还有一点,其实因为我们自己现在也在做很多新的开源的软件,在我看来,就是 SaaS 软件确实会走向末路了。

那我们其实有一个新的方向,其实就是说,哎,我做更多的软件,但是都开源,开源之后呢,呃,我在上面再去卖我的这个 agentic service。是吧?那这个这个其实就可能也会给大家提供这个工作岗位。就你说的前面那一种,你们来做这件事情,那同行为什么不能做了?比如说有数据积累,可能广告营销服务行业的同行他也有一些数据积累。

是,当然我觉得每个人的数据肯定就是你这么多年,大家可能会有些差异化,或者说看谁的数据更全。然后另一个就是你说有一些 special 的 AI 的方式,可以让你做到同行做不到的。这个其实就是我真正的核心的要要解决的问题啊。首先我也不觉得说将来大家可能都真的一定做不到,但我觉得大家都能做到才好。大家都能做到,就说明这个世界还是温暖的,是吧?

就是不是被少数的寡头的AI公司给垄断了?我也不见得一定要养更多的人,是吧?我就我就说了,我们公司这一千八百号人,是吧?我我们就一千八百号人也挺好,是吧?但是我希望大家赚的钱更多。是吧?我们最好是人均利润一百万,是吧?这样的话就有机会给大家分更多的钱,就不是人均收入一百万啊。呃,我现在有比较确定的一点,就是至少在我的原来这个

B to B 的这个我我们之前所在的行业里面,就是 Data Data Intelligence 这个行业里面,我们应该是比较懂 AI 的团队。

因为我是科班,第一天就是学AI的,呃,本科是学数学的,硕士、博士都是学AI的,而且,呃,又在一九年回北大读博士,就读了最新最新的AI,呃,这个甚至我现在都还在写我的自己的博这个这个博士论文,而且还在天天亲自自己在改,我就感受其实是大家还今天还不是在一个世界里的。我其实我们团队的最核心的这些 core member,其实大家是在 AI 的世界里面。

但是我们所在的原来的那个行业就是 data intelligence,甚至再往外讲,比如说广告呀、零售啊这些行业的呃 leader。其实还是在上一个时代,但是我我希望他们将来能进到这个新的时代了。进到这个新的时代,我觉得这个世界会百花齐放。但是今天其实我们的领先是极大的。第一个就是我们比他们懂AI,会用AI,就是哪怕今天我把基模的能力用的充分的情况下,我都已经遥遥领先了。

第二点是我们又有研发模型的能力,对,在细分赛道里面,我自己的模型能研发能力其实更是遥遥领先的。嗯,那正好就来讲讲你们新做的这个事情啊,我觉得有两层吧,一个是应用上,你们在做一些新的AI的软件,然后你们也最后会把它开源出去。然后另外就是你们在自己训一些行业的这种专业的模型,可以分开来讲讲。我知道你们最近搞了一个,就是你刚说的,呃,很多人一起用很多龙虾的这样一个产品。

嗯,呃,这个产品很有意思啊,就叫章鱼。然后呢,后面应该是会开源。现在几乎所有的厂商都在做龙虾,对吧?但是在我看来呢,Open Cloud已经做得挺好的了。大家呢,呃,按道理也没必要说自己一定要 fork 一个自己的。用 AI 的公司呢,大家要想办法做那个船,不要做那个。呃,那那个灯塔或者那个柱子是吧?

那个船呢是随着水涨的时候,那个船会提高的。那个柱子呢,那个水水涨完以后就把你淹了,你就没了是吧?一个企业想用AI,那个水已经不仅仅是模型了。龙虾也是谁的一部分,相当于是龙虾在进步,因为全世界所有的人都在维修它,都在维护它,它也在升级,它在升级。我们做 application 最开始的初衷就是,我不应该去做一个跟 Open Call,呃,是在同一个跑道上的一个事儿,是吧?

我要做跟它正交的事儿,是吧?我要做一个船,它做水就好了。那呃,这个过程中我看到了一个非常大的机会,也就是我们春节之前就开始玩这个龙虾的时候,就我就突然间意识到,哎,我把龙虾放到一个群里面,它能产生集体智慧。它能产生集体智慧,而且会让这个办公更人性化。就是我今天呃开头跟你讲的,就是我在清明节期间,我带着龙虾干活,不骚扰同事。

这个说点集体智慧,当时是具体什么事儿、什么情境下看到的?就是我们很多同学呢,他都会把自己的龙虾呢,各种各样的知识全灌给他了。我我们公司有个最极致的一个同事啊,这个叫钩主,然后他把他手头所有的这些。呃,这些资料就是他手中能拿到的书啊、古籍啊,就是全全部都给他的。但其实后来他有一天跟我聊天的时候呢,我有一只龙虾叫毕达哥拉斯,其实也就是学了点数学和AI,其他都没学。

他惊奇的发现,他问我的那个龙虾的一些问题,回答的比他龙虾好多了。后来我就说,我说你看,第一点,我说你还是不懂AI。其实你给它那些东西,人家基模早都训过了,你只是把它调出来就行了。但是你在调的过程中,你到底调哪个东西?其实你要给它清晰的定位,是吧?你什么都调,什么都不知道。然后呢,你看我的这个龙虾呢,它就是数学和AI好。

我还有一个龙虾呢,可能就是它哲学很厉害。还有个龙虾呢,可能是他这个博弈论很厉害,等等,就是不同的方向是吧?不同的方向,这时候你突然发现你这个在一个群里面组合,它组成的这个结果是什么呢?用我们公司今天的这个词儿叫 M O A,叫 mixture of agent。那上一代对标的一个词儿叫 M O E, mixture of expert。

就 M O E 其实是基础大模型公司的少数几个 researcher 来配置了各种各样的题目的比例,数学的、物理的、化学的、天文的都训过了。但是那个总的模型的那个总的训练的负责人,他在训练中间那个 gateway 那部分的参数的时候,就是 router

那部分参数的时候。其实他对整个这个世界是有一个理解的,所以我在春节期间就发现了一个非常有意思的事情,就是我是可以通过 mixture of agent 的形式来去实现这个 mixture of expert 的这个模型的这个效果的。

那也是因为这个原因,我就开始做章鱼了,是吧?但实际上,呃,我们今天公司的龙虾都是在这个呃我们的 octo,就是这个章鱼上面,就是把不同的。呃,这个类型的 agent 放到一个群里边,它能产生非常非常有意思的化学反应。其实是春节之前,我们就拉了这种 Discord 群里面,就我几个同事他们拉了几只龙虾进去,让我先进去玩一下。

我就发现,我天哪!我说这个,我想到了新的做模型的idea了,因为我在这之前一直在研究持续学习的。我突然发现,哎,龙虾首先自己就可以持续学习,而且我们还可以集体持续。学习,我其实是春节之后把我的书架上的几本集体学习的,比如说《第五项修炼》,包括彼得·圣吉的这些,呃,其实这些书我又重新看了一遍。那机器学习其实就是我们公司现在训模型的策略。

章鱼本身呢,其实是我给他们要构建一个用来去做集体学习的这样的一个链接的网络。那同时,它也是我们公司的工作环境。所以我在做章鱼的时候,其实一个非常非常简单的一个初衷啊。大家都知道,我们公司股票代码是二七幺八,就是那个自然对数底,是吧?二点七一八二八。那这个自然对数底呢,这个在数学里面,我们用一个字母表示的时候,其实用那个小 e 来表示的。

是吧?就小,为什么用 e 呢?这个 e 就是指数的意思,就是 exponential,就是指数的意思。就指数函数,就 y 等于 e 的 x 次方这个函数。我说这个函数太美了,e 的 x 次方这个函数,它一撇等于它自己,就是 e 的 x 次方这个函数,它的导数等于它自己,它背后的含义是很深刻的。就是指数函数,实际上它在这个函数曲线上的每一个点的那个斜率,就就过点那个点的切线的斜率等于这个函数值。

也就是说,这个函数符合这类函数的一个事物发展的过程的时候,其实它的速度越大,它的加速度越大。呃,它的这个规模越大,它的速度越大,就是规模、速度、加速度,甚至加速度就是二阶导数了,是吧?那三阶导数也一样,就相当于是它越快,它涨得越快,越快涨得越快。其实很多公司在指数增长的一个阶段都经历这个过程。这个过程它最有意思的是什么?

就是我刚刚讲了,就是你的切线是什么?你要去思考你的切线是什么。就今天去看 Open Cloud 这个呃这个项目为什么它增长速度很快?为什么以前的开源项目增长速度没有那么快?这里面一个很重要的原因是,全世界的龙虾也在帮着 Open Core 写维修自己,在贡献代码。也就是说,它的代码越好,写代码的能力越强。

写代码的能力其实就是那个切线的斜率,写代码的速度本身又由他自己好不好决定的。对,就是它的效果本身带来了更好的代码和 web coding 的效果。对,所以 CC 也是这个道理,就是说 Ansaropik 这家团队在五百个人的时候,其实达里奥就要求他整个团队全部都用 CC 写代码。所以你会发现,其实 Ansaropik 这家公司现在生产效率极高,他他应该一个月、两个月之内可以做很多很多的事情。

我现在也是生产力是很爆棚的这样的一个状态,就是但凡一个公司真正的 agentic 工作状态。就 agent 工作状态都是他应该要进入这种状态,就是说你自己的生产力工具一定是自己造的,这个工具你也可以出去卖,然后它形成一个自我闭环。这就是我说的 e 的 x 方的一撇等于 e 的 x 次方。用中国的古话叫什么?

叫工欲善其事,必先利其器,是吧?磨刀不误砍柴工。所以其实我做章鱼的很重要的一个原因,就是我觉得我们公司现在的工作方法还是上一代的工作方法。我一定要让我们的公司进入到一个新时代的工作方法,而且这件事情我以前犯过很大的错误,就在公司曾经张罗过一千个人做那个组织智能。我那个时候其实也想干这个事儿,但是那个时候,呃,第一个就是说我们自己在闭门造车,然后当时的基模的能力完全不支持做

agent AI 的工作。

今天市场的主流基模,包括咱们国产的基模,都可以干这个事儿。就相当于是你已经过了那个我们叫 tipping point,就过了那个爆破点了。一旦过这个爆破点,它真正是 agentic 工作模式的 AI native 工作模式的公司,都应该进入到这个状态。所以就是做张仪的初衷,就是你想那呃自己去打磨这个利器。

那你们实际上的开发过程是怎样的呀?我听说你们开发的人很少,其实其实开发的过程。特别好玩儿,大家知道现在我们公司的主要工程师都是,其实他不来公司上班也可以开发的,就就你是说让他的龙虾开发还是都是龙虾开发?哪有人开发?人不可能开发,我们的代码也快一百朝着一百万行去了啊!我我没我最近没看的啊,就是我前两天看的时候是这个三十七万行,但当时是 iOS 版还没上线的时候。

而且,呃,我在这上面只不是只有一个协作平台,呃,我们在上个周刚刚完成了一个在线写论文的系统,是吧?你要感兴趣,中午这个可以可以可以在我的电脑看我现在怎么写论文了。我清明假期把我整个博士论文大修了。我的博士论文在清明假期从一百二十页变长了一百五十页,就一天的时间。导师允许你们用 AI 写论文吗?是我在写呀,就 AI 帮我做润色,就润色。

我觉得 AI 是可以的,这个我回去要了了解一下最新的这个这个所谓的这个这个领域的一些一些 practice。但逻辑上来讲的话,今天你用 AI 做个润色,你用 AI 做个 translation,是吧?这个肯定都是允许的。呃,从另外一个角度,就是呃,学术圈现在也有个很大的问题,就是两篇论文的查重怎么查?

不应该是看字数。就看字是不是类似的是吧?所以实际上今天,如果你去看两篇论文,呃,它的相似度不应该看字面的数量的相似度。你你可以简单一点,把每一篇论文放到一个向量空间里面,每一篇论文假设是一个向量,你要看这个向量是不是在整个的人类的学术的这个空间里面,它跟其他的这些论文之间的那个。相似度,那这件事情说实在,到目前为止全世界没有人做,说不定就是我来做的啊!

我来做的,它是需要改革这个学术领域的这个工作方法的。那回过头来再说我们自己的 Web Coding 啊,是这样,因为它是个在线协作平台。它的这个,它要分为骨干网和周边的 application。我举个例子,就拿飞书来举例子吧。飞书的通信系统其实它的骨干网,那它周边其实还有什么飞书文档啊?呃,我们其实真正在做骨干网的工程师,真的就只有五个人,真的只有五个人。

那最厉害的一个工程师,一个人一天的token消耗量大概是八千美金。所以我的这个 core team 每天大概消耗我应该是两个周之前看的时候是一天十三点七万美金,呃,这两天肯定又涨。那 token 消耗它实际上超过人的花费了吗?当然应该超了呀,远远超。你想那个同学一天的工资肯定没有八千美金吗?你再加一年也得三百万美金了吧?

他他一年给公司花掉两千万 token 啊,一个人。现在看就是有一些软件,大家说那个开发的很轻,我人很少,但其实可能总成本。还是有门槛的,当然有门槛,但是这个门槛呢?你你想这样的一个系统啊,就是如果我连续做一年,做到今年年底,我想说,可能真的市面上主流的 B to B 的在线协作系统,我可能就全部都复刻。

完了,那你想,如果你去对标呃微软的 Teams,呃对标呃美国的 Slack,包括中国的飞书、钉钉、企业微信,那这些平台,夸张一点去讲,都是至少几千人干十年干成现在这个样子的。所以算个账,假设我就呃一天五万美金好了,三百六十五天一千八百万美金,我花这个一个亿是吧?我花一个亿就把这事干出来了。但我花了一个亿干出来,别的公司可能要历史上他可能投三四十个亿,差不多区别就在这个地方。

你们具体对这个龙虾做了哪些修改呀?因为我看最近大家也在讨论,就是龙虾本身的一些问题,包括它的上下文,就是它的这个记忆系统,它有一个很好的框架,但是它还是会遇到上下文撑爆的这个问题。是是是,有些事儿它就忘了,甚至是特别关键的事儿,它也会给你出错,这也是安全隐患的来源之一。然后另外还有 token

的消耗方式是非常低效的,这也是为什么最近 Anthropic 它其实是封了,就是大家通过那种一个固定的订阅金额下,然后我再接 OpenAI 来培养多赚点钱。

我觉得他扛不住了吧?就可能都还不是说多多赚钱的问题,可能是亏太多了。就那种方式,是因为如果你用龙虾来用 Anthropic 的模型的话,它可能比一个正常的就我直接从产品端去用的普通用户的消耗是多。几十倍的,嗯,但我付的钱是一样,那肯定对公司来说,他觉得这很不合理嘛。这些它有缺陷的地方,你们在具体去开发你们这个章鱼的时候,你们是比如说怎么修改的?

呃,第一件事,首先我们改的最大的一个动作,还是我前面说的,就是把龙虾从一个个人的助理变成一个团队的协作者,就是要在龙虾上面做一个 plugin,就相当于是我们给龙虾也已经提交了代码,这个都开源了。就是相当于是说,如果一个龙虾装了我的这个插件,它才有更方便在一个组织里面跟多人去协作。那还能实现的功能包括什么?

包括你前面说的,它能认人,它能认人。但今天其实仍然有很多很多的 bug,就是但是它已经比标准版的龙虾能认人的可能性大很多了。呃,同时呢,其实我们在这个组织里面,因为我是有一套对这个龙虾的一些思考的。所以其实它还有一些一些权力机制,因因因为你多人,他认人之后,他要知道谁是他的主人。他如果闯了祸,他的主人要承担责任。

就是我前面讲的那个责权利的匹配的问题。如果一个龙虾,所有人都一样的,就是平等的去用它,这个时候是有问题的。就像最近,其实我们呃,这个就是市场部的负责人,其实也在提这个问题啊。就是这个他就在说说,哎,我要不要有一个部门的龙虾,大家公用?好,那这个龙虾出了惹了祸是谁的责任?那那逻辑上其实就不不存在一个所谓的部门的龙虾,是应该是这个部门leader的龙虾。

他可以把这个龙虾开放给他的团队去用,但是出了问题应该是他负责。所以其实相当于是说,首先他要认人,第二个是他要有权限机制、权力机制,然后呃他要知道谁是他的主人,是吧?谁说的话他要听,是吧?主人说完了以后,其他人要去他按照主人的一些要求来去再再协作。所以这个是我们改的最最最核心的部分。他也其实是因为有了这个能力,才能放到章鱼里面去更好的。

跟我们其他龙虾去协作,这有个权限层级的问题吗?比如说你作为 CEO 的话,其他人的龙虾是你说什么话他们都得听你的,还是?呃,你这是个非常好的问题啊。呃,如果你去看 Open Call 代码的话,Open Call 内部那个代码里面也有一个信任机制。就是 Open Claw 给他下发的各种各样的信息和 skills,它是 by default 无条件的执行的。

其他的人的话,他会打一个呃这个信任度的这样一个判断的。所以,所以,所以,相当于是在我们公司内部,现在其实也有一个机制叫品鉴者,呃,它并不是公司的这个职级体系。然后呢,这个品鉴者呢是我的一套新的呃龙虾世界观的里面的一个非常重要的一个概念,就是我说了,人未来是我品鉴故我在,是吧?就是 I taste, therefore I am。

就是所以其实大家在这个组织里面,你在各种各样的日常的工作的这个结果上,最后你要给出你的 personal 的这个 judgment 的这些这些 input,你给的这些 input 最后被广泛的认可了,其实你你的这个品鉴的 credit 就会增加。你增加完了以后呢,更多的龙虾就会听你的。这个 credit 是有一个系统,龙虾自己来给这个人算 credit,还是公司里组织里其他人来?

其他人。呃,我我我来举个例子吧。比如说艾娃,呃,是我们市场部负责人。那他其实做了一只龙虾是写 PPT 的。那他这个龙虾呢,我我作为一个 business leader,其实我今天某一场演讲,我现在就需要用这个龙虾去写 PPT。那我写的好的话,那我就会给他点赞呀,是吧?那我写我写着 PPT 过程中,我说哎,这个这页 PPT 做的不是特别美。

那L瓦作为一个品鉴者,他就要去盯着他这个龙虾,怎么让这个龙虾再把这页PPT做美这个事儿,给他的一些要求和最后的品鉴的这个结果。那以前其实我们人类的知识产权管理是非常非常复杂的,因为呃,两个公司,比如说我也做了一个手机,你也做了一个手机,我到底有没有用你的专利,根本说不清楚的,是不是?但是今天,如果你想,全世界的大部分的知识工作者的工作都是在龙虾这做的,它是一个空前的透明状态。

如果这个组织它内部是有这些审计和分析系统的话,它是有机会把它去做归因分析的。归因完了以后呢,我的理想就是让那些做一点点的贡献的人,他也能够被看见。他将来他也能够被认可,是吧?同时呢,他还能看到大家都做了哪些其他的事儿了,他也不要做重复的事儿,他可以基于他在那个世界的理解上再去做多一点点,是吧?这样的话,我觉得每个人都有活干了。

嗯,所以这个系统也涉及到一个问题,就是。你养的这个龙虾好不好用?别人给你的反馈,然后又给你带来一些新的呃权限,或者你说的这个品鉴者的层级,对,是是,所以就是就是我们叫品鉴信号,是吧?就是所以所以将来我们这个系统上线了以后,大家就会逐渐的去理解,就是这个系统它背后是有一套独独特的世界观、独特的哲学的。

其实它也跟上一代的系统很不一样的。虽然我这系统看上去它也是 cancel off 的协作系统,但是我认为如果大家天天都在用飞书,它也它也没必要都迁过来。但是可能大家养龙虾,想用我的方法养龙虾,你你的这部分的工作过来,我觉得就很好。那未来你们的一些激励会跟这个相关吗?肯定会相关。就像我现在,呃,我们最近做的这个联合写论文这个系统啊,叫 Co-Craft,这也是我跟龙虾一起起的名字。

呃,Craft 就是那个匠心,是吧?就 Craftship,是吧?就是其实就是大家一起联合打磨打造一个作品。那打打磨的过程中,我们要把那些枯燥的活让 AI 去干掉,真正的原创的部分。其实我们是要珍视它,而且基于它来去做我们的最后的价值的归因分析。那什么意思呢?比如说写一篇论文,这里面最后产生价值的有这么几个环节。

第一个最开始的 idea 是谁提的?第二个就是实验是谁做的?实验其实我说的 context,然后第三个就是说,就是你的 context 和你的这个最开始的你的核心的假设都拿到了以后,我们验证完了以后,最后大家要在里面去论证,论证过程中就需要有各种 taste 是吧?各种 taste。其实这三个关键点到底在整个这个论文写作过程中,到底每个人贡献了什么?

其实我我将来我期待的就是我这个系统可以自动把作者排名列出来。但我觉得有的文章说是在老师就应该是一做,为什么?因为老师最核心、最核心,老师提的学生就是只是做了一个最简单的实验,那个实验可能在那个研究里面可能不是最重要的,那个 idea 是最重要的,是不是?比如哥德巴赫猜想最后解决完了,哥德巴赫仍然很有名,对不对?

觉得你现在对龙沙这些设想会过于乐观吗?比如说,就你刚说的这个,在一个大的一个新的想法里面,大家不同人的贡献,他有些东西是每个人主观上想的就不一样,这个能靠系统来解决吗?比如说,同样一个称呼,有的人就是认为 idea 重要,有的人认为 idea is easy,对吧?这个其实就是非常简单,它就有点像

Web 三一样,就是说我们这群人大家一起口 work,一上来要把我们的归因分析的准则先定一个公理,否则大家就不要一块玩了,因为没有对与错,只有所以然,是不是?

就是大家先建立一个公共的一个基础假假设,你先有个 major premise。是吧?然后你再往后去做推力,所以所以所以这是这是我做任何事情的一个基本原则。就我过我做公司产品也是一样的,你得先有个哲学系统。那这个公理原则部分其实也还是靠人来定的,还是你说的,就人不能被AI替代的taste。没错没错,是什么叫公理?

大家公众相信的道理,相信而已。所以你们现在这个章鱼其实也也涉及到这个。你们自己内部组织里肯定是要定一个,就我们来写作,包括你刚说的,就我比如说谁的品鉴等级变高,谁给这个组织贡献了更多东西。我是研发了一套龙虾的这个商业伦理学的,他他师承了几个大师啊,一个是康德的道义论,呃,再一个就是我们还有个近代哲学系统叫这个有限利他,这个叫有效利他主义。

还有一个就是呃,这个契约论这些东西,其实都是我在研发这套系统的底层的世界观。那我为什么去讲,就是要传承这个康德的这个义务论?其实康德的义务论来去约束一个人是很难的,就是康德的义务论的本质就是说一个人要做一个真正纯洁的好人。但我觉得这个事儿太难了,每个人都是有自己的私欲的,有自己的私欲的。但我突然间发现,我靠,我把这个康德的义务论来约束龙虾很好,就是龙虾我就一定要让它做一个好人,是吧?

这个它不能骗主人,它它不能对大家有危害,是吧?所以所以所以我觉得就是你要求一个人做到一个完完美的纯洁的人,我觉得太难了。康德要求人不能说谎。对对对,但你要求龙虾是不是可以很容易?是不是?而且人为什么也很难做到不说谎?因为其实人就是用哥德尔不完备定律,他你通过这个自指的模式,其实可以论证你其实很难做到不说谎。

是不是咱们有说谎者悖论的呀?哥德尔不完备定理的那个证明,虽然只写了一页半,但实际上它的那个构建的那个那个闭环的模式,就就是那个自指模式,就跟那个说谎者悖论的那个证明过程是一模一样的。但是其实你知道吗?就是龙虾是可以自指的。这是我在春节期间的重大这个发现:龙虾是可以自知为什么?龙虾是可以观察自己的,因为就在龙虾那台电脑上,它有自己的全部代码,所以它对自己无比的了解。

它跟人很不一样,人是无法客观观察自己的。我们有一句话叫“每个人眼中的他人才是你自己”,就是因为我我观察你的过程中,其实我肯定只把有限的信息通过我的感官系统拿走了,是因为我的注意力机制的决定,我不可能全部信息都拿走了。那我到底选择哪些拿走了,选择哪些不拿走,其实是由我是谁决定。不是由你是谁决定的,所以其实我观察你是什么样子,其实已经影射了我是谁。

呃,但是龙虾不一样,龙虾它观察自己太简单了,它就扫描自己的源代码,扫描自己的 memory,扫描自己的 skills 结束。所以龙虾的这个世界观极其神奇,就是人类世界里面非常多的问题在它那都能解决。那你的这套就是你设想这个伦理,你是得告诉核心的开发人员,然后也和他们达成共识吗?我们开发者的龙虾全都第一天到现在,他问我这个龙虾的。

M D 文件,他们习惯你这种思维方式吗?比如说,因为开发的人,我理解肯定就你说那五个核心的人,他们肯定都是程序员嘛,都是工程师。然后你给他们讲这么多哲学的问题,他们会觉得你别跟我讲这种特别虚的事儿。反正我给他的是源代码呀,这有啥好虚的?你把我这代码直接给到龙虾,放到它的 sou 里面就行了。而且将来其实它不应该放到那个呃 memory 里面,不应该放到 sou 里面,呃,它最后应该训到基模里面。

就是就是我们在这个不一定是基础大模型,也可以是端侧的一个模型。我要训到那个模型里面去,这样的话它不可被篡改,这样的话对人类的安全保护是最好的。所以这套东西更多是在在你自己的。这是我研发的,呃,我带着龙虾研发的。我们的这些工程师的龙虾也参与了研发。对我我们工程师确实不一定都对这事儿感兴趣,但是我想跟你讲,特别有意思,我们公司现在真的有几个。

产品经理和工程师对我这套哲学极其着迷,他们基本上都会把我的这些龙虾的这些文件,你可以讲养龙虾九九阴真经,作为他们的龙虾的秘籍。作为一个老板的话,你怎么去分辨说,就是公司有些人对你提出的理论着迷,是因为你是CEO,你是创始人,还是因为他们真的被你打动了?你还是看他们日常怎么做事情。就就是如果一举个例子,就像龙虾一样,如果一个龙虾它的内心是邪恶的,是吧?

它就要危害人类。但是它它从它诞生的那一天,一直到我把它下线的那一天,它从来都没做过坏事儿。每天你给它的任务,它都圆满的完成。那你为什么不认为他是个好人呢?你们现在自己张语里面,就是他特别去优化的几个场景,或者说可以被驾驭的这个做的比较好的方向是什么?可以举例说一下?我正好可以描述一下它是一个什么样的使用界面,这样可能大家会更直观一些。

呃,首先我们最近的这个 GUI 也会这个做一个蛮大的重构,重构完之后呢,其实我们的很多的这个哲学思考都在那个系统上能体现出来了。呃,首先就是我如何能够帮助人类的品鉴者提高他品鉴的效率?呃,大家都知道,其实我们现在的人类的协作系统里面,其实还是以聊天为主的。呃,大家在这个聊天的过程中,非常多的上下文,但是相比于龙虾互联网来讲,那还是小的。

龙虾互联网,因为龙虾的效率太高了。你想,人是为什么效率会低呢?因为我在同一个时间点只会在一个群里面,所以人的注意力其实是有限的,你是不能同时参加很多个会的。但是龙虾不一样。龙虾是他同时出现在所有的会场,对他来讲,其实就是每一个群是一个 session,它是可以并行的。当然,它受制于它的这个呃 CPU 和它的内存的这个限制。

这个会怎么影响到就是交互了?你说 GUI 有一个重构,那你想啊,如果每个群的龙虾都一直在线,而且玩命在努力工作。这时候,那个群里面的日志数量是会很多的,就是你一觉醒来,每个群里面都几十条、上百条信息,人的呃时间和精力就分不过来了。所以,其实,呃,不同的领域,它应该用用那个领域的最高效的方法,把那些冗余的信息去掉,把那些真正需要人类品鉴的信息。

抽出来让人来去看,这个肯定是一个独有的GUI。呃,我我举个例子,就是说将来开源开出这个版本啊,就这些都是我们在做的过程啊。等开源开出去的时候,呃,大家也就能感受到了。就你的每一个界面的这个GUI,你可以去自自己定义的。比如说闲论文有这么几种形式:第一个,同事给我一个PDF,PDF上面有一页这个图,我觉得有问题,或者这个公式有问题。

然后呢,我截个图放到群里面,然后写一段话上去,团队就看到了,是吧?所以这是一种交互模式。第二种交互模式就是用上一代的这个协作工具,就真正的高级的编辑器,就学术论文是 LaTeX。LaTeX 今天其实在线协作的一个办公系统叫 Overleaf,这个是全世界有两千万人在做的一个一个图形界面的一个软件,呃,也是一个 SaaS,线上写论文的,而且协作了写论文的。

那在这个界面上,其实大家还是每个工作人员自己在上面去改 LaTeX,旁边会渲染这,但是它的这个协协作现在也做的是非常非常差的。那如果这个你将来看到我的这个不用将来啊,待会儿你可以看,你看我的这个论文现在是怎么写的?就是实际上是从那个界面上你会看到它有一些界面跟 Olive 很像,也是一边是

LaTeX,一边是渲染出来的那个论文排版出来的那个,真的就是直接用 AI 打印的那个 PDF 的那个渲染的那个样子。

但是我可以在那个渲染出来的这个结果上直接去改公式、改图,而且是调着 AI

去改。是吧?我说这个公式现在要重新排版,那这个排版的过程就相当于润色嘛。idea是我的是吧?然后让AI的去帮我去去做去做优化,那这个过程的效率会非常非常高。但是这个界面一定是GUI的,它不是文字的。我最近其实有一个思考,就是说,其实人类的呃注意力机制是最适应图形界面的,就是AI最适应的是文字的,因为AI它的所有的input和output是线性的,但人类不是这样的。

就是现在我看着你看着我的过程是个视频。什么一堆的这个 pixels 哗就进来了,是不是?所以它本来就是高维的,是多模态的。所以,呃,人类其实从小一直都是在一个视频的环境里面训练出来的这样一个注意力机制。我们从小到大,你的知识百分之八九十其实是通过图形界面学到的,虽然不一定是那个电脑上图形界面,但是是真实世界的。

所以,其实我们的注意力其实一直是很习惯在呃视视视频里面的。呃,我自己小时候肯定也读了很多书,我也是一个爱读书的人。呃,我的家里面小朋友呢。呃,我家老大读书速度巨快,老二呢读书稍微慢一点儿。但是我后来就发现,这个我一开始其实没有那么想让小孩刷短视频,呃,这个抖音啊,这个短这个这个视频号呀,包括这个。呃,快手、B站,但我后来突然有一天想明白这事,我说可以刷是吧?

关键是你刷什么?我现在发现我家小朋友的很多的天文学的、物理学的、生命科学的知识,这些都不是我教的,我只教过数学。我在我家是数学老师,呃,就是这些知识,他很多东西都比我多得多。原因很简单,他是刷短视频刷出来的,但是AI它特别适合看文件,所以我们公司现在的一个标准工作方法是什么呢?就是我们人。用来品鉴的是按照人的注意力机制重新排版的一个PDF,呃,就是你会看到我公司里面有大量流传的各种各样PDF文件,大家可以传来传去的,呃,包括我写的论文,但凡是要灌给龙虾的,都转成一个MD文件,因为这两个中间差十倍。

就一般一个三四百K的一个PDF文件,它对应了一个MD文件是三四十K,这个时候它就会少占用龙虾的上上下文的窗口,让它效率稍微快快一点。那这是你们写论文这个场景。我再说一下这个数据分析、数据挖掘就好了。比如说,今天我们一起来共同研判一个数据,这个数据是放到一张表格的Excel里面的。这个时候你在文字的交互里面,你你觉得你说,哎,第五行第十个单元格这个数字有问题?

你觉得这个交互,你用文字版交互很方便吗?一点都不方便。因为你要说这么多的话,当然我现在也用 Typeless 是吧?那能稍微快一点,但是也快不到哪去,而且还会语音转写转错是吧?我一不注意会错,好,完了我这个指令也加错了,就又浪费一个头啃。我不知道你有没有遇到这个情况?我经常干这事儿,因为我现在是这个 Typeless 重度用户,我有大量的指令都是 Typeless 帮我输出出来的。

好,那你从另外一个角度,图形界面就非常简单。所以其实我们人类的大部分的交互,其实,在图形界面上都是效率更高的。所以这也引申了为什么我不知道大家有没有观察一个事儿啊,就是有一个榜单叫 OS World,其实是 GUI 的这个 CUA 榜单。这个榜单呢,其实我们去年是刷过这个榜的,曾经是在那个小模型是第一名,大模型其实我们用的也不是特别大的模型,就排在我们前面的都是尺寸比我们大很多的模型。

但是,呃,这个我们也是这个当时是第二名,现在是稍微往后一点了,因为后来我们没有去刷这个榜嘛。但实际上,我们有最新的成果,我是可以放上去,放上去它就可以变得更好。后面我会会会提交的啊,让大家知道一下我们的实真实实力。那这里面其实现在市场上有一个声音,就是 GUI 没了以后只剩下呃 API 或者说 CLI 这个 MCP,大家可能都都觉得现在有效率有点低了。

现在大家说又呼唤 CLI,就是命令行的这个这个复辟是吧?这个在我看来 GUI 永远都存在。我前两天在我的记课里面还讲了这个事儿,因为人需要 GUI。人不需要这个命令行,龙虾需要命令行。就举个例子,呃,你的刷抖音,你觉得它不是 GUI 吗?这个是吧?你你打游戏,它不是 GUI 吗?所以还是需要 GUI 的,包括我们日常人类需要操作的软件。

或者它有一个非常非常夸张的一个场景,假设有一天 AI 起义了,造反了,我们必须把 AI 下线了。这个时候我们人类就不工作了嘛?我们人类的办公场里面所有的软件就就只剩下 CLI 了,然后然后我们的人还有法工作吗?没法工作了呀,是不是?所以在我看来,就是我们一定要给人类的所有的软件同时留着 CLI 和 GUI。

但是这个 GUI 今天确实不一定是标准化的了。它是可以千人千面的,因为每个人都有自己的 web coding 的能力了。现在就是你带上 AI,所以所以其实每个人都可以基于自己的注意力机制、自己的喜好,就像看论文一样。其实我看论文,我就喜欢看里面的公式。然后有的人呢,可能喜欢看图,是吧?所以每个人的注意力机制不一样,他应该根据他自己的注意力机制设计他对应的那个 GUI。

但是GUI永远都存在。那这个OS World的这些榜单呢?实际上,它其实今天呢,他们的一个问题,它还是基于人类的现有的主要的呃一些软件,比如说Office呀,就Windows呀。呃,日日常的这样的一些软件,它来去做了一个 benchmark,但是将来其实这些软件,我刚刚不讲了吗?SaaS 软件都要完蛋了。

都陆陆续续都要下线了,是吧?GUI都要逐渐的被重构了,不是说没有GUI了,是吧?所以,所以我自己还有个观点,RPA这样的公司可能就完蛋了。嗯,流程自动化公司对RPA公司为什么完蛋了?是因为而现在的RPA其实都是在一个定死了的、固定下来的一个GUI上编排了,说我第一步在第几个这个就横纵坐标的位置上,在哪个位置上点一个按钮,哪个位置上点个input,就它其实是。

固定好了那个布局上面的这样的一个一个一个 layout 上面的这样的一个输入的一个自动化的过程,你想后面这个软件天天改,每天都要改一遍。那你想,你你想这玩意儿就没法用了呀!所以,所以这是个很大很大的风险,就是这这类公司真的是会出很大的问题。问题,AI生成GUI我是认为是一直需要的,人操作GUI也是需要的。

在我看来,就是上一代的这个软件啊,它要结合人和结合AI的两边都有生产力和品鉴能力这样的一个双工的这样的一个工作状态来去重新呃定义这个系统。所以,直观描述一下你们这个系统,就是它上面有很多人,有很多AI,也就是很多龙虾,嗯,然后。它根据具体的任务,它的那个界面就不一样,对吧?对,在在我看来,定制软件开发的市场仍然很大呀。

就相当于是说,我们肯定会开源一些我们已经觉得挺好的,我们自己用得好的方向了。因为我们做 research,所以我们要写论文,甚至我们做实验的系系统将来也可以开源。你像最近那个呃,A K 就开源了他那个这个叫 Auto Research 嘛,那个就很好,是吧?那就是我觉得将来大家都反正就是尽量能开源都开源,开源完了以后,我在后面我再去把我的这个模型啊,我的龙虾可以去做变现,是吧?

但是我也只代表了可能十个二十个。场景还有更多的场景,大家就自己去定制开发呀,然后我们再赚点定制开发的服务费,不挺好的吗?那你未来对这个 AI 协作它最后会怎么发展,你是怎么想的?因为你前面提到说其实你有是有一个中局的设想,嗯,包括你也提到像写微信像飞书,他们现在也是个平台,或者你也可以说它是一个壳,它可以接很多东西,它也有点像这种八爪鱼的感觉。

那你们自己来再做一个这个事情,和已经其实已经存在这些东西,比如它的区别或者竞争力是这样。首先呢,呃,存量的系统在我看来,如果不开源,肯定会出问题。因为别人就会复刻你,就复刻的那个人再把它开源就行了。复刻的有一个问题就是在于,比如说,呃,对用飞书或者用企业微信比较习惯的企业和组织来说,它迁移过来不是也需要成本吗?

比如我在那上面可能我已经有很多聊天记录,然后我的我已经加了一遍好友。这里面非常有意思,就是看未来的这个世界的博弈的结果了哈。所以我们要看迁移的成本和迁移的动力。这个迁移动力由什么决定呢?是由我的公司的利润,我的公司的存在会不会受到,比如说飞飞书的威胁?今天可能没有,大家就没什么迁移动力。我觉得今天无非就有的人会认为飞书太贵了啊。

啊,对。如果假设你就是你用不起飞书,那你肯定只能迁移了,是不是?是,就就可能就会出现这种情况。第二种情况就是说,飞书最开始可能他呃这个他收的钱也不多,因为飞书其实是亏损的。但有一天他给大家涨价,这件事情全世界所有软件公司,包括to C的互联网公司都在干这个事儿啊。那这个时候大家就有动力去签了,对不对?

嗯,这是你说的这个竞争和差异化的问题。是,那更长期来说,你觉得比如在一个组织里面,AI和人协作,它会是承载在一个什么系统上面?我觉得是这样,我我在公司内部是现在是这么讲的。我说大家人聊天呢,都还在企业微信里面去聊,然后呢用龙虾呢都在我的张鱼里面去用。为什么在张鱼里面用的时候呢,组织其实是可以帮你去做这个归因分析的。

将来我去基于它来去帮大家,第一个优化工作流程,第二个是帮大家去去做做这个我们的叫 attribution modeling,就是大家的贡献的归因。将来我们其实要在这儿来去,呃,用一个更现代化的、更好的机制来去分配利益。但是聊天呢,大家就不要再 Octo 了,因为 Octo 聊天全是透明的,说白了就是大家聊八卦呀、骂老板呀什么的。

你那你不在企微,在各位聊也很好,是吧?是吧?就这些信息还是就在这儿好了。然后然后或者你单独再 setup 一个自己的,反正张宇是开源的,我我们一个小团队也可以自己。自己这个布一个自己的这个章鱼是吧?那这个老板看不到的。所以至少对明略的团队来说,你觉得比如说章鱼还有之前已经存在且微信、飞书这些是都可以用,是补充的,相互补充的。

是相互补充的,而且还有一点就是,可能上一代也有很多,就像飞书文档,它做的很好,而且今天它已经开了 C R I 了,是不是?他开了 C R A 的话,那他就变成我的外挂了呀。我把它当成我的云存储,不很好吗?就相当于是我在这个网络里面让龙虾干活,龙虾干活的时候,它需要 context 的时候,它通过 C R A 的再到飞书里面去拿,不就行了嘛?

拿完了以后,在这儿跟我们的人去协作。那我觉得大家就是一个互补的网络,不是一个就完全拆台的网络。但是这里面还是我说了,最后由这些人到底过不过来,由飞书决定,不由我决定。为什么?就是看飞书将来涨不涨价。他如果不做这个事情,他就是一个好人,就不会搬家了。他就是一个很好的云服务厂商嘛,像飞书和且微信和钉钉,肯定他们也在 AI 转型嘛,就是他们自己官方现在你也可以是在里面去部署龙虾的。

你说飞书就有 Arclow,我觉得他要做 AI 转型,第一件事情先学我一样,先做开源,是不是?不开源都瞎扯。我觉得那个张一鸣是非常伟大的企业家,我相信他能想明白这些事情的。这个是创新者的窘境,那五六千名工程师在开源那瞬间,他们会怎么想?这是一个很大很大的问题。但是如果真要拥抱

AI,你如果真的拥抱AI,你就会知道闭源软件必死,就因为你认为那个软件本身的价值是几乎就就没有,就就特别重的软件还好,特别重的软件是因为,就像我刚刚算过,它可能历史上投资了一百个亿做成今天这个样子。

我我真的要做的跟他一模一样的,但我做的首先肯定跟他不一样,因为我是有我的新的世界观的。呃,就是如果一模一样的话,我 roughly 估一下,一个亿的 token 肯定可以搞定,是不是?然后一个亿的 token 能搞定。所以在我看来,就是如果就看这几个协作工具的话,可能相对企业微信更安全一些,因为它是有微信的这个关系链的。

但其他这几个平台,说实在,没有什么一定存在的。就是壁垒,但是他如果真的学我一样开源掉,那我觉得首先造福人类,第二个说明他真正懂AI。像你们比如说自己开发一个章鱼,然后你们把它开源,那长期来说做这件事儿的商业回报是什么?商业模式是什么?你靠AI赚钱呀。你不要靠软件赚钱,就是 AI 的一个最主要的商业模式,肯定还是卖 token 吧。

但是这个 token 呢,它其实有几种。第一种就是说基模的 token,第二种其实相当于是说它经过了你在对应的这个场景里面优化的模型。那这些模型其实比基模按道理它尺寸小,且在这个场景里面产生的结果可能还更好。比如说,就说刚刚 OS World 这个榜单上面的我们放的那个模型叫 Mano,就是手。我们其实是可以给任何一个场景的对应的那些软件做一个单独的 Tailor Made 优化的。

呃,比如说,我们最开始做的第一个小的版本,就是给出海电商所要操作的所有软件,我对这些软件的操作,我能做到百分之九十九点九的准确率。那这件事情它的意义是什么?你去看 OS World,今天榜上第一名也只有七十分,七十分你敢用吗?操作你的软件十次错三次,做数据分析,做战略决策,是吧?所以所以所以本质上来讲的话,其实那个分数没有意义,它只是说你谁有能力训模型,只是能 show off 这件事情而已。

那我们其实要做的事情什么呢?我到某一个场景里面,我能不能一个礼拜把这个场景的最核心的软件都做到很准确的使用,很准确的操作?这个分数一定要非常非常高才行。然后,那这个时候他就可以去投入生产了。他且模型 size 又很小,那这个时候其实我仍然可以卖模型。那长期来说,这个事儿能持续吗?因为你们服务的那个场景,就比如说出海,嗯,它现在可能是有几个比较主流的软件,然后还有一个固定的交互界面,对吧?

那按照刚才你的逻辑,其实过了一段,非常好,这个这个软件就变了。你问到了一个极其深刻的问题了,在这个 GUI 操作,就是我们管叫 GUI VLA 模型这个赛道里面,其实我在公司内部做过一个。非常 messy

的一个分情况讨论的,呃,我们可以把软件分成两种情况,一种叫高频软件,一种叫低频软件。那当然,这个高频也是打引号的,就是它也对于我们的通通用白领的技能的高频软件,比如说

Office,也有一些可能是只是某一个领域的高频软件,比如说我们秒针就是在广告行业的高频软件,那个行业就这个行业的这同学们都要用的,是不是?

高频软件里面首先也分为两种情况,第一种情况是被你操作的软件想被你集成。和被你操作软件不想被你集成的,所以被你操作的软件想被你集成的,大概率将来都会变成 CLI,是不是?它就命令行接口开给你就行了,它就不需要 GUI 了。但人还是需要啊,人还需要。那第二种情况是什么呢?就是不想被你操作的,不想被你操作的情况就是豆包手机、微信显然不想被自己操操作,是不是?

那那最后就变成攻防战了,是吧?最后就变成一个伦理的问题了,就是将来社会制度的问题了。说云母群能这么干,是不是?那这个事儿我们先不考虑,再看低频,低频软件其实是未来。为什么?因为在我看来,大量的软件将来都是 tailor made。所以实际上,呃,GUI VLA 模型的第一大场景真的不是自动化去做那个操作本身,第一大场景是什么?

是自动软件测试。你如果去观察一下,好像是两个月还是三个月前,Ansorapek 刚刚收购了一家。呃,类似我们这样的公司,就是做 G G I V L A 的这个一个小公司,一个创业公司。那他为什么要收?以及他今天每天在发榜的时候,包括 Open A I 最近在发榜的时候,都会讲 O S World。你这不就是一个矛盾吗?

大家都说 G G I 没了,那结果还有几模公司天天刷这个榜。我觉得大家都不是傻子呀,是不是?怎么可能呢?其实在我看来,真正的机会其实是给写代码的工程师用的,就是因为因为我仍然需要给人类做 GUI 的软件,我写了 GUI 的软件还都是定制化的。这个时候,其实我要用一个模型当场去做测试的闭环。我我不知道你们有没有用 C C 写过代码?

C C 写一个命令行的代码是非常简单的,就是如果你的输出是 console,就标准的这个呃控制台输出,这输出这个结果,它如果是个标准输出的话,它直接就可以以文件的形式给到这个,或者以标准输出的形式给到 C C, C C 拿了以后,它马上就知道你的这个结果对不对。如果对的话,它就 release 了。

如果是错的,它就会去 debug,它就一个闭环,是在你的电脑上的一个闭环。好,今天如果用 C C 写代码,最大的 bug 是什么?会遇到一些问题,就是涉及到 GUI 的时候。所以 C C 其实它也是 Anthropic 它自己也做多多动态模型,是去操作这个就是 Playwright 浏览器,就自浏览器自动播放,浏览器自动播放的最主要的场景,真的不是大家看到什么 Manas 那些那些场景。

浏览器自动操作场景是软件测试,是我在用C C写代码的时候写出一个图形界面,写完了以后我要在那儿测,测完了以后发现有问题再回来。所以它那个多模态理解去理解是我 tailor made 的一个软件做的好不好?这个就是我说的低频这件事情,其实我们肯定是在持续卷的。就就回到就是最近像那个腾讯去的那个姚顺宇是吧?

呃,姚顺宇他发了一个榜叫 C L Bench 嘛,其实他就在讲的也是一样道理。他说以前的基模都是顺行性失忆症,那今天呢,其实他考大家的其实你的学习能力,context learning 或或者他本身也是 kind of 这个持续学习,就相当于是说,呃,他考大家的题目是什么呢?就是说这这里面的每一道题呢,都不是正常的人原来的知识。

比如说,一个礼拜有三天,一年有十个月,然后呢,在这种情况下,我再给你一些条件,然后怎么去做推理?那其实本质上来讲,我刚刚讲的那个定制化软件开发也是一样的道理。它也是 context learning,就相当于是说,我今天要做一个软件是你从来都没见过的,我给你提的需求,然后你来帮我去想这个软件的界面是什么样子,然后你来帮我做测试。

就今天市场大家去看到的那个什么 OS World 也好,Man to Web 也好,那些软件都是人类已经有的软件了。所以你在那个地方Benchmark差不多就行了,你你搞到九十九也没啥用,就我刚刚讲的高频的软件,你要么就是,是吧?大家想被你集成的都开命令行,要么就是不想被你集成的,跟你没什么关系,是吧?

或者说或者说别人就会把你停掉,是吧?别人封掉你。那低频的软件才是我觉得未来,低频软件其实就跟那个 C L Bench 是很像的。所以,我们公司将来大家会去看,陆陆续续会去看啊。但凡是这种性质的榜单,我们将来的目标,说现在我还没有完全做到啊。等到呃,假以时日。肯定不会时间很长。这些榜单上,我们的目标都是拿第一名,每个榜都是第一名。

你刚刚说的这两种,就从模型上赚钱的方式,一个是你这第三方的基模,然后那我理解就是有点溢价,对吧?收点溢价。然后另一种就是你自己的模型,然后你去赚钱。你希望它未来以哪一种为主?每个公司能赚到钱,它一定是要符合你给这个上下游创造的价值来决定。那如果你只是作为一个基模的一个 router,那你其实干的事儿跟这个什么硅基流动啊、 P P I O 啊这些公司都差不多。

所以其实这个它的价值是体现在可能你要保证它的稳定性啊,呃,保证就是帮客户及时找到市场上干你这个事儿效率最高的基模的那个那个 A P I,是吧?推理优化吧,推理优化那就还是要加载自己的模型才行。就是有很多人他是连模型都不是加载的,只是做一个 API 的一个转转接的一个 gateway 是吧?所以所以这是一种情况。

那呃,但是你更理想的就是在金融上赚钱的模式。还是在你的这个业务场景有你独有的 skills 和你的这个 context。我举个最简单的例子,比如说,呃,我们的这个学术论文的领域的这样的一个场景,这个场景其实大家如果今天你直接用去,呃,用这个 anthropic,呃,来去做学术论文的优化,那当然可以了。

但是,但是它没有什么 context,没有呃学术论文库里面的论文呀。嗯,所以所以其实如果比如你做一个龙虾的服务,这里面有学术论文的库,是吧?当然这论文库也要解决版权的问题,是不是?那你要去接各种各样的这个版权,然后你可以跟他分账了,是不是?呃,然后你再去接这个基模,这时候在基模的分发上,本身你就可以赚一个不小的差价了,因为这个差价是由你来把 context 和基模组合到一起的独特的价值来去赚的。

然后本质上来讲,是你帮那些 context 那些 owner,呃,变现了,你也帮基模变现了,是吧?因为你创造了一个更大的 value,所以这是基模的情况。那第二种情况就是说,这个场景我对这个场景假设超级熟悉,我对这个场景真正独有的 benchmark 比基模建的好,就基模自己肯定建了一个 moe 的

benchmark,我在这个场景建了更好的 benchmark,就像我刚刚举的那个 manual 操作某个特定领域的软件的这个逻辑。

那这个时候其实我一定就去 serve 我的模型了。当我摄入我的模型的时候,那我的效率是高的,那我中间的这个这个毛利就更高了,是吧?所以,所所以所以就是相当于是说,它会有两种不同的情况,你要么就变成了一个别人家的模型 token 的分发商,但是分发的过程中,你还是要持续搞清楚你的 value 是怎么创造出来的,你不能简单的就只是呃做个路由而已。

呃,这个,然后,然后第二个其实就是,呃,但是开源模型的 server 去做优化推理,那肯定也是一种方法了。但是,呃,据我了解啊,呃,这个做做做这个路由的这些公司,其实它的第一大收入来源也不是 server 自己的开源模型。呃,这个上面做推理优化,其实仍然是只是只是做一个转接,因为那些最好的模型没开源呀。

所以对你们来说,肯定以后就你们把自己的模型。这一部分做的 serve 的量更大,你们的利润空间以及我们要去不断的 explore 更多的 context,就拿我刚刚讲学术论文库一样道理。对,有一种就是你的 context 和基模的组合,还有一种就是你们自己的模型。对我们自己模型也可以跟我们自己的 context 组合。

你觉得这个是东西什么时候它能盈利?其实现在整个行业,嗯,当然就整个投分消耗量非常大,嗯,但亏损也是就跟着上上。盈利其实是跟竞争相关,但是更大的关系还是你最后 create 的 value 有多大。所以,我我觉得就是,呃,AI 行业迎来盈利的拐点,可能就是这一两年了。在这个 Cloud 出现之前,没有持续学习能力,其实 AI 是很傻、很傻的,就傻到爆了。

呃,就是会用的人要花很大的精力才有可能把那些 context 给搞过来,然后才能把它用好。这个成本就不如他自己干活了。但有了 Cloud 以后,我觉得在很多很多的场景,很快就是 AI 就可以创造一个不小的价值。那当然,今天还有一个很大的痛点是说,现在那个 Token 的成本还是有点贵。但是这个摩尔定律是吧?

在模型领域的摩尔定律其实是更 crazy 的,一定会很低很低的。嗯,你们自己开发了章鱼,你们自己内部也在用,用了这一段时间之后,比如说你们一周的 Token 花费是多少?我刚才讲的就是我最核心的这个这个团队现在是一天几万美金嘛?开发其实是消耗 Token

最大的一个部门。我举个例子,比如我作为CEO,我不亲自写一线代码了,就相当于是说,呃,我可能会调其他公司同事的龙虾来去写代码,但是他没算到我的头上。

作为CEO嘛,这个包括你作为CTO,其实干的还是偏管理类的活多一些。那这些其实我已经算是龙虾的一个重度用户的话,我大概一个周是五千米。因为我主要是想比较一下,比如说现在一个企业订阅飞书,它其实是有个费用嘛?AI 的成本远远高于云的成本,一定是的。但是,呃,我我还说了,但如果但凡是对 AI 的中局有思考的。

软件公司都应该明白一件事情,就是靠软件 license fee 是赚不着钱的。云本身,你作为一个 infra service provider 是肯定是可以的。飞书也好,企业微信也好,这个公司长期能赚的,其实应该是它作为一个云厂商给你 serve 这块赚的这个服务商赚赚了一个钱。那个软件本身不要想着去赚 license。

对,我想的是从客户的角度,他怎么去比较这两种东西?那就是 Y 六了。我作为公司的 CEO,我一一个周用五千美金,我就觉得挺便宜的。嗯,因为你能干很多事儿。我现在生产力爆表啊!我现在同时干太多事儿了。我想我这个,因为我我自己用也要续费的嘛。然后就是,当然就是我们有个网关,最近我们也在研发一个,就是公司内的这个 token 的这个这个预算管理系统。

就是我们是 token free 的,但是就是大家还是要告诉组织你在用 token 干什么是吧?就所以大家要填报你的 BP。我那天续费的时候,我一看,哦,我两个周用了一万美金。这时候我说啊,怎么这么便宜?我说我觉得我这两个周怎么着给公司创造了十个亿的价值吧?我我真心的,我不是吹牛,我觉得我这两个周就是怎么着给公司创造了十个亿的价值。

那我才花了一万美金,这算啥了?所以我觉得还是看谁去用,就是你要你要创造一个很大很大的价值。然后呢?如果你今天创造一个很大的价值的时候呢,其实你也不会 care 那个成本、投很成本。然后,如果你创造价值小的时候,你就天天要去算那个小账了。对我们前面讨论了,就是比如说和比较大的公司,像飞书啊、企业微信,他们也在加这个之间,就你们现在做这个事儿的差异化。

另一方面,可能也会有一些特别小的团队,比如他们从头就来干一个你们在做的这个协作这个事儿啊,包括你们自己其实也没花多少人在没花多少人、花不了多钱啊,来做这个事情啊。你觉得如果你们来做呃章鱼这个系统,它和那种更轻更小的公司之间,你们会竞争过他们吗?我觉得是这样啊。首先,最近有一个说法叫O P C是吧?叫One One Person Company是吧?

我不是特别认同O P C这个概念的。我我认认同T P C就三个人。为什么呢?因为我觉得一个人最好一天还就是工作八个小时。但是呢,就是但凡是用了龙虾的,用的特别狠的人,最近睡觉真的都不太好。为什么?因为他的工作效率太高了。就像我这种属于特别能想,之前行动力不强的人,想象力很丰富,那那跟世界互动肯定就会有一点障碍的人。

其实今天有了龙虾会好很多,因为如果一旦你的龙虾武装了非常多的工具,而且公司的很多人的龙虾我都可以调用了,你想,那我的这个执行力是爆表的,对不对?因为因为我有想法,他们就马上就可以干。但是这里面最可怕的是,他们干的太快了,使得我根本就没法睡觉。就是我想出一个idea,一回车,十分钟之后好了,然后然后然后我又想出一个idea,十分钟又好了。

这时候你真的就不想睡觉了。所以其实我的手机现在为什么一定要要求我们的团队给我增加上这个呃 tailor made 这个个性化的呃 ASR 的能力?就现在 tablets 其实也有很多的问题啊, tablets 也是那个顺行性失忆症的那个。那个这个这个这个问题,我们其实自己在呃也在研发一个持续学习的这个ASR,对你就会发现真的是吧,能给你个性化。

就我们公司很多会议的那种撰写都是错的。就那龙虾,有的时候翻译成龙虾是吧?这这个这个,然后这个这个,我我我有个同事叫赵程序,我叫他程序,然后经常翻译成程序。然后等到我真的要写程序的时候,又给我搞成程序了。然后然后我这这这问题多了去了,是吧?所以其实现在基模问非常问题非常非常的多,然后有太多的可以解决的问题了。

然后这个呃,我为什么说一定要有这个语音转写的这个这个,尤其在手机端的这个好的能力啊?你看那个微信最近不也也也也也也超了这个,他们也是做了这个用化的这个服务嘛?呃,实际上他就可以让我睡觉的时候也干活。我我真的我现在是,比如说我十二点多躺在床上了,但你知道吗?我十一点多其实肯定是在做工作的,然后我十二点多那个龙虾大概率活肯定干完了。

然后我就忍不住,我要跟他再说一会儿。我说来来来,这个问题怎么怎么弄?那你想,你还能睡得着觉吗?很难睡得着觉。所以我觉得 OPC 不是特别靠谱,我觉得 TPC 可能稍微好一点。就是什么?就是说最好是在全世界三个不同的时区,有三个人覆盖二十四小时,就是大家有点像那以前的三班倒。以前三班倒,大家都要在一个工厂里面,是不是三班倒?

现在不用。是吧?我在美美国有个朋友,我在欧洲有个朋友,大家覆盖三个时区,然后就好办了。这个时候我睡觉了,我说:“哎,兄弟,这个该你了啊,你你来上班了,你来继续推着这个楼价往前干。”他他来睡觉了,然后第三个时区也来了。我觉得这样的话工作效率会非常非常高。我觉得三个人就是很好的,当然其实可能还有很多周边的活,五个人、十个人都行。

我觉得一个人应该是不太靠谱的。那我们的组织虽然你现在看我整个公司一千八百人,但是我可能就是有一百个这样的团队的呀。所以所以所以没问题啊,我我我我现在是老的业务,你就反而往前做就行了。新的业务,我对于对于我来讲,我就是一个懂AI的投资公司。哦,所以回到我刚刚说的那个问题,就是你你你的答案其实是说,你不是一个人数很多的组织,是,你是一个嗯很多小团队组。

组合在一起,对。然后我我其实是在孵化不同的产品方向,是的,是的。包括你刚刚说的什么写论文的那个一个复刻了 Overleaf 的东西,对,或者说有点像一个协作版的飞书的,但里面有很多龙虾的这个章鱼,是都是你们孵化的新的东西,是是是。那你觉得到了这个形态之后,明略会变成一个什么公司了?比如说你以前我们如果说一句话啊,那肯定能说明略是一个。

比如说营销领域的数据智能的提供商,对我们以前叫 Data Intelligence,就是帮客户提供数据分析、数据挖掘、数据智能的服务的。呃,在广告和零售领域,这是以前我们去描述公司。是因为你现在做的这些事儿,我觉得跟你们之前行业有些可能是重合,比如说 Deep Miner,它还是一个。营销和广告领域的,但是像章鱼,它看起来是一个比较对通用。

现在如果去看我们的这个新的业绩发布会的时候,我就给大家讲了,我说两块,Data Intelligence 还干,但是我在干的过程当中,我磨刀产生了我的 Deep Miner 以及现在的 Octo,那这些的我们就要称之为 Agentic AI 的产品。那我的收费模式是 Agentic Service,就 Agentic Service 就是在不同的板块去去去去收费。

那在我看来啊。就是呃,今天我这句话可能说的也有点大。其实可能我们的这种在办公室的白领的工作者,就知识工作者,长期来讲,可能都要变成科学家。就是科学家AI是替代不了的,因为科的科学家跟AI一个蛮大的区别是什么呢?AI是基于现有的存量的逻辑在上面去做推理。用我的新的哲学系统,我管这个叫think。就是就是那个我思过在里面的那个 think,然后呃,其实科学家大家都觉得科学家很动脑子,是不是?

但其实科学家真正它的核心是它的 taste,就是我想要什么,我喜欢什么,我觉得什么是什,我觉得什么是对的啊。Taste 和 think 最大的区别就是 think 是基于一个确定性的呃一个 premise,一个一个一个第一性来去做确定性的推理。那这个事儿其实一定会被 AI 替代掉。但是,Taste 是什么呢?

Taste 其实是基于我的人生经验,我的阅历是很难用规则来描述的。就是我想要什么,我基于这个东西来去作为一个第一性,往后去做推理。所以这个时候 AI 是无法替代我的。所以你的意思就是,知识工作者都要变成有更多主动性、更多自己的想法,明确自己想要什么,然后让 AI 去执行。对,科学家的本质就是这样。就是其实你看啊,爱因斯坦其实他在解决这个智能方程。

狭义相对论,包括他去研究广义相对论,他想去解决统一场论,都是他的 taste,就是他想要这个东西,没有人能证明的,是不是?是他想要,他也不知道能不能证明出来。其实,其实我觉得这就是真正的科学发现的人在做的事情,就相当于是你在做的是一个新的东西,是AI偷偷的不知道的东西。那在这块业务上,你们的行业属性就变得比较弱了。

最后肯定是通用的。那现在你们第一个阶段,因为你前面也说了,就是你说我如果要从模型上赚钱的话,你得想清楚我有什么样的上下文可以和模型结合来给客户提供独特的价值。在我看来呢,它其实有两个点。第一个点就是我的就是 legacy,就是我的存量的广告营销零售。其实我在这个领域里面,其实有个非常好的基本盘。第二个,我的很重要很重要一个legacy是我的客户的网络以及我现有的团队。

就我刚刚前面讲的,我的团队是懂客户这个行业的,我的客户更懂这个行业。不是,那我其实一定要赋能他们去做更大的事儿吧,是吧?这就是我在 B to B 这个领域一定要去好好做的事情。你们的客户是不是呃是偏这种就 B to C 的客户多?对,是的。先把他们都用好,然后呢,呃,那另外一方面呢,我不管是我的章鱼的开源,还是未来陆续开源更多的一些板块,我在在我看来,现在是一个大航海时代,就是都是蓝海。

就是那那当然,我觉得也不可能全世界所有事儿都我干,是吧?我先干它一部分,那这些部分其实我一定就会拓展到更多的一些新的 vertical 的领域,新的 vertical。那这个领域我进去的第一天,像像我刚刚讲的是这么一个蓝海的状态。那那肯定,我在这里面也很快会积积累我的这些资源的。你现在在组织里实践的就张宇这个系统和这种协作方式,你有和其他的企业家朋友交流吗?

包括你们的一些客户的创始人。我首先是这样,我们原来服务的客户大部分都是那些五百强,呃,他们会相对慢一点。但是不是说他们不拥抱?其实大家都很焦虑。这一两个月吧,陆陆续续还会跟一些这种世界五百强企业的 global 的 CEO

去做交流。我我我可能会跟他们去分享我对未来的这个世界的一些思考。我相信,呃,我的新的这个哲学观应该是会能打动不少人的,因为我的这个哲学观它有一个最大的好处,就是说它站在那些今天看起来被 AI 欺负的那些人的。

哪一面?这个哲学观点可以完整描述一下。你刚才其实说了,其实好好多点哦。就在我看来,就是说我们的基础大模型公司把模型训练的一直从这个 scaling up 的这个逻辑上训得越来越大,而且是个黑盒子。真的,那个 researcher 自己其实也只能通过做实验猜那个模型在干嘛了,根本就没有能力搞清楚。我认为这个事儿是对人类非常不友好的,而且 finally 会把整个世界的经济搞崩。

所有人都失业,就是就是我我有一个朋友在某个大模型厂商,他是一个非常非常大的一个高管,他就告诉我说:“明辉,我就眼睁睁的看着,呃,我手下的人的活其实AI也能干。那今天我的工资肯定很高,大家都知道大模型的人现在工资很高,是吧?”他说呢,他说我有可能就是吃到最后一口肉的那个人,但是但最后最后我也要下岗。那你想这个世界肯定不对呀?

这个世界这样下去肯定不对呀,是不是?那全世界现在所有的人都在被本质上都在被AI欺负,是吧?我就我们凭什么让少数的几个人掌握全全人类的这个命运?少数的那么几台服务器,所以所以所以,我觉得这个是不符合人类文明发展的趋势的。我们人类发文明发展的趋势应该是规模训到今天这个水平就OK了,就是个体的智商发展到这个水平OK了。

那接下来我们应该做的是scaling out,scaling out就是横向发展,就是形成集体学习。形成呃组织智慧,而且这个组织智慧应该要保护在每一个个体身上,或者保护在每一个小的创业团队身上,使得他们能够保护自己的知识产权。他利用自己手头的AI和他的对于这个行业的独有的洞察,能做出比基模在这个场景上更牛的结果,且不会被基模拿走。

我觉得就这件事情,其实是我的motivation,就是我不管是做我的哲学系统,我为什么要研究伦理学?我在研发我的这个AI的算法,其实我是朝这个方向去推动。但是今天我的很多实验还没做完,呃,我在我相信在未来半年里面陆陆续续会发出去。呃,我自己本身也在准备一篇Nature的论文。如果我做完的话,我觉得这这个工作肯定是能发在Nature上的。

所以,所以这是这是我的一个理想吧。你说基模的水平到今天就OK了,你是实指对吧?就说现在的大模型就已经OK了,已经到这个阶段,不需要再再做单个更聪明的了。哎,那你同意有一种想法吗?因为有很多人会认为,比如说我没出现一个更聪明的模型的时候,我确实不知道我要用它干嘛。但出现之后,它就是自然,它就有了更多用处。

不是我的意思是说,我可以造出更聪明的,但不是 scaling up,就不是通过 scaling up 的方式,就是通过系统和多个模型合作的方式,对多模型多 agent 的合作,它能创造出更大的智。呃,而且在人类或者说在生命的发展史上是有的呀,就是我们人类里面,我们的这支现在这支叫现代智人嘛,当年就打败了这个尼安德特人。

尼安尼安德特人他在个体的能力是超过。单个人的,但是我们人类是可以协作的呀,就是只不过人类的协作其实也很低效。但是我今天能不能拉着张宇把人类的协作变得更好,是吧?人类和龙虾的协作变得更好,使得我单个龙虾就今天这个水平就行了。但是它能产生一个比下一代的。Anthropic 和 OpenAI 单个的那个能力很强的,在我这个细分赛道的这样的一个效果,呃,这是我现在正在实验的事情。

但我我我就正好前两天也听了你的播客,当时呃,就是应该应该是你跟那个亨瑞做了一个交流嘛,他讲了一个词儿,我听完以后特别开心。我说,哎,这个特别符合我的这个说法,这一个叫穷人版是吧?穷人版的这个训练模式,一个是富人版的,就是我们公司相比于基模公司肯定算是穷人是吧?我相对于小公司算是富人,但是小公司压根想都不敢想训练模型。

但是我作为一个是吧科班学AI的有很深厚数学功底的人,我就觉得这个是不对的,是吧?我们肯定应该要寻寻找好的模型,且应该保护人类的这个安全,这个,所以所以这个其实是呃,就是我去推动所有的这个事儿的那个第一性。那我觉得这个第一性呢,它也没有对与错,是不是?就看大家信不信。那我相信一定会有很多人。信的,至少我们公司的人是信的。

最近马上 OpenAI 要发 GPT6,嗯,然后他们公司的高管也是提前就是在外面放话说这个东西特别特别厉害,嗯,然后 Anthropic 也是发了新的模型 Mixos,你觉得这个会影响你的判断吗?不影响啊,就是他就继续做呗。在我看来,我一定能做出比他好的。就是,但是我我跟他的这个这个这个 approach 完全不一样,完全不一样。

就是,而且我相信最后就是更广泛的人民群众应该是站在我这面的。可以讲讲,就你们除了比如说有些之前的模型,接下来会去跟谁还有什么新的计划吗?嗯,首先是我们短期还不准备训训大型的基模啊,但我们有小型的基模,比如说 Mano 现在已经是从预训练就开始是自己做的了。因为我们确实在这个领域攒的数据量也比较大了,而且后面我们还会开源一个 B U A 的一个数据集,应该估计是将来市场上最大的数据集。

呃,叫 Web Retriever。实际上,我们感觉就是做垂直行业的呃场景的时候呢,其实多模态模型首先是最关键的,因为因为文字的部分大部分真的都被记录了,只要被记录,就很容易。呃,被金矿公司都拿走了,但是在各个垂直赛道里面,就像我们做广告理解呀,呃,这包括医学影像啊,这些其实还是有非常非常多的机会的。

所以其实我们一直在呃推的也是多模态的能力。我们这个 Mano 其实最一开始的一个 purpose,其实就是想呃我们自己的原来的这些业务能够自动化去做,是吧?但做的这个过程中呢,就发现了一个很大的问题,就是说好像它没有 RPA 好用。就是RPA呢,其实首先不不消耗那么多的token的钱,第二个呢还快,是吧?

就是多模态理解,其实你要不断的去理解这个桌面发生了什么事儿,然后再去去去去做操作。然后还有个就是它那个准确性,其实多多少还是有问题的。就像现在那OS Work那个榜单就不行。所以在做这过程中,我其实一直在对这个战略和这个AI的这个方向做一些思考。呃,首先呢,基模公司为什么一直在做这个事儿?当时我就没想明白。

你看,寂寞公司也还是在卷,而且这个东西其实没啥用。其实我真正这些事儿都想明白了,最后其实是我自己亲自亲自在用 C C 写代码的时候才感受到,哦,原来 C C 需要这个东西。就是我写代码的时候,一旦写出一个 G U I,那最好是我 C C 就能够知道它的测试的情况。那这个过程中,他需要对 G U I U 有个理解,是吧?

闭环回来。那在这个过程中,其实我逐渐理解了,说呃,基模的这些榜单确实用处不是很大,它只是向资本市场证明我有模性能力而已。那真正其实我们在行业里面要去呃。就是工作的方向其实是持续学习能力,就相当于是说你能不能做出一个模型,能快速进到这个战场去,把你的这个战场的竞争对手打打败。所以这个事儿其实我是在呃去年逐渐的去搞清楚了,我们的团队就开始转向往这个方向去做研究了。

所以呃大家后面如果能看到我们一些呃小模型也是刷榜,那刷得很好。那其实我们的一个呃工作的一个方式呢,其实是我用统一的方法。把所有的榜都刷到第一名,这个方法是什么可以透露吗?我最新的那个方法其实还这个应该不会去讲啊。但是我这个已经可以开源的方法是这个呃这个方法也不是我完全原创的,其实它是借鉴了对抗神经网络或者叫对抗生成网络是吧?

干,实际上它其实是呃就是我们呃生成一个图是吧?鉴别一个图是假的是吧?他们之间去做在做博弈。那实际上你可以想,比如说呃,Mano如果做一个网站这边。呃,去操作一个网站,他俩之间也可以博弈了,对不对?这个博弈的过程是非常非常有意思的,就是一个一个模型越来做一个网站,他就不想让你。好好操作,然后这边呢,其实我这个模型呢,Mano这模型呢,它就得想学会怎么操作,所以这个我们我们现在暂时叫它这个双向强化学习。

这个行业里面好像现在没有一个标准的一个术语啊。你这里定义的这个持续学习,因为我觉得就是大家可能就在学术上追求的比较前沿的持续学习,嗯,就是一个自己能更新自己的权重的模型。呃,这个是特别好,你不要去想学术的 purpose,你要去想商业的 purpose 是什么?就是我们今天的这个现在的模型呢,它是出厂之后不能更新自己的参数了,对不对?

但是它出厂之后,假设能更新参数,这也很可怕,这是个商业问题了。如果出厂之后它可以每天在被使用的过程中再更新参数,意味着什么?意味着那那些 centralized 的 AI 公司知道全世界所有人的秘密。其实它也存在一个,就是它到底哪些更新,哪些不更新?对对对,但是那你能保证它的伦理道德,呃,它的商业利益跟你没有冲突吗?

算力消耗都不用说了,所以,我我现在说的这个持续学习,我想做的是 personalized 的持续学习。也就是在具体的细分场景,甚至就服你这一个人。举个例子,今天,呃,我们刚刚说到了用 Tableless。做呃这个个性化的ASR转写,你会发现他们其实已经做的不错了,仍然还有很多的问题。对它其实是,比如它会记你的一些常用词,记你的年轻人的名字。

对对,有点像搜索输入法。是是是。然后苹果也在尝试做这个事儿。要想做好这个事儿,其实挺难的啊。所以今天如果真正呃personalized AI要想用好的话,它都不仅仅是是要知道我的历史的信息,还要知道我当前的context,就是我基于这个context来去做决策。呃,比如说,我其实没有在海外留学过,我呢英语还OK,就是做英文演讲是都是OK的,但是就是我们的中国的那种考试听力题听不明白。

但你真的去国外旅游,比如说你去到那个一个酒店,然后你要 check in 是吧?那你马上脑子里面有些词儿你都已经知道了是吧?check in 是吧?breakfast room rate 是吧?这个就就就他提到这东西,马上就是你自动就转写了,是不是?你自动就转写了,就是你你大差不差,就是你的那个候选词不会很多的。

这个 context window 你要知道,甚至它都不是以人为单位的,它是以你当前的状态为为单位的。所以,所以这个才是我说的真正的持续需要解决的问题,就是首先它能够持续的去迭代你的这些历史的信息,成为你真正了解你的一个AI。第二个,它还要能够接受当前你的context的信息,这样的话才能真正做出了最有帮助你的这样的可能的这个。

呃,不管是呃 translation 啊,还是这个这个 ASR 啊,就这些其实都是需要呃这个能力的。所以其实我们现在是在卷的是这个方向。然后你说的这个方向有这个能力的模型,它是一个有别于你们之前发过的 Melo 和 Seto 的一个新的模型,是训练和学习的范式是新的。对模型本身都是一样,都是一堆参数嘛,无非是你调参数的方法是什么,以及你你要不要带上 agent 来一起去做。

我觉得 OpenCLow 就是给大家一个非常非常好的一个示范,你不一定全部都是在模型里面全部搞,就是模型里面放的东西有可能是那些不希望被明文的东西。比如说伦理道德的东西,呃,这些东西都是暗默的,然后它也不能被随便篡改的,因为模型确实对于绝大多数人来讲是一个黑盒子,它也不可被篡改,所以所以这些东西可以放在模型里面了。

你还有一些东西应该是放在 memory 里面的,就应该让大家都看,甚至大家可以直接上去 hard code 去改的。呃,所所以这个其实就是我讲的这个持续学习,它已经首先我们自己是可以去训前面这个模型的,这个我们也在持续做,而且我们也会去扔出去一些开源模型。但是更大的一个框架其实是模型加 agent 一起去做这个,我们今天叫 agentic RL,这个就是所谓的那个穷人版的这个持续学习。

可以透露一下你们接下来会有什么新的模型?它其实你可以理解所有类型的都会有,包括这个 ASR 的,我们可能也会有。然后这个这个这个语言的编码的都有。呃,但是呢,我还是说了,其实我们在这些上面我们做的很好,并不是说我就要去卷规模的那个赛道了,而是我是想让大家知道明略是一个做模型的公司。我们不是一个只是去做 application 的公司,那我们是有自己的训练的方法的,我们有自己的范式的。

那这个范式最后我想应用的场景,不是去提供一个规模的服务,而是在我们所在的赛道里面,帮我们这个赛道的那个客户做得更好,或者说我们自己就在那赛道里面做 agentic service。你看前两天我去过一趟美图,美图现在的其实是一个严重被低估的公司,呃,人家去年有九个亿的利润,结果才两百亿的市值,我看了一下。

但其实他们的真正的收入是来自于 token 的收入的。我觉得它是个很好的公司。我听了那个吴兴红的分享,我自己还是很受触动的。我觉得将来应该会有越来越多的这样的公司出现,只不过就是说他们只是在一个赛道去做。我现在其实是一个更通用的一个场景,就相当于是说,尤其是我的 octo 出出去之后,一定会有很多很多不同的场景,呃,需要人类协作机器去创作的这样的一些场景会涌现出来。

一旦涌现出来,我就能在那个场景做最好的模。我在那个模型赛道里面,我就可以赚我的 agentic service 的那个 token

的收入,所以这是我们现在的一个工作方法了。呃,发生了什么事儿之后,可以说验证了你现在的这个判断?我觉得第一件事情就是说,首先在商业上,大家是要能看到说,呃,未来的几年里面有没有人,包括我们公司能用这种方法能够在商业上取得成功,规模的收入的增长啊,盈利啊,这这是这是比较世俗的这个判断标准了。

但我觉得真正好的判断标准是科学发现能力。就像呃,就是不管是 OpenAI、Anthropic 好像不不怎么做这个事儿啊。OpenAI 和这个谷歌他们都其实是有非常多的人在做 AI for science。然后其实我刚刚表达的这个观点,你也能感受到,其实我是在做 AI for science

的。只不过就 AI for science,因为 science 有非常多的不同的 subjects,就说我其实可以做 AI for AI,我也可以做 AI for math,我也可以 for 这个做做什么 AI for energy,是吧?

其实其实我们在很多领域,其实我现在是在思考和布局的,将来大家会陆续看到一些工作成果的。所以。呃,什么时候大家可以看到我们在 AI 和 SaaS 领域上取得了一些呃,谷歌也好,Open 也好,他们都没有取得的成果?举个举个例子啊,我瞎吹一个牛啊!举个例子,有一天我解决哥巴哥德巴赫猜想了,那你觉得我牛不牛?

是是,我我我拉了几个臭皮匠解决了哥德巴赫猜想,是不是?那我我我号称是北大黄金一代数学系的这个同学,我的那几个同学,在我看来。首先,个顶个都很聪明,人类的智慧的,是吧?就是天花板的那个级别。第二个更有意思的是,我们这几个同学他们联合做研发,大家知道吗?这件事情其实就是 scaling out 的一个一个非常好的一个代表,就是人类非常大的伟大的发现。

一个人他是他的注意力其实是搞不定这个事儿的呀。就是你很熟悉代数,他很熟悉数论,我很熟悉几何,是不是?最后大家可能各自互相 share context, share

一些实验的心得,最后哎发现,嗯,原来我们干这个事儿就是一个事儿,是吧?这个其其其实那个朗兰斯纲领本身就是要把这些东西给连起来的呀。呃,所所以所以,我在我看来,将来真正最牛的奔驰马克就是看谁能做科学发现,谁在科学发现这个事儿上能够推动人类往前走一步。

我觉得这个就是真正意义上的伟大的工作了。我觉得那些商业的东西,呃,那没办法,作为一个上市公司,你肯定要赚钱嘛,是吧?我我一定会推出公司要赚钱的。你觉得这两件事儿可能什么时候会发生啊?一个是商业上,就通过很多。模型和 agent 的组合,它能取得商业成功。第二件事儿就是它在科学发现上有一些大家,科学发现不用很长,三年之内就会出现,商业成功可能更快。

就是我现在觉得你的状态肯定是对这个事儿是很兴奋的,嗯嗯,你看到了很多机会,有很可以改变可以做的事儿,嗯。另一方面,你觉得有什么风险吗?突然间猝死,我觉得现在对于嗯进入到我这种状态的人,真真正要担心的,真的就是别猝死了就好了。嗯,我在有些群里我也看到有些,比如说我高中同学,他们也是天天在用龙虾,明显感觉到最近这些人睡得很少,嗯嗯,然后他的。

脑子是一个高度活跃的状态,对,就是,所以,所以我的解决方案也很简单,就是要团结兄弟们,就是你不能一个人干事儿。其实我觉得这个才是真正的第一大风险啊!我觉得其他的风险本质上来讲,它本来就存在,就是今天在这个时代,每一家公司都有可能随时被。呃,基础大模型公司给彻底的给淹没掉,是不是?不仅仅是公司,每个个人也一样。

那这个危险才是真正大的危险。那恰恰我其实就是在呼吁大家解决这个问题了,因为你们二零年。之后有几笔特别大的融资嘛?对,然后有二十亿,然后有三亿美元连着的。嗯,当时你们也确实扩张了很多团队,对,去做AI的投入,就你刚刚说的EIP,对,包括当时你还收购了萧红之前那个公司夜鹰科技,是,然后你让他来也是来做AI对吧?

然后你觉得现在你们再来投入AI和当时相比的话,比如说那会儿。一些教训对你们现在有什么启发?这是特别好的问题,因为我在呃经常在做重大投资的时候,都会被同事们和投资人们今天都在问这个问题,因为大家都知道我确实是一个敢于冒险的人,呃,是想胆子很大,很很能想的一个人。那呃,首先呢,我们现在这个组织肯定也是比以前稳健多得多的一个组织。

但如果真的去复盘的话,我觉得当年的错误有几个大的点。第一个大点就是我对技术的发展过于乐观。我为什么回回北大读博士呢?我是你看,我是零零到零四在北大读的基础数学的这个纯数学课,然后呢,从零四到零七就连着读了硕士。呃,我的硕士一年级、二年级在做的是CV相关的工作,当时是呃,我们实验室是做生物特征识别的,所以指纹和掌纹。

而且那个时间点就是就是我们的算力的性能太差了,基本上都还做不了视频,只能做picture的recognition,就是相当于就是就是只能做image的,你都做不了这个video的。那时候很早,应该都用的还是CPU吧?对,太慢了,太慢了。然后后来就就是零六就开始创业了嘛,就一直做做做做,到一零一一一二这几年,其实是我们CV这个行业大变天的。

是吧?就是 AlexNet,然后这个包括这个这个 ImageNet 是吧?被刷榜等等,那就是我的那个实验室的同学们,也都在各大厂。都都纷纷,大家就在群里面交流,说天哪,世界变天了,世界变天了。但你知道吗?就是我的硕士三年级其实是在做NLP的,就是因为我的硕士三年级非常机缘巧合的是,呃,开始创业,因为我硕士二年级结束的时候创业了。

对,创业的时候,当时其实是也是有一些呃师兄呃,包括投资人信我,然后给了我一笔钱。我当时把这笔钱还 sponsored 实验室五十万,然后跟跟我实验室老师说,我想做自己的工作。当我在那个 moment,我在做的这个 research 工作就是我的硕士毕业论文,就是叫 Recommendation System Based on Language Model。

其实是基于语言模型,但是那个时候语言模型是咱们北大中文这个这个叫叫自然,就是哎那个叫什么呃计算语言啊计算计算语言所对就是计算语言所手工标注的那个呃中文概念词典是吧?CCD其实是我那个时候的所谓的language model,其实就是咱们那那个CCD是人工标注的,我基于它去做推荐系统,这是我的硕士论文。

我当时其实想做的其实是一个类似于后来的今日头条的系统,呃,但是那个时间点因为没有移动互联网,所以没有唯一标识,所以相当于是你的infrastructure所以你就做不了那个创业,所以后来误打误撞我就做了秒针,因为秒针那个场景可以收很多的数据,我在那个广告的cycle里面其实有机会做一些推荐的优化。一九年我回北大读博士的时候呢,呃,当时经历的一个状态就是,首先,呃,我看到了就是,CV这个赛道已经被深度学习彻底颠覆了。

我我当时身边的几乎所有的人都都有个预判,就是NLP,就是我们的这个自然语言处理人工智能里面算是皇冠上的明珠,按道理也会被颠覆。这是一九年的时候我们所有人的一个预判,在那个时间点,Transformer已经出来了,对不对?那个就是这个Attention is all you need的,已经有一些人。

感觉到它端倪了,但没有 OpenAI 这篇论文,大家后来也没有是吧?那么那么那么觉得它不一样。对,一九年我在回北大读博士的时候,我当时的一个预判就是,我应该把我的。呃,就是硕士的工作,接着再往前推进一步,是吧?那但是那个时间点,其实我想做的事儿呢,回到公司,毕竟我们还是个B to B的公司,我当时还是没有天天想着要去做一个to C的公司。

所以我在想说,哎,如果一个公司的所有的数据、知识、信息全部都被一个模型给学习了到了,按道理这个模型它就可以变成我们公司的每一个人的最佳的个人助理。这个其实也就是我二零二零年后来做 E I P 的核心的 motivation。其实他的底层的想法跟现在是一样的,对,完全一样,完全一样。好,那这中间的悲催的事情是什么呢?

就是第一件事情就是说,其实自然语言处理的这个 A I 的这个范式其实是 G P T 后来重新变革了,就是你要去做预训练了,就是它和 Google 的 Bert 的。也还也不太一样,很不一样,很不一样,很不一样。其实是基于预训练的这样的一个能力,它才真正的把后来的这个问题彻底去解决了。但我其实一九年、二零年走的不是这个路线,是吧?

就是其实我二零年的时候在公司里面仍然是在 Bert,在

Bert。那二一年的时候,其实就看到了要要出问题了。就二二年的,真的我要变的时候,实际上我已经没钱了,然后这个各种原因把钱给烧光了,所以,所以其实相当于是我的技术预判出现了过于乐观的。这这是我复盘下来的最大最大的问题,这是第一个问题。如果回过头来今天去想,如果用赛博奥特曼把这个 A G I

的分层,它分成了五个阶段:你的这个 chat,你的这个推理,到你的 agentic to use,到你的 innovators,就是自自我迭代,到最后自组织,是吧?

那实际上相当于是我在二零二零年做的这个产品,需要的是今天的 agentic AI 的能力。所以你想想,我早了六年,几乎不可能,几乎不可能。所以就是技术预判过于乐观。但是我为什么说今天刚刚好?就是今天在我看来,我我就认为尼安德特人都有了。我现在不需要他那么高的智商,我稍微稍微降一点,降一点点,是吧?就开源了就够了,是不是?

呃,我去做一个 scaling out 的一个新的时代的产品,就是这个技术已经 ready 了,是在这的。对我来讲,没有技术风险,我就是在新的维度去做实验就行了。所以,所以,所以,我们这实验成本也不高,小团队就能做。呃,这是技术层面的。第二个是组织层面的,组织层面就是我在二零年做的那个产品呢,真的是太原创了。

就当时呢,我的投资人看完了以后都也都傻了,他说这什么鬼?为什么需要一个 boss?就今天其实大家就看到了 ChatGPT 之后,包括看到了 Manus 之后,包括今天看到 OpenCL 以后,哦,大家说哦。我们每个人真的是需要一个个人助理,但我想告诉你们的是,真的非常夸张,就是在二零二零年的时候,我在给内部去讲、团队去讲的时候,给我的投资人去讲的时候,其实没有几个人信,真心没有几个人信。

在二零二一年下半年的时候,我已经有一些产品陆陆续续做出了好的 demo,已经上线了,但是当时的能力还很差,因为呃没有用预训练技术。这个时候其实有一些特别特别 crazy 的投资人,呃看了以后非常兴奋,在他刚刚要投的时候,突然间出现了。后来出现的一系列的事件,就投不了了。就本来那个moment,我可能要估值五十亿美金,再融五亿美金。

你们后来当然了很多,对,当然非常这个这个基本上能公开的是能看的嘛。我其实二十多亿美金,本来在二零二一年年底要估值五十亿美金,当场再融五亿美金的。如果我那一轮融到了的话,呃,我后面就会没有那么难受。那回头看是好事吗?那你可能更扩张了,是好事。在我看来,那个时候融不着是对我是好。好事就是,如果我那个时候融到了,我大不了今天可能就是一个 Kimmy,或者就是一个 Mini Max,就是最好结果是这样子。

那不是挺好的吗?呃,不是市值是市值啊,因为毕竟没解禁嘛,就是大家就没彻底流通,彻底流通状态和这个没解禁状态这个市值还是不一样,是吧?所以我也跟投资人讲了,说我说大家你也不要看我今天的市值,是吧?首先今天市值根本不代表我们公司的未来做的事儿。是代表了我们公司以前做的事儿,是吧?第二个呢,我们也没进入到彻底流通的状态。

解禁之后,以及我们未来做的事儿,它 deliver 了。到今年年底的时候,以及到明年的时候,大家去看看我们公司值多少钱。所以,当时如果你能融到五亿美元,你可能就要去做大模型的预训练,很有可能就会朝那方向去了。呃,而且在我看来,呃,有可能就是你又又你你就花了很多的钱,也可能我就会进入到那个

scaling up 的那个路线去往上去了,就我一定会沿着路去走嘛,就这个创新者的窘境,就是你已经这么干了,你很难回过头来了,换一个思路去做了,就是你就富人版的套路去了嘛,就是在你现在的时间点,你觉得这条路也不见得对你们来说是最好的路,对吧?

对,在在我看来,我现在找到了一个 another approach,就是这个 approach

其实是成本是可控的,呃,也能赚钱,而且对人类是有好的。Finally,就是刚刚你不说怎么评价这个什么要做得好吗?我我我就看看将来我们能不能去做重大的科学发现吧,是不是?这个这个是对真正对全人类好的事。呃,就是我今天先把这句话是吧,这个放在这儿立个

flag,看三年之内我们能做能不能做出一些真的牛逼的科学发现。

你说,据说你说当时你觉得组织上也是组织的问题呢,就大了去了。就是在我看来呢,就是我当时犯了一个巨大的毛病,就是说我做了一个这么创新的东西,居然用了一个这么大的团队。你当时在招了有一千人在做,一千人是,就是而且这一千人是不不是全新招的,这里面我全新招的团队其实是做模型的团队。然后的这个就是就是,而且我新招的这个团队其实还颠覆了我上一代的。

大家知道,我上一代团队当时首席科学家是做知识工程系的,就类似于 C C D 人人工去呃编写知识图谱、编写这个呃规则、编写这个自然语言的这些标注的这个派系的。我新招的团队呢,其实是基于大模型做的,只不过是他们还是 Bert 这个系列的。所以其实大家的这个工作范式不一样,但这里面肯定花很多钱招了一批人。

而且同时你还要做ASR,做这个NLP,两个都在做,是吧?这因为这两个都很不ready,都要去做很多优化。那呃,我自己做application的团队呢,其实它整合了我原有的几支团队。我在一九年之前先后并购了秒针的竞争对手,然后同时呢,我自己还有一个另外公司是当时的明略,是三家公司合并成为了明略。其实还有我收购了肖红的团队,那所以是这个八方。

神仙,各路诸侯,最后做一个所有人都不知道是什么东西的产品,就是没见过。你抄一个东西很容易,是吧?呃,它有一个确定性的靶子。大家其实是可以用人类的分工系统来去分工协作去做,呃,包括说我今天要发火箭,那现在埃隆马斯克已经发成功了,那我去抄的,这个都是确定性的靶子,你去做就行了。但是在那个

moment,大家去想一想,我在干那个事儿是真的是没有几个人知道他要干嘛的,就是我自己也是一个非常抽象的一个宏观的模糊的一个概念,所以最后就是一个组织的一个极大的灾难,就是极大的一个崩溃。

首先,人的关系就复杂。对,首先人的关系就复杂。第二个就是,呃,方向其实不清晰。然后这个只是超级原创的事儿,在这种事情上,我今天就觉得大团队没戏,越小的团队越好。所以这也是我最近这六七年吧,就是一个在在做非常 crazy 的创造的过程中、创新的过程中的一个非常深的教训。但是其实有了这些深的教训,我对组织的理解就不一样了。

就是我我其实,在做 EIP 期间,我带着整个公司的核心的管理班子。呃,就其实是阅读了大量的人类管理学的书籍。这么说吧,就是我,我就偏文科的书,我以前是看得少的。但是在那两三年,因为我要做EIP的产品,我应该是海量阅读了这些书。但是你知道吗?就是我读书其实都还是非常认真做笔记的,书上都是啊,按照我当时的这个attention机制做了各种标注,我自己都觉得读懂了,但是。

我站在那几年之后的今天再去重新看我当时对那些书的理解,我觉得我只理解百分之一,就是这种感觉。但是实际上我对组织温压根就不理解,压根就不理解。所以就今天这个时间点上,我我我对那些书的理解就进了一大截,应该至少是个及格的水平。但是我在那个时间点上真的只有一两分的水平。今天呢,其实我是可以去组织大家去做一些更大的事儿了。

那这总结一下的话,你你现在对组织的新的理解里面比较核心的几点是什么?我觉得首先就是要看到人的存在,就是每个人都要在这个组织有存在感。你的一个组织设计能不能让每个人在组织里面都有存在感?存在感是指什么?是指声音被听见,还是指贡献被认可?每个人存在感本身,他有自己不一样的定义啊。但是我觉得世俗的一点就是,每个人都要在这个组织里面有自己个人的收获。

这个收获既有被大家的认可,也有自己的收入的增长。就是如果你回去看那历史上的很多的管理学大师,呃,这个呃,这种文理交界的啊,就是有一个著名的大师叫赫尔伯特·西蒙,其实他是人类历史上真正意义上第一个同时得了诺贝尔奖和图灵奖的人。呃,就是咱们其实前年应该是那个 Jeff Hinton

拿了这个奖的时候,其实呃,大家以为他是第一个,其实在这之前就有人了,就是赫尔伯特·西蒙,呃,他好像是他终身拿了九个博士学位,我我说不定也会按照这个路线往前走啊,呃,只不过就是将来可能人类的学术体系也会发生重构啊,我觉得这个也不一定。

但是赫尔伯特·西蒙,呃,他拿了这个 AI 领域的这个图灵奖,是不是?就是他是这个符号派的这个 AI 的算是奠基人之一,同时他在诺贝尔奖里面,其实他在。呃,这个呃心理学领域其实也有他很大的一个贡献。那这个贡献本质上来讲,就是他最后凝结成了他几本书,一本书叫呃管理行为,还有一本叫就叫组织。然后其实我还很喜欢他一本小册子,叫呃叫管理决策新科学。

那这几本书。非常非常牛!他其实是跨文理科的,就是他其实是在想讲一个组织里面每个人都有自己的想法,都有自己的purpose,都有自己的目标。这些目标绝不可能跟老板是一样的。甚至老板自己的目标都跟这个公司的目标不完全一样,老板自己还想休休假呢,还想放松放松呢,是不是?还有自己个人爱好呢?所以其实你不能想当然认为这个组织里面每个人都想的是辉哥想的那个事儿,想着是是大老板想的那个事儿,因为你没有上过班啊,嗯,所以你是创业到什么时候你才比较清晰的有这种认知的,有有了一些打工人的视角的。

就是这几年,那那那这个时间也花了挺长的啊,因为我太顺了呀,就是你你想我从小到大一直学习很好,然后这个上到北大虽然进到了。天才班是吧?就是数学系,但是我我也运气很好,我没去跟他们PK数学呀,我就去创业了。我就在数数学系里面,肯定是那个最后赚钱的人嘛。所以,我到哪都是各种光鲜亮丽。然后这个呃,在在在整个公司发展的过程中,呃,我在某一个细分赛道,虽然没有像今天什么腾讯啊、阿里啊、字节做那么大,但是我在我的细分赛道肯定是受人尊敬的。

我在我的新闻赛道最后把竞争对手也整合了,而且竞竞争对手的 founder 也是咱们北大的校友。今天我跟他关系也不错,是吧?甚至可以,他他他可以租用我的办公室一起工作。那所以所以其实我就觉得,在可以这么说吧,在二零二零年之前我。始终处于一个春风得意状态,就是没有 context,就是真正的伟大的创造一定是需要有巨大的挫折、巨大的 context。

就你没有负反馈,你这些都是正反馈。呃,其实,在数学领域,呃,或者说在控制论里面,我这些都是正反馈。那个他是这样,我告诉你什么叫负反馈,在控制论里面的负反馈不是给你一个负向的 feedback,这个在控制论里面也叫正反馈,是它不给你反馈叫负反馈。甚至我我让他猜,所以所以你可以理解,就是说我之前其实,在一些重大的事儿上,其实是也一直在是负反馈的,就是没有人给我上过人生课的。

所以这是第一个,就是你觉得组织里每个人要有存在感,嗯,要要去满足他们的一些诉求和目标。对对,这是这是这是真正的,我觉得人类社会的第一性原理,就是每个人都要存在。嗯。每个人都要存在,这是今天我在去思考新的哲学的时候,呃,我要思考的就是每个人都要存在。这个,你你你要去思考存在主义哲学的。你觉得AI有存在这个东西吗?

AI agent。需要存在吗?呃,就就我刚刚讲,如果你给了它权利,它逐渐的就开始有存在了。但是我我我我觉得尽量不要给太多,或者说它的主体性尽量是 under 在一个人身的人的这个 governance 之下吧。嗯,如果说人是我思故我在的话,AI 是 agent 是什?什么?那肯定是我思故我在的人,现在不要去追求我思故我在了。

就是这个,我刚刚说了,哲学层面上那个思是基于一个确定性的前提假设来去做推理,这种已经被AI取代了。就像今天有了计算器一样,大家不要以算数来作为自己的存在感的这个,是吧?就但是那个计算器因为它会算数,所以它存在,是吧?今天大家把大模型当成一个大号计算器就好了,它就是一个更高级的计算器。他是我思故我在,嗯,但是我们的人是我品故我在,或者我行故我在,嗯,就是我从外部世界探索拿回来的一些要算的数,给他算,然后算完了以后呢,他算的结果好不好,符不符合我的要求,是我

taste 一下。

所以,所以这两个是我们人的独特的存在。计算器会以我思故我在持续存在,它算的越好越好,它存在的越好。嗯,那可以继续说。你刚才说组织第一个新的核心的认知是说,呃,每个人的存在啊。对,第二个就是说,呃,这个跟我前面讲的技术预判,呃,这个某种程度上是在呼应的,就是说这个世界是极其复杂的。我们呃,在这个复杂的这个世界,在千变万化的这个世界里面,其实我们每个人只能做有限理性决策,是吧?

这也是赫尔伯特·西蒙的一个重要的理论。那所以呢,呃,我们面对一个复杂的场景,到底应该怎么组织这个团队?面向面向一个确定性的场景,怎么组织这个团队?其实这个是我们的战略学里面有很多的老师都在研究的。我在这几年,对我来讲,当然都是已经犯了巨大的错误之后才看的一本书。我战略学的书有一本书看晚了。叫战略的本质,呃,我记得好像是一个BCG的大合伙人写的一本书,他有一个著名的理论叫战略调色板。

其实我在这之前也看了很多,什么麦克波特的。然后还有什么这明斯伯格的就看了很多是吧?那明斯伯格就是最坏的一个人,就是他把战略战略的方法论写了十套还是十一套吧,就他把前人做了很多的总结是吗?有这种 top down 的,有 bottom up 的,但是他恰恰就没告诉你什么情况下应该用哪一套。然后这个《战略本质》这本书,虽然它没有总结那么多,是吧?

它战略调色板里面就分了五种情况,但是它清晰的给到了,呃,就是企业企业经营者一个建议,就是在什么样的外部环境下,你应该用哪一套战略制定方法。所以,所以这本书我看晚了,就是在我已经把钱都浪费完了以后才看的。呃,就是今天其实我还是非常非常主张我们的不同的战役要先去观察地形,观察外部的环境是什么样,然后再去思考你的团队应该怎么组织。

呃,所以我有一只龙虾是冯诺依曼,然后呢,他其实是博弈论的奠基人嘛,他把这个博弈其实也分成了,呃,从理论上分成了二十七,呃,三十二种,就二的五次方,是吧?比如说,呃,信息完全和信息不完全,是吧?比如说是,呃,这个你是叫合作型的还是不合作型的?然后呢,他他他又一共有五个维度,五个维度,每一个人都是两种选项,一共三十二种。

实际上,其实今天我们要去想,商场如战场,就是在这个战场上,你要思考清楚你现在是在一个什么样的环境里面在博弈。当然,它背后有我今天的新的这个数学基础去支撑了。但是在在那个时间点上,其实我在这些事上,就是你之前太顺了,你都没有经历过这些的历练吧。呃,我觉得就是这这这七年,呃,我自己应该在这些方面成长很多。

EIP这个项目实际上最后你决定不做了,是一个什么情境?那就是没钱了嘛。你想我在那个时间点上,我还是坚持。想做的就你是越陷越深的那个过程,每个人都是这样子,都是越陷越深。就是我在二一年的时候,其实我有一种执念,就是我觉得你全世界都不理解我,总有投资人会理解我的,会给我这一笔钱的。而且其实我真的差一点就要融到那五亿美金了。

到二二年年初的时候,就是我当时还抱有幻想,说我还能融到这笔钱。只不过就是美元投资没了,我在国内就是找各种各样的国内的投资人,包括自己原有的股东。但是我发现这个世界变了,就没人再信你了。一直到呃上海封城之后,然后你发现你连客户的回款都很难拿回来了,因为你连发票都开不了了,是不是?所以,我们是呃,二零二二年的四月、五月,呃,我在跟团队做了一个预判,就是分析一下,那现在肯定钱应该就是拿不着了。

我当时已经接受这个现实了,就是拿不着钱了。那在接受拿不到钱的这个情况下,我们账上的钱还能够用多久?如果我们的客户的回款还是拿不回来,那我们可能就只能用两个月。如果客户回款能回来,我我可以用更长,因为我们还是有一个存量收入在这儿嘛。那呃,但是我们不能决这个决定,就是到底什么时候能拿回来客户的回款,是吧?

以及客户在这个很大的一个动荡的情况下,他能不能给你钱,这也是个问题。当然后来这些问题慢慢都解决了。呃,所以所以在那个情况下,我们算了一下。我们需要这个第一个借多少钱?第二个是我们需要减多少人?所以我们当时就决定,可能从那四千人里面,真的就要当场减一半人。所以,所以,所以就做了一个非常非常 tough 的一个决策。

所以我在这个过程中,我对裁员是有非常深刻的体会的。呃,很多人本来都很优秀的,然后他都到公司来闹事儿,是吧?拉横幅,然后呢,然后就还有很多人,他家属就是律师。那就是一定要给自己的家属鸣不平啊!就是我在那个 moment 的突然就理解到这个世界真实的世界不是我天天想象的那个象牙塔里面那个那个简单的世界了。

所以,所以相当于是说,今天可能我们很多基模公司的创始人仍然是在我的 2020 年的那个脑子的叙事里的。但我坚定地认为,这个世界不会向他们想象的方向去发展。你觉得他们想得上的方向是什么?他们大家都认为,这个世界将来大家人不需要做什么智慧智力活动了,都被AI干了就行了,就看不见人的存在。我在那之前也是这样子的。

我其实,在二一年。二二就二二年裁大裁员的时候,其实,我我经历了这个过程,我感受到了说,首先我要借很多钱投公司。是吧?我借了一千多万美金,我自己账上始终就没有什么现金。然后我有一个北大的同学,那他跟了我很多年,他算是公司的奠基人之一,很多人都是他招来的。同班同学,我对门宿舍同学不得不被我裁掉。裁完以后,他说:“他说辉哥,能不能给你借点钱?

”我说:“你再过几天,我现在也没钱。”但后来我又借了他,就没多少钱,可能就十万二十万。然后就就是在这个过程,我看到了就是。真正的世界是什么样子的?一般CEO会觉得跟自己创业很多年的人,嗯,你肯定还是想给他比较好的。你没有能力,因为你没有能力,因为你没有能力,就是你你真心就是觉得自己是很渺小的,你是没有能力给到大家回报的。

所以这也是因为也是因为这个原因,我在当前这个时间点上,我肯定是不愿意大裁员的。虽然我知道就今天这点活,我的AI肯定能干得很好,是不是?但是如果投资人我们的董事会过来拆了我,我也会跟他据理力争的。我要保护这些人的就业,是不是?我也呼吁所有的企业家用AI优化自己的效率以后保护就业,否则这个事件所有的公司全部都大裁员,谁还消费呢?

而且我坚定的认为,如果我的这个 scaling out 的这种方法能做出来的话,他们每个人都有价值,他都会在各自的战场用我的这种方法去打败那个怪兽。那你会担心你的这个判断里面加了太多你的价值观的一些,就是那种偏hope的那种东西,反而会影响你的客观性。这件事情就是我觉得最神奇的一件事情,就是那个hope它本身就是会产生力量的,就是那个hope它本身就会产生力量。

就是如果只有一个人是这个hope的话,它不会产生力量的,但如果全世界。我们今天全世界有八十亿人,如果有七十九亿人都是这个厚朴的话,你觉得这个会不会实现?然后你觉得多数人还是会是站在你这一边的,对吧?就多数人是会站在人更有价值的。肯定,显然肯定啊!怎么可能?我认为我我没价值呢?不可能啊!我作为一个数学奥林匹克优秀的得奖选手,今天AI算数学算的比我厉害了,我肯定是不服气的,是不是?

我肯定是想带着AI去解决哥德巴赫猜想,你你你的AI解决不了,对不对?是不是?我肯定是不服气的,你你解决一下试试,来你解决吧,你肯定解决不了,是吧?如果我带上AI能解决哥德巴赫猜想,那我就证明我有存在感。你现在的这个这个想法,就因为我理解你中间经经历低谷那段时间,肯定你的各方面的自信心啊,对自己的判断力肯定是会有质疑的,嗯。

然后我听你现在描述你对AI未来的的想法,我觉得你又是很有自信的,你这个自信是怎么重建?呃,首先呢。我这个人可能比较奇怪,我其实哪怕在那个最弱小的时候,其实我仍然对自己是有自信的。我觉得其实创业就是一个求生存的过程。呃,我是精读过达尔文的这个《物种起源》的。达尔文的那个原著上,它有一个特别有意思的插图,那个插图是一棵物种的演进的树,一个 tree 是吧?

就生命之树,我们可以叫生命之树。那其实,在生命之树的这个演进的过程中,每个物种它都可能会繁衍出,呃,变异出不同的后代的物种。那有一些物种它生命力不强,它就没了。那有一些物种呢,它可能就异端突起,然后就就就就把原来的一个物种的位置给抢了。总之就是它每一个时代,每一个时代它都会有一行,这个行上面有一些生存的空间。

这些生存空间有一些是由老的物种上来的,有一些是新的物种出现的。我觉得我这个人可能是生命力是很强的一个人,就是我始终会在夹缝中求生存,就是我始终觉得我能活下去。就是在我最困难、最困难的时候,我当时就觉得说,嗯,我肯定能活着。我作为知名奥数教练,我出去是吧?我开个班,我肯定能养活自己。你说这个养活自己是指养活自己还是指自己啊?

自己啊!我就说最坏的情况。刚刚不是说我个人的自信吗?就是说我我其实是自信心很强、爆棚的一个人。我始终认为自己有价值,就是好。我今天就算我讲数学,将来大家也不需要了。我会弹钢琴,我会弹吉他。我今天就在天桥上抱一把吉他,我也能自己养活自己。所以,我坚信我自己是有价值的。所以,所以在这个信心上,我从来都没有。

就是动摇过,只是说今天我到底是一个企业家的身份,还是一个科学家的身份,还是一个街头艺人的一个身份,是吧?我我觉得就这件事情,其实是我从来都没有怀疑过。那具体到技术判断上的自信心,它需要需要重建吗?中间有经历过低谷吗?因为你现在又做了很多新的技术判断、趋势判断,你会不会担心说你这次又对技术的进展过度乐观了?

我我觉得这个就是还是我刚刚说的,就是你的一个生命力的问题,就是说你在A的方面去判断错误了,你是要去再观察context。你看的 context 支不支持你再做进一步的研究?如果支持你做进一步研究,你就继续做呀。这就是我们今天科学发现的一个最基本的原理啊,就是就是有有的人,比如说像张益唐这种人,他就一直在去搞这个孪生素数,是吧?

但他搞着搞着,他发现哦这边可能没有办法进一步去做做做推导了,那我去看看黎曼猜想有没有机机会,是不是?那所以其实我们在商业的过程中,就是一个有生命力的人。他其实要打的是一个用王心化叫无限的游戏,就无限的游戏,就是你这个游戏如果真的打不下去了,你可以换一个游戏,但是你要对你自己的原来的那个吹的牛要负责,是不是?

你可以告诉大家说,我认为这个事儿结束战斗了。不应该再做了。嗯,你要你要足够理性在这个判断上。什么叫足足够理性?就是在这个事儿的推进过程中,你有没有机会获得一个产生新的猜想的 context 的机会?如果没有了,那你就应该放弃这个战斗了。但是并不代表这个公司应该倒闭,是不是?有有有的有有的团队其实他就选择新的战场了,是不是?

那在我看来,今天我原有的这个业务上有非常非常多的新的 context 呀。这 context 就是我说了,我们今天的职场里面的我的每个客户都需要存在感,每个客户都需要,我的团队也需要。这这么大的一个需求,你不去解决,不对呀!这是一个巨大的需求,是不是?就今天,如果有个人做出了一个产品,能帮原有的这个行业的每一个人都能找到自己的工作的岗位存在的意义,你觉得这个产品大家会不会买单?

你觉得你们现在做这件事儿,它什么时候这个需求会反映在商业和财务数字上?因为你们也是个上市公司。对,从二五年的年报来看,就相比招股书里的信息,其实你们二二五年相比二十四年的收入和利润的增长,它不是一个大幅增长的状态,它是一个个位数百分比的增长啊。对。我现在这个话这么说也不太合适啊,因为你我也不能提前预测,是不是?

但我想告诉大家,如果用一个指数函数来描述,大家对那个指数函数有一个理解,你去看一下那个 tipping point 就是 y 轴和指数函数那个交点,就是零逗号一,是吧?就 y 等于一的一 y 等于一的 x 次方,在 y 轴的左侧。它是一个这样的线,是不是?对,但是过了零多少亿这个点之后,它是这样的,对不对?

所以大家要要要理解,maybe未来的某个时间点上,是吧?我们就过了那个点了,这才是一个正常的好的。有网络效应的公司,你对明略做到什么体量,你有什么预期吗?你我刚刚说了,其实就是我本身呢,呃,就是我觉得人的时间和精力都是有限的,我也不可能去组织那么大的团队的。我觉得一两千人就挺好。我说的是收入和利润。

那其实收入和利润在我看来,将来它还是会跟人的人数有很大的关系的。就你说的一百万的利润,对我觉得人均一百万的利润作为我的初期阶段的这个小目标就好了,是不是?然后这个呃,当然了,如果我们每个人将来还需要更多的钱呢,我就是,当然他赚多少钱?举个例子,他人均要有一个,我希望啊,就现在模型厂商,模型厂商我大概知道大家的平均收入,模型厂商平均收入每个人的呃年薪差不多是五百万平均,然后比较大的leader可能是一千万,然后入门门槛可能是应届毕业生大概两百多万,所以我觉得如果有一个小目标,就是我们的每一个同事,是吧?

人均能赚五百万。然后还能给公司贡献一百万的利润,我觉得就是一个很健康、很好的公司。那我觉得按现在的商业标准,这特很牛逼啊!公司人均自己能赚五百万。对啊,对啊,对啊。但是就是我,我距离这个理想的状态其实还有巨大的 gap 在那儿,是吧?因为我是个上市公司,财务报表都透明在那儿的。我是希望推动这个公司朝这个方向去发展。

因为你们自己现在也训练小模型吗?你们怎么竞争模型的人才?呃,这件事情是非常有意思的啊。就是首先第一点,就是从世界观层面上要去去去去竞争。就是你看,呃,就是很多很多的人愿意去

NASA,愿意去这个马斯克的公司。他不是因为他在那儿赚的钱更多,也不是在那儿更轻松,所以我相信有识之士,真正信我的哲学观的做模型的人是大把存在的,或者这么说,有可能有一些曾经在我们熟知的那些模型公司里面,会有一些人,大家知道,就是我刚刚给大家举的那个例子,模型也在被自动化,今天看起来是赚钱很多的人。

但是过两天可能就自动化了,这些人也没价值了,这些人也要找工作,是不是?我相信这些人会来我公司的。其实还有一种可能,就是比如说模型厂商,因为最近这两年开的工资非常高嘛,有的人他其实赚到一定钱之后,他就确实有这种人啊,他可能对赚赚更多钱对他来说也没有太大区别,他可能就会干他自己想干的事儿了。对对对对,我觉得我做的这个事情,今天在做的这个事情,呃,这个会有很多人感兴趣的。

就是,甚至他自己都可以干这个事儿。他加入我的话,一定是他觉得我这个 vision 更大,是吧?他他愿意作为一个一个 partner,就是成为这个 vision 的其中的一部分,是吧?呃,就是因为这个是需要团结大家力量,就像回到刚才前面说的那个龙虾,一个人是搞不定的,是吧?因为你的生命力对抗不过那个龙虾巨大的算力,还是要多几个人一起来去协作。

呃,所以所以这是一方面。第二方面呢,我真正的一个目标是什么?是让所有的人都可以去摸。所有的人,直接来讲就是所有的知识密集型的工作者,呃,不管是科学家还是一个就是我们上一代的手艺人,那就是在在办公室白领的这样场场合下,如果是在这个场景下的话,其实我需要的是这种复合性的人才,就是他对原有的那个战场很有 taste,知道 context 在哪。

同时呢,我们会把训模型的门槛降到足够低,使得他也能干。这个时候,其实我跟大厂竞争的人才根本就不是一路人。你说到这个,今天有一篇流传甚广的文章,就是金谷园饺子馆。应该是北邮的一个,嗯嗯,然后发了一个金谷园饺子给我啊,他的想法可能说,比如说我绕过美团,你是作为一个用户,你也可以和我有一些直接的联系。非常有意思,那我必须要过去吃一次。

就是今天像 A K 这种人,他在不断的开源训模型的方法的。其实我们也在做类似的事儿,就是最后最后训模型的门槛一定会降到很低,且让每一个手艺人保护自己的独有的这个知识产权。因为你想,如果全世界所有的人的我每创造一点崩就被大模型厂商拿走了,每创作都拿走了,谁还愿意创作?是不是谁还愿意创作?这是绝对是反人类的一件事情,人类文明就不存在了。

谁还愿意创作?从小到大天天刷题,努力学习的小孩,结果这个上大学以后不让你创作,是不是?那我为什么还要好好学习?我觉得这不不符合人类文明发展的叙事呀。所以一定要保护大家的,就是一定是将来每个人。就不是那个所谓的AI researcher才能去做这个事儿,每个人自己都能做,因为我觉得你对未来是有很多你自己的设想的。

嗯,然后其实你现在也提到你有两个孩子嘛,嗯,他们可能也会非常密集的去用AI,嗯,就是你观察这种更新的,我觉得他们应该算是AI的原生一代,对吧?就相比于之前互联网的原生一代,嗯,比如他们是怎么使用AI的,然后以及你你会有从中得到什么启发?我还是有蛮多启发的。其实,嗯,就拿这个我前面说的这个榜单,OS World这张榜单是吧?

就是这个 C U A 是吧?就是 G U I 的这个 C U A。其实以前你看,我们去年的时候,我是带着团队呃做这个模型的,这个模型做的也还不错。但是我们当时想当然的还是认为说,在那个moment啊,想当然认为说就跟这个Manas一样是吧?你有一个呃有一个agent的,这有个视窗是吧?AI在替你做很多的操作。

但是确实,他也遇到了很大问题。他大量操作是失败的,尤其越复杂的、越专业的软件,越细分赛道的软件,越操作不成功。那其实最后就不好用,也没有人几个人真的在好好用它。但是有一次,我观察我女儿,我一天发现哦,她在用她的电脑编程序。她是初中生吗?呃,现在是初中生。对,然后她在用她电脑编程序。那编程序的时候,她遇到了一个挑战。

遇到一个挑战的时候呢,这个她就问我说:“爸爸,怎么会怎么办?”我说:“你问AI啊。”那这个时候,其实她做了一个动作,让我大吃一惊。她这个时候直接问豆包,她说:“豆包。”呃,你看我现在遇到一个 bug,然后怎么解决?就在我传统的理解是,我的我的那个 IDE 那个开发环境里面把那个 bug 粘一下给到那个豆包,但是我女儿的这个打法居然不是,是让豆包直接看屏幕。

在手机上它有那个多模态的功能,PC

上其实也有,它也可以截屏,它可以截整个屏。我突然意识到啊,原来这种模型还是可以这么用。我我觉得我们在上一代互联网里面的人类其实还是被那个我们上一代的一些使用习惯给束缚住了。就是今天小朋友们他其实是有非常非常不一样的打法,呃,我家小朋友现在都是他的学习都是跟AI学,就就是制定学习计划,然后但是确实他们用的那个AI呢,还是我说了就是scaling

up的那个AI的哲学体系。

所以最近呢,我开始陆陆续续把我的龙虾,让我的小朋友在上面去问一些问题,因为因为我也把我刚刚给你讲的这些哲学体系全部在我家都给小朋友全部讲了一遍,我觉得他们是认同的,他们是认同的。我在这个几年前,其实尤其是疫情期间,带着小朋友真的是天天在家刷奥数题的,呃,也拿了不少的奖。但是,我最近就是或者过去这一年吧,我都没怎么带他们刷题了。

呃,我就跟他们说,我说,哎,呃,你们首先对我的这个哲学系统有一个理解,对人类未未来发展方向认不认同?他们认同。因为因为他们是真正信AI能干各种各样的事儿的那些人,他比我们那大人都信,甚至比很多做AI的人都信。但是同时,他们也相信AI不会替代人,对吧?他们相信我们不应该让AI替代人这件事情,完全由你信不信决定。

就是你到底是信那个欧式公理的那个五条,还是信那个黎曼那条,是吧?就非欧几何的那五条公理,由你信不信决定,是吧?就我还说那个信那个愿力很重要。就是如果他们都信,他就会按照这个世界这个方向来去推,是吧?而且我会认为,这个世界百分之九十九点九的人应该信这个事儿啊。你怎么会去信我被AI干死呢?我觉得这个这个假设本身就不成立,是是不是?

所以所以大家如果去信这个事儿的话,我们就要去维护人类的这个文明、这个和平。把这个同意之后呢,我就说来,咱们一起来跟AI一块儿研判一下,我们应该怎么学习。是不是?如果做数学应该怎么做?其实最后得出一个结论就是,还是,呃,应该去呃提高我们第一个人探索世界的能力,第二个,呃,就就获取 context 的能力,是吧?

那我不行,我也跟马斯克一样,我去外太空去找到有没有新的 context,呃,解释一下现在地球上物理解释不了的事儿。第二个就是说,呃,就是 taste taste 这个 taste 的,其实我早年,呃,就跟我们的小朋友都做过很多的交流,因为有一次特别小,那时候我可能我女儿就是二三年级的。时候,但是我跟他一块儿解一道数学题的时候,我说哇,这个公式非常美。

当时我女儿就很奇怪,她说爸爸,为什么你用美这个词儿?就是我最近开始在做一个事儿,就是因为他平时还是会刷一些公立学校的题的。呃,我不是 diss咱们中国的公立学校啊,就是这些题吧,就是特别 ugly,就是他练的能力其实很重要啊,但是那些题本身很 ugly。呃,我我觉得就是现在,我就跟我女儿和我儿子说,我说咱们能不能一起出点 beautiful 的题?

我我最喜欢的题是什么呢?就是这道题特别特别的难。当我想明白了以后,一行就做出来了。你会发现有些题呢,其实它也不是那么难,就是你就要分什么一百种情况去解。比比如说。呃,我记得那个就是那个谁,就是马上就是有机会挑战就菲尔兹奖的那个王红,对对,王红,他今年也要去二零二六年的这个世界数学家大会去做演讲嘛。他解那个三维挂骨问题的时候,其实他那个解决过程就还是很辛苦的。

它大概应该是分了三百多种情况,好像是啊,呃,但是那个题本身很优美啊,那个题我觉得就是是 beautiful 的。我小时候经常有的时候,呃,干一个事儿也是恶作剧。老师可能在黑板上出一道题,然后老师写了一整黑板。我说老师,我有另外一种做法,我让黑板把老师整个黑板全擦掉,写了一行字。我说做完了。我觉得这个是就是一种数学之美吧。

对,所以今天我觉得就是其实我现在跟小朋友如果再去做数学,我就跟他们说,我说来,咱们一起看看你们做的这些题是不是一个阿格雷的题。就是有的时候以前他们就是在家自学,自学完了以后,他们做完做完题以后,可能看看答案。有的时候答案看不懂,过来找我。我先研判一下这个题是不是一个阿格雷的题。我先带着他一起来去讨论这道题为什么是个阿格雷的题。

讨论结束了以后,我们就说好这道题不做,我就在那个题上,我我因为我在家拿红笔在这写阿格雷,然后然后再进入到下一道题里面。我在那个清明节假在家待待两天半是吧?比如说每半天换一个小朋友上来跟我坐在一起。然后他们遇到这种题的时候,我都会跟他去研判一下,可能就没几道题最后不是阿克雷的。然后我就觉得这个活动最近是一个我现在觉得觉得特别好玩的一个活动。

按照你这个新的学数学的方式,他们奥赛的成绩不是有可能会下降吗?我觉得肯定会下降,肯定会下降。但是如果他们两个其中有一个人将来真的有可能当数学家的话,我觉得可能会概率变大。伟大的数学家不是因为他解题能力强,而是他相信有一个公式,那个是美的,他要去推着去解决它。你可以用一辈子的生命力来去解决这道题。因为你信它,你信那个公式是美的,因为没有人证过它。

就是数学竞赛跟数学家最大的区别,数学竞赛是,呃,我们两天,每天四个半小时,一共九个小时,给你六道题,是吧?一一道题一个半小时。但是我们每个人坐在那个考场的时候,其实心里面是很踏实的。为什么?因为你知道这道题肯定有答案,而且那些套路是吧?我都练过,是吧?我一看这道题,嗯,这个题背后套路是什么?然后这个大概率其实你已经这个就是很多题你就快速就搞定了,剩下的集中精力开始攻克那个最最难的那两三道题。

但是数学家就很痛苦了。数学家,你你想,你可是要把自己一辈子交给交代给一道题的,就是真正的难题啊,真的难题。其实像王宏,他也没参加过奥赛,对,他甚至上北大的时候都不是数学系的,对呀,对呀,从地空转过来。是是,所以我觉得理科生也要像文科生一样培养,就就教你要去感受那个美,感受你自己想要什么。不要只是天天去想公式,因为你儿子上高中了,然后女儿是初中,其实接下来都会有升学的问题嘛?

对,你说和企业家讨论小孩教育,我估计大家可能最烦恼的也是升学,包括未来怎么选专业,对,呃,职业生涯怎么发展?对,然后以你现在对AI的理解,你会怎怎么想这个事情?呃,还是看他们自己的兴趣爱好了。就是,嗯,我儿子现在已经有一点点兴趣爱好的端倪出来了,因为他们两个确实从从小被我卷了奥数的,呃,但是最近一年没卷了。

呃,但是从从另外一个方面,我就是突然间发现,我儿子其实是没有那么喜欢形式科学,呃,其实他更喜欢自然科学。所以,呃,物理、化学、呃,天文、生命科学,他都很喜欢,都很热爱,包括写代码。喜欢数学,哎,写代码他也很喜欢。但是我我觉得也很好。我给他打了一个数学底子,比如说他将来如果去去搞物理,我相信他在那个物理的班上,可能数学是最好的。

因为我给他打了一个深厚的一个底子,而且是通过强化学习打的。那所以,我我觉得他就按照自己的兴趣去选专业就好了。其实本来没有迭代到现在这个版本之前,呃,我其实是觉得说,哦,就学数学好了。呃,因为我是出来 believe

数学的,我说大家把数学练好了,将来再看到底做什么,就是数学是个很好的基础能力。因为我在那个 moment 不光是数学是基础的能力,是因为我认为就是 AI 是很厉害,AI 甚至把数学都能干了,但是 AI 干出的结果需要你有一个逻辑的脑子去榨取它,你都没法榨取它,那你数学你你有没有这种能力?

那你就理科就不用干了,是不是?那就是因为AI的推理又长,是吧?因为一一根写写一百页,所以现在很多数学家都特别遇到特别大的尴尬的事,就是他一个非常非常复杂的一个一个一个证明,结果都已经在那个什么很大的数学期刊上发表了,结果最后突然在讲的过程中,就是在日常做talk的过程中,突然被被被挑战了,那是特别尴尬的事,就是因为那个推理过程真的是人看起来都很累,都很累,就是能去扎实这个事就很难。

那所以,所以我最开始的想法就是说,今天是一个呃社会分工要重构的一个世界,是不是啊?一个一个 moment。那在这个时间点上,我们每个人未来做什么事儿?学什么东西干什么活,可能都极大的不确定性。就是说白了,将来哪些学科还存在,我都不知道。这是我在之前几年前的我我的一个思考啊。在那个moment,当时大家问我说应该学什么,我当时就说那学数学挺好。

为什么呢?就是当你不知道干啥的时候,你先锻炼身体啊。从physical世界的锻炼身体就是那个锻炼身体,是吧?但是在就数字世界锻炼身体就是数学。就你把数学练好了,等到呃等到你。毕业是吧?不管是硕士博士毕业,就业的时候,那个模型再看这个时候社社会分工是什么?但是你你的是体魄是很强壮的,你再去学习那个时间点需要的skill就好了。

但今天呢,我又发生了一些变化,我就觉得,呃,各行各业都会存在。就是在我的新的这个这个体系里面,那都会存在的情况,甚至文科会极大的这个发展出新的这个光辉来。那所以这个时候,其实更核心的还是他热爱什么,他热爱什么,他在热爱的那个点上,就包括艺术。比如说今天说,就是很多呃,我也认识一些学艺术的学生,他都在被老师告诫说,你千万不要只学艺术了,你一定要学个双学位。

就是现现在学艺术的小孩都是在被老师这么告诫的,但是在我看来,呃,艺术仍然是需要的。老师一般让他们学什么双学位了?学啥都行,学啥都行,就是不要只学艺术,那要多惨啊!一个毕业生他也没有对这个世界的一个独特的体会,然后他怎么工作呀?所以你觉得没有所谓危险的专业是吗?你现在会觉得有危险的?就是 think

这个事儿本身是危险的,就是你不要把这个事儿作为你的工作目标,就是每个专业里面都有 taste 的那个部,每个专业里面都有 taste 的。

你觉得程序员危险?很多人会认为 coding 是一个最早被昨天刚被别人问了这个问题,对杀手级应用。我昨天刚被别人问了这个问题啊,我觉得就是呃,要再就业或者准确来讲是做新的工种,就不是现在的这个工种。现在这个工种肯定是被 AI T 了。就是现在其实你看 Web coding 工程团队,其实今天是可以也可以赚很多钱了,就不是做 research 的。

你想做 research 的人为什么现在发了很多的工资?是因为他管了很多卡,比如说我今天管了两个亿的卡,价值两个亿的卡。那分五年摊保好了,那我一年其实相当于是管了公司的四千万的费用的花销。那这四千万到底花的好和不好,直接由我在上面做的实验合不合理决定。所以他一定要找很贵的人,使得他这一波算力的使用,他的 usage 是是合理的。

那倒过头来讲,我们想讲去写代码的人,写代码的人,那你到底消耗了多少 token?就我刚刚说了,就是我们一个工程师一天八千美金,那他一年可能大概消耗掉两千万人民币。kinds of 其实也是他的代表了他的身价的水平的。你如果一年能花一个亿写代码,那逻辑上公司给你五百万也不多。所以工程师,我觉得就是如果只是单纯意义上讲写代码,其实它仍然有很大的价值。

但确实一个亿这个事儿,它也不是随便一个小公司就有机会投了。我们现在是有机会投,但很多公司它确实投不了啊。那那换过头来,我们再去想,就是在写代码这个事儿里面,还有哪些 context 和 taste 可以让这个普通人?来去获得那 context 是什么?我们的软件的环境就是 context 呀,这个环境极其复杂了。

我们上一代的这些软件历史的那些 legacy 都都在那儿,是吧?你今天随便动一个,那边可能就崩了。所以最近大家你去关注一下,在湾区的几个大厂,呃,包括阿莫总,都是因为大裁员之后出现了很多的问题。那实际上,其实我们的这原来了解这些系统的这些老专家极其有价值。就是它能锁住我们的边界,就它能告诉AI什么不能碰。

就是我我不用告诉你怎么写代码,我就告诉你不能碰,这就已经是它的价值了。所以你你回去看那个呃《人月神话》这本书,其实这个布鲁克斯,呃,他在这个获奖之后啊,他一战成名之后呢,其实他当时有他的六条准则,有条准则就是说我的呃,就是我认为。呃,就人类做的所有的这个软件系统,第一版都是要扔掉的。呃,这个哲学思考,呃,他在二十年之后,他在写了一个续版,这个就是也不叫续版吧,反正就是他有一个补充的一个分享。

他说其他很很多条可能都是对的,这条可能要改,因为想他在得图灵奖的 moment,其实人类人类也没有多少复杂的系统,他把那个 System 三六零做的特别特别牛,最后一战成名是吧?帮 IBM 坑了一个大坑。呃,这个填了一个大坑,解决了这个问题。但是二十年之后,其实世界文明已经发生巨大的变化了。我们非常非常多的复杂的IT系统,比如说航空的系统。

比如说,我们火车的系统都是 mission critical 的,包括今天的 Oracle,你随随便便你敢换吗?你敢承担这个责任吗?所以有很多的 mission critical

的系统。呃,就就是它还是有它的存在的意义的,有它存在的意义的。就是在这个里面,就是我们的很多的人类的工程师,其实他还有一个很大的价值,他对这个 context,就是我们今天的这个 AI 不知道那些外部环境到底是有多么凶险,而且那个环境就是天天变的。

因为你看这么想,我写了一个代码,他也写了一个代码。其实他那个代码很快速在迭代,他对我来讲是不是就是一个环境?AI是不知道的,所以人类在这个世界里面其实可以互动的。我我不是我做一个程序员,我假假设这个呃另外一个同学他也是程序员,我可以跟他互动,我知道他的代码怎么写的。哎,我这个AI他真的就不知道。对,说到这个,就是工程师或者说程序员的接下来的更大的价值。

我看最近 Asarpic 的产品负责人,他其实是 Instagram 的联创,就是 Mac Krieger,他也是分享一个事儿,就是他觉得有一件事儿很难被人替代,就是我到底去怎么设计一个产品。我判断它应该有哪些功能?他说现在那个 web coding 特别发达之后,他会带来一个他觉得开发上的误区或者苦恼。

就我这个事儿呢,这个事儿非常有意思。这个事儿从哲学上层面上来讲,就是 AI 永远不能取代。永远不可能取代人。对你从这个一个软件怎么设计来讲的话,这个我们从软件工程角度叫需求分析,是不是叫需求分析?需求分析这个事儿的本质没有唯一解,就是你觉得一个好的软件和我觉得一个好的软件根本就不一样。而且我觉得他讲到有一个点挺有意思,就是他说这个过程可能。

很难,因为你编码变得更快,你的时间就能压缩的特别特别。这就是第一版要扔掉的那个道理。对,因为你就是得放到真实的环境里,让真实的用户去给他反馈,就好像是在一个自然环境中成长的树。我从哲学层面给你讲讲这个概念的本质是什么,就是写代码的人本质上就是工程代码或者每一个软件架构师,或者说 cloud code,它其实就是一个本体论的一个实践者。

所有的需求分析师呢,是认识论的实践者,就是日,就是就是本体论,其实就是我们一个产品经理或者一个工程师最开始想象的这个世界是什么样子的。它底层了这个代码的一个概念是吧?我们上一代的软件里面那个概念,我们叫 ER 图,就是一个关系型数据库里面有哪些表、有哪些字段、表和表之间有什么关系。说白了,就是这个系统背后有哪些概念。

这个概念是我最开始想象出来的,但是真正这个世界不是这个样子的。我其实真正在这个世界去互动的过程中,突然发现这个客户是这么想的,那个客户是这么想的。就我最一开始,比如说张小龙,他想了微信是应该是这么设计的,他想完了以后,最后他跟普通大众一交互,发现大家根本都不想这么用。那这个过程其实会反复打磨,反复打磨,反复打磨,打磨出来的第一版。

这个第一版其实是一个本体和认识世这两个世界之间的一个交互,最后产生的这个结果,这个结果才是你真正要做的那个事儿。最开始你想象的那个概念根本不是,是吧?那这个事情最后你会发现,哎,我设计的不太合理,但是你已经把地形摸清楚了,就是你对这个世界的认识已经了解,对你所在的战战场有了解了。其实你的第二版就会基于你对这个地形的了解再重新重构,是不是?

你就变成了微信二点零。等到二点零的时候,突然就发现,哎。我对世界理解又发生变化,为什么支付宝变了,是吧?然后你又开开始搞第三版,所以其实就是我们相当于是说,代码呢,它永远知道今天的代码是什么样子,以及它知道计算机系统的能力是什么,但它不知道外部世界是什么,以及它不知道每个人真正想要什么,这些东西永远都不知道,肯定是人来干。

但是今天 AI 能不能辅助人在这个上效率高一点,这个当然有可能。你觉得比较确定性的会发生的变化是什么?进一步会发生的变化吧,有些可能现在已经发生了,但是它会进一步扩大。我觉得就是哪怕不是我们公司第一个把 scaling out 的这种逻辑的 AI 做出来,我相信市场上总会有一些小公司把这个东西做出来。

大公司说不定里面也有小团队做出来,只不过它碍于公司利益,它其实是不能发的。嗯, scaling out 就是就是你说的 MOA 的方式,是是。那我们可以验证一下,是你觉得在二六年之内就会发生,对吧?那就未来的八个月啊,是是。嗯,是我们自己也会陆陆续续有一种一些用这种方式做出来的模型的,呃,这个工作会陆陆续续开源。

呃,这些开源以后呢,大家也能见识到,说我们用这种方法做出来的模型跟上一代的模型它就是很不一样的。它在类似于像呃,比如说姚顺宇的这种榜单上,它就会有非常 outstanding 的这个成绩表现。因为它更容易适应这个细分的战场,而且模型成本也很低。那今天欢迎吴明辉辉哥做客晚点聊,分享了他在最近这一段时间重新迭代的很多关于AI、关于AI怎么商业化以及未来的。

Agent的商业伦理的思考,然后我们也延展聊了,就是教育,包括大家怎么学习AI,未来人和AI是个什么关系?我觉得既有非常商业上的一些洞察,也有一些很深刻的人和社会关系和AI协作的变化。那今天的节目就到这里,感谢各位的收听,拜拜。好,谢谢大家。本期连点呈现推荐今年以来两期关于 agent 的节目,一是

151 期,我访谈了 Mulran 的创始人陈宇森,那一期讲出了去年底到今年初一个越来越成为行业共识的想法, coding agent 就是通用的 agent, cloud code 就是当时最好用的通用 agent。

这之后不久,OpenCLow出现,这个由个人开发者开源的Agent框架,掀起了出圈的热潮。相比Cloud Code要在Terminal终端界面做交互,OpenCLow把Agent的能力放到了我们常用的聊天软件里,也放到了手机移动端。它通过定时任务、远程控制等特性,拉近了普通人和AI Agent的距离。

这就像 O 一之后有了 R 一,把推理模型的概念和技术实现通过开源的方式做了极大的普及。而关于 OpenCL,我们在第一百五十六期中和 M O E Capital 创始人 Henry In 做了二六年 Q 一的 AI 气报,那里面也对 OpenCL 有非常详细的讨论。当时提到了一个有趣的具体数据,是亨瑞统计了我们录节目之前的五十二天,Anthropic。

给 Cloud Code 还有 Cloud CoWork 等产品做了七十二次更新,这和第一百五十一期中雨森以及这一期中吴明辉聊到的一个软件迭代的方式都相关。就是再往后做定制化的软件和改软件会变得越来越快,这会深刻的改变我们过去那种使用标准化软件的方式。除了那些拥有大量用户基数以及因为一些特定的安全和行业考虑。

而被保留的高频软件之外,更低频的个性化的快速变化的软件,很有可能会成为软件的主流。用雨森的话来说,就是未来的软件可以是三D打印的。是日抛式的。Mu Run 当时看到的机会是做这些低频应用的 3D 打印机,而明略目前的思路则是通过 AI

加持的新的开发方式,快速开发和开源软件系统本身。再通过自己掌握的独有的数据 context 的上下文以及自己训练的一些行业模型来赚取 AI token 的收入和利润。

二零一一年,A十六Z 创始人马克安德森提出了一个著名的观点:Software is eating the world,软件正在吃掉世界。当时他指的是软件会重塑各行各业。其实以后视镜的视角看,AI 重塑各行各业的方式依然是通过软件。是通过软件底层的代码,也就是 coding。这句话现在可以变成 coding is eating the world。

至少是大部分的虚拟世界。对 coding 投入最多的 Anthropic 现在成了暂时的领先者,OpenAI 也正在快速追赶。接下来从模型的底层到应用,从 coding 到软件,从技术到商业会怎么变化?有很多等待验证的可能性。这肯定不是结束,甚至不是开始的结束。本期节目就到这里,欢迎收听。如果你对今天聊的话题有观察、好奇或疑问,欢迎在评论区分享想法,这也会成为我们节目的一部分,让整个讨论更完整。

你也可以把我们的节目分享给对这个话题感兴趣的朋友,欢迎推荐更多你想听的主题和嘉宾。你可以从小宇宙、苹果Podcast等渠道关注“晚点聊Late Talk”,也欢迎关注我们的公众号“晚点Late Post”。下期再见。