其实现在最强的 general agents 是 Claude Code。如果有人意识到这件事情,他其实想做的事情就跟我们类似。就是写代码这个事情被无限的平权化了。那在这个前提下,选择有审美的任务、优雅的解决方式和选择去解决什么样的事情就会变得很重要。我觉得软件未来其实是日抛式的,就是你可以理解为软件不存在了,代码只是为了执行特定目的而完成,它会精确的被创建、执行、完成、销毁。
当时自己感觉自己重度焦虑,挺严重的,就躺床上都要起不来那种。你会严重的失眠,你会想到底是哪里出了问题,怎么能错这么多,这么多错误的判断?欢迎收听晚点聊,我是曼奇。今天的嘉宾是 Agent 交易平台 MuleRun 的创始人陈宇森。雨森是一名少年成名的连续创业者。二十二岁,他从浙大毕业后创办网络安全公司长亭科技,五年后成功退出。
之后,他继续创业。现在,他带着对 AI Agent 的理解重新出发。MuleRun 基于这样一个核心假设:当 Web Coding 大幅降低了开发门槛,大量非技术背景的人也能把自己的工作和知识流封装成一个个勤恳的 AI 驼子,来实现个人工作的自动化。比较特别的是,这期内容包含了两次聊天,分别发生在二五年十二月和二六年一月上旬。
不到一个月里,随着 MuleRun Agent Builder 开始内测,陈宇森和 MuleRun 的思路已经发生了一些变化。他认为,未来的交易平台 Marketplace。不会再是我们过去熟悉的货架形态,而是在对话中触发交易。MuleRun 的调整本身也是当前 AI
应用瞬息万变的一个缩影。这期节目的后半段,我们也聊了一个创业十年、成立过四家公司、经历成败起伏的创业者,如何以用心避免陷入平庸和对抗自我怀疑。
我们进入节目吧。你首先听到的是十二月的访谈中,陈宇森讲述为何最初会放弃做单纯的 Web Coding 产品。基于 Claude Code 是最好的 General Agent 的认知,他们怎么推演出了 Marketplace 的机会,以及对上下游生态里的其他产品,如 N8N、Defi、字节 Code、蚂蚁灵光的观察。
嗨,宇森,你可以和我们的听友简单打个招呼,介绍一下自己。Hello,大家好,我叫陈宇森,现在是 MuleRun 的 CEO,然后我们在做一个 AI 的 Agent Marketplace,就是一个 AI Agent 的市场。我们希望通过这样的产品,让一些开发者做出来的 A I Agent 可以被更多的人使用,他自己能获得一些经济收益。
其实宇森之前的经历也很丰富,你今年是三十三,三十三,三十三,但是之前已经创业十几年了。你这次创业开始的时间是什么时候?为什么想到了做 Agent Marketplace?我们思考这件事情应该是在二四年的年底。因为那个时候呢,我们可以看到比较明确的就是 Cursor 是明确的找到了
PMF,呃,也就是说,在这种大语言模型它的能力或者它的智力提升的情况下,它开始在一些应用领域, coding 就是一个应用领域嘛,那开始就是去产生真正有生产力的价值。
所以在这个前提之下,其实当时的想法。就是觉得 coding 其实会是一个非常通用性的能力,它会让 AI 可以做更多的事情。因为本来我们通过编程可以实现很多事情,那如果 AI 可以实现,呃,替代或者说帮助人类编程这件事情,那很多事情就可以 AI 直接做了。它是个桥梁性的工作。所以在那个时候呢,其实我们最早想做的产品,或者说我们在四月份其实做出来了一个产品,有点像那个 Lovable。
就是 Web Coding 的产品,对 Web Coding,其实当时还是规划了蛮多东西的。然后,但就后来发现,在一个就是 AI 这个领域的应用,其实可能有一个特点,就是当你去做一个别人已经可能做出来一段时间的东西,而且大家团队都很优秀的情况下,其实你很难去获得流量或者说呃用户。就我们做出来之后内测了一段时间,就发现。
好像没有做的比别人更好。当时就是你拿同样的 prompt 在我们这边跑,然后或者说去 label 或者 bullet new 这两个应该是当时可能就是流量或者风头都比较好的两个海外的产品。其实做出来的网页或者大多数的任务下面跑出来的结果一样。那这个东西很简单,因为大家其实当时依赖都是那个 Claude 它那个 API 的能力,也就是说你的产品能做出来多好,其实跟它相关。
因为模型能力的智力提升,所以显然这些产品都变得更强了。但是,其实回过头来看,也没有人在这个一年的赛跑之中,通过自己的某一些设计,可能变得比别人更强。比如 WinSurf,我们也没有看到说它可能就超过 Cursor,它可能还是在 Cursor 后面。包括 Davin,可能这一年除了他并购 WinSurf 上的团队之外,好像也没有在产品创新或者进步上做出太多的东西。
所以在这个领域,我们可以看到,就是它的竞争格局其实跟去年年底好像没有发生名字上的变化。嗯,对,呃,除了那个 Claude Code,Anthropic 它自己做的这样一个 coding agent。OpenAI 也做了,对 CodeX,其实这两个产品就在今年,可能最近这段时间的进展呀,或者用户数提升都是非常猛的。
Google 也刚刚发了 Anti Gravity 那个,嗯嗯, Anti Gravity 对,但是那个产品还没有去使用或者没有看到身边很多人用起来,有同事去尝试,但是 Claude Code 的的确是给我就是感觉到了一个更大的变化,因为他们这种模式其实启发了一个新的 Agent 的创作范式,怎么讲?
简单讲一下,其实现在最强的 General Agents。是 Claude Code。如果有人意识到这件事情,他其实想做的事情就跟我们类似。我们最早可能通过了一些各种各样外挂的方式来实现所谓的 SOP 加大模型。所以,我们所谓的外挂,大概你可能是写在 Long Graph 里面一段代码,或者说是你本身这个 Agent 就是一个纯粹代码化的,而不是说你在大模型上面去加 Prompt 来实现的。
但是,我们就发现,随着大模型能力进步,你其实,在一些足够复杂的任务,你给它足够复杂的 Prompt,然后只要你确保这个任务不会把它的上下文跑炸,因为跑上下文跑炸,它就完全幻觉大量出现了。只要在上下文不跑炸的长任务里面,你给足够复杂的 prompt,是可以让当前的大模型就去处理足够复杂的事情的。当然,你可能做一些所谓的叫 context engineering 的事情,但那是工程上的一些事情。
这个东西意味着你怎么把那个 prompt 给它,同时你那个 prompt 里面的一些写法,它其实是类似于一个怎么用好大模型的问题。嗯,那这个将解决之后呢?其实它就能把一些任务处理得非常好。底层假设就是说,其实当大模型有了 coding 这个能力之后,理论上它能在一年之内做所有人类能在电脑上做的事情。
在这个认知之上,我们就判断现在 AI 可能还有一些事情做不好,就是人类还是始终有很多知识沉淀在线下或者很多人的脑子里面的。那在这样的前提之下,如果他把这样一些线下的知识和他个人的经验,跟大模型的理解和判断能力结合在一起。他其实就能把他个人能力可能百分之八十、百分之九十 copy 进一个 agent 里面。
那同样面临这样的问题的其他人,他就不用从头的可能操作电脑去解决这个问题,而是直接用这个 agent 付一个更有性价比的费用。那创作者赚钱,他也可以花小钱办大事儿,这样子就形成了一个很好的交易生态。这是我们基于那样的一个前提得出来的结论。你刚说的那个前提是指 Claude 是最好的 general agents, Claude 是目前最好的 general agent。
的前提得出就是,其实以后很多你想实现的需求是可以用这种方式实现的,这个 agents 就能实现啊。而是更需要的是一个交易平台,而不是再去做 Claude Code 已经做的很好的事儿,是吗?我我理解是这个逻辑,这个事情是个变化。就是说回来,我们自己的思路演进,就是最早我们觉得目前还没有一个很好的 agents 交易平台出现,所以我们就做那个部署和交易平台啊。
我们框架中立,你在哪儿做了,你都可以在这边部署。这样子的话,你可以在这里去赚钱。赚钱是人类就是生产力大发展的一个超级前提,它是一个可能最大公约数。在这样的一个前提之下,我们最早设定这样的产品路径,但是做到现在,我们就会发现说,其实你要 enable 很多所谓的行业领域专家来去做
agent。我们觉得低代码都有点复杂,这是为什么当时没有去做的原因,就是觉得能做低代码的人,其实他本质是可以 coding。
所以,真正让普通人能够去 coding 的一个前提是你只需要自然语言,你不需要知道什么是参数,什么是拖拉拽,什么是循环,什么是条件。所以最自然的描述方式是,他只描述需求和工作过程。这个他自己日常就在做。比如说,可能一个做招聘的HR,你知道每天自己的工作流程是什么?你按照这个流程再去做工作。一个在做客服的人,你知道你每天上班你要用哪些软件?
去哪儿拿到对应的知识或者操作什么东西去处理客户的一些所谓的客诉也好,他的请求也好,退换货也好。它其实就是说,你有一些知识,同时你知道怎么操作一些软件,去完成一些特定任务。那这个事情呢,我们认为就把它这些工作流程描述的足够清晰的情况下,AI应该是可以。高准确率的去完成这些任务的,在这样的前提之下,他就可以赚钱,因为这样的任务可能每天有一千个人或者一万个人或者少一点二十个人都要做这个任务。
那如果这个任务可以被 agent 比人类更高效的完成,那那十九个人就可以花钱让这个 agent 去做这个任务。对,那你正好可以描述一下 MuleRun 现在,因为它是个双边平台嘛,一个 marketplace,它两边的供给和需求方都是怎样的?其实你刚刚说供给的一种啊,你说这种其实就是这个人他可能之前完全没有开发的经验,然后你可能给他提供的这样一个环境。
或者说一个框架,让他可以直接用 Claude Code 或者别的工具生产出他想用的这个流程,然后别的人也可以复用,这是一种,对吧?还有一种可能是大家一般想象的更直接的,就是一个开发者把他做好的 Agent 上传到你们这儿啊,嗯嗯,或者就是简单他做好的一个 App。这两种是你们现在都有,还是哪种供给是你们更重要的?
我们只有可能目前只有传统的那个,我们就不叫他 Agent 也好,就叫它一个应用,但是它是一个可能解决一些少部分人的需求的应用市场。可能换一个角度来去理解这个问题,就是真正让我们觉得这个事情成立的前提,还是 web
coding,就是说过去代码是一个成本高的。生产方式,我们很难去为了十个人或者五十个人的需求去做一个应用,但是在现在有 web coding 或者说大语言模型它 coding 能力强的情况下,我们就可以为十个人甚至一个人的需求去做一款软件。
嗯,所以你们现在比较主要的供给是我刚刚说的第二种,对。然后你们二点零的版本是我是你刚刚说的第一种,一种对,因为现在的供给。是不够丰富的,或者说,无论是说大家的创作过程和我们的上线过程,都是足够复杂的。嗯,这这个就其实没有去命中我们最核心的假设。我们最核心的假设是这个生态会无比的丰富,它可能超级长尾。
我可以为了比如说雨森这两天有个很奇怪的需求,但是可能这个奇怪的需求别的十个人也有,有一个人就做出来了,我就去用了。嗯,那呃,当这样的事情大量出现的时候,我认为到了我们产品的PMF。但目前的话,呃,没有到那没有到的话,我们回过头来看,到底是我们没有找到足够多的用户,还是说我们其实没有足够丰富的供给?或者,那足够丰富的供给,它的前提是你的供给的这样整个的流程是足够便捷、足够短,就是你只有门槛足够低、足够简单,它才能丰富。
这样的前提才能有丰富的市场,才可能有后面我们的假设。那我们后来发现,就是在最近产品上线的几个月,我们完成了交易功能,也有一些供给上线,同时我们的用户的增长团队做的也不错,我们其实还是有挺多的注册用户进来的。但是我觉得遗憾的事情就是,我们没有看到。足够大量的 PMF 发生,那这个回过头来看,我觉得可能供给的丰富度就是个问题。
我们现在的上架还依赖于我们可能有一些人工要参与,要审核,包括它的创作。我们目前上的一些方式,比如说我们支持 N8N 的 workflow 的上线,或者我们支持一些大家用 LangGraph 做出来复杂的 Agent 上线,或者有些其实开发者也没有告诉我们他们怎么做的,反正它就是一个应用,可能通过一些方式让它上线。
那还是不够丰富,所以就绕了这么一大圈。我们说回到刚刚那个话题,我们认为 Claude Code 就是一个非常强的 General Agents。那对于可能绝大多数开发者来讲,他只要跟给 Claude Code 描述清楚他要做的事情,然后我们同时有一个足够丰富的 Claude Code Skill 的 Market。
然后,这个可能我们官方就会来下场做一些,因为呃,skills 清晰的描述和他的把一些东西讲的清不清楚,他的能力上下限就会有波动,所以我们尽量是这些东西可能官方或者说呃有限的生态来做,但是开放给所有人的呢,就是说你描述清楚你的需求,选择。你需要的 skills,比如说你的 skills 要操作
Excel,你的 skills 要操作浏览器,或者你的这个 skills 要用某几个软件,那这几个软件的使用的方式可能是放在里面的。
所以在这样的一个前提之下。普通人只要描述清楚你的需求和 Claude Code,他就能够整体把一个 Claude Code 的一些 skills,一些所谓的给这个 Claude Code 的 runtime 或 runtime
环境打包成一个我们叫它可能是一个容器了。对我们还没有想好最后可能实现的方式,也可能是一台虚拟机,一台 virtual machine,然后就这就是这样你创作出来的 agent,呃,你就可以用它稳定的去交付你的任务。
如果后续有其他人想用,它也就同样起了这样一套东西。那这样整个的创作过程核心就是极大的降低了开发的门槛,嗯啊,我不知道你可能想想你在工作里面有没有某一个任务,你可能每天或者说每周都要去做,或者每周做几次,但他的工作内容呢?较为重复,同时呢,主要是操作电脑为主。我不知道你确实有没有可能想到某一些,有一些。
但我最近其实是做了一个手机上的东西,就是我用苹果的快捷操作做了一个截图的自动化的流程。我以前没有玩过这个快捷操作,我发现还挺有意思的啊。是的,是的。大概就是我先截一张图,然后。它会自动的按照某一个比例把你的这个屏幕截图给裁成一个样子,然后再上传到我苹果的云盘上,在我,在电脑上就能直接看这样。但我觉得类似吧,就是你操作电脑可能也是一些类似的东西。
是的,是的,非常同意。但这个能力它其实挺早就有了。我们最早就是团队里面有同学很好玩,他就是把他的我们那个 MuleRun 平台的那个登录。的我们叫 credential 把放到手机上,这样子,他通过手机的快捷操作就可以直接调起我们 agent 帮他处理手机上的东西,然后把东西发过来。我觉得这个就是一个非常好的例子,但是可能它简单了一些。
稍微复杂点的例子就是说,可能你是要有一些个人的判断在里面的。然后现在你可能只要教会大模型怎么去在这个任务上做判断,它就能把判断那个步骤也帮你做掉。因为过去的软件是没法做这个事情的。比如说我们大家可能工作里面都用很多 SaaS 软件。你用一些聊天的
App,你也用一些可能需要,比如说一些销售类的的人员,他要用 CRM,或者一些供应链的同事,他要去用 ERP,但是他过去的操作都是基于个人对业务的判断去操作的。
比如说今天有一个货没有了,我要补货,但这个事情如果有一个大模型在那边,它是可以去做这个判断的。但是过去,如果你很难把一个对于人的判断通过大量的规则描述写成一段完整的代码,因为它的理解能力是不够好的。但现在其实就是说,如果有一个非常可能标准的工作流,一些软件在那里,中间的这个胶水部分,就是过去很多没有那么大智力挑战的判断部分是可以拿大模型替代掉。
那也就是说,其实整个的流程自动化就可以跑通掉。所以一个东西半自动化和全自动化它的区别会非常大。因为 AI 可以 24 小时工作,然后它可以把自己复制 一百分、一千分来工作,所以这个就会完全不一样。所以我们会觉得,回过头来就是说,我们觉得 Claude Code 它当前的状态其实已经可以把创作一个 Agents 的门槛降到足够低。
嗯,就是感觉到了。对,所以我总结一下,就是你们认为 Claude Code 是一个现在最好的 general agents,一个通用的智能体,而且它已经强到可以把这个 agent 的供给极大的丰富,所以现在是一个很好的时机来做这样的一个交易平台,对吧?就是我们最早做交易平台的时候,我们可能等的就是这样的一个点,就是我们可以让创作变得足够简单。
那个时候没有想到这个东西可能长什么样,但这个里面有一个很好玩的点,就是其实你可以看到 Anthropic 它自己的 blog 也有写,他们最早做 Claude Code 出来是想让它去可能当一个 coding agent,但是他们就是 Anthropic 很多内部的同事呢,他们就拿它去,比如帮他看邮件或者做各种各样的事情,就是做的是一些 general 的电脑操作工作。
他们原生的就发现了哦,其实大家也是有这些需求的。大家需求不是只有写代码,而且 Claude Code 能把这些需求做比较好。同时,那我刚刚其实说的核心一个点,就是怎么让 Claude Code 把这些事情做得更好,就是我们给它足够好的软盘。嗯,就是你不给 Claude Code 的一个浏览器的时候,其实它做不了一些在浏览器里面需要的操作。
足够好的 runtime 这个翻译一下是什么?runtime 指的是一个环境是吗?对,环境就足够好的运行时环境。比如说,你不给 Claude Code 一个浏览器的时候,它就不能帮你在浏览器里面做操作。那怎么样让一个浏览器更好的被 Claude Code 操作?这里面可能有一些工程的问题要做。但是你给了它之后,它就会了,因为它能力足够强,而且它可以把一些足够标准的任务自己去做。
前面我们讲的可能建设上下文呀,啊,有些标准的步骤,它自己就把它变成代码去执行了。嗯,对,就包括说这两天那个英伟达发了一个东西,可以帮大家打游戏。那我们回过头来说,能不能让 Claude Code?你给它一台 Windows,它能不能在里面帮你打游戏呢?答案大概率是 Yes,但是你可能要对这个游戏的一些操作和一些游戏里面要做的事情,就跟他讲清楚,因为它可能缺乏这方面的知识 skills。
所以在有足够好、足够丰富的运行时环境和足够清晰的 skills 的时候,理论上现在 Claude Code 已经可以做电脑上的任何操作。嗯,而你们做的就是这两件事儿,对吧?就是给大家提供足够好的运行时环境和清晰的 skills。以及你们有一个交易的系统,那套系统虽然听起来就可能它不是很性感,可能大师都能做,但你真的要做好也还要花时间。
然后我们的创作者其实在这个之外,就写他的那部分叫描述也好,prompt也好,SOP也好,嗯,连接起来就是。丰富的各种各样的不同 agents,嗯,其实我们觉得这里面有有一个事情,就是目前没有被商业化的点,就是一个足够好的 prompt,它是有商业价值的。对,但现在大家大量你可以看到很多 A I 博主,或者说大家的方式就是我有一个很好的 prompt,我就写了分享出来。
比如说今年 Nalo Bandas 火的时候,桌面的那个手办模型的那个 prompt,肯定是最早有一个人想出来,但我们现在也不知道他是谁,他就分享出来,然后大家都发现他用,这是很好玩的事情。就后来发现我们平台,因为我们觉得。降门槛是一个非常重要的事情,就这个事情可能大家都有理解,大家都觉得降门槛重要,但是你把降门槛排在你产品的哪个优先级,其实是。
一个很很核心的思考,就大家都会觉得降门槛重要,但你可能把它排到你的产品的第四或第五优先级,那相当于你认为它不重要。所以这是你们的第一优先级,这是我们的非常强的优先级,我认为几乎是第一优先级。没有想到一个比这个重要的,因为模型能力在提升的情况下,供给的丰富度一直是我们最在意的问题。嗯嗯。但是那个问题我们最早没有找到足够优雅的解法,那我们认为现在这个可能是个解法。
刚有一个很好的例子,我觉得可以提一下,就是说在 Nano Madas 刚上线,大家都在去拿它做一个那个所谓的桌面手办的时候,那个时候你就会发现,你要去自己实现这样一个东西,你首先可能要有能访问到 Gemini,或者说能访问到 Google 的 AS Studio 的能力。我们知道这个能力不是每个人都有,然后同时呢,你要去网上,不管是去 Twitter 或哪里,你要能找到这段 Prompt。
用好搜索引擎的确还是一个有门槛的技能,所以说很多人他就是啊,我看到我好羡慕呀,我也不知道怎么做,甚至你就可以看到有人可能就在闲鱼或者什么地方,对对对,帮人家做收多少钱?对,一次可能也收你五块钱人民币,还有很多人。其实我们这儿有一样的事情,就当时就有很可爱的创作者,他其实就在我们这儿上线了 agents,一个很简单的可能 NLP workflow,他做的事情就是你给他一个图。
他自己在背后调用那段 prompt,然后把这个东西发给
Google,然后拿到结果给你收点钱,嗯,呃零点几美金吧,费率不高,但你就发现它还是用户量蛮大,特别在那个南德本纳斯火的时候。说对,我看他是不是三天赚了一千二美元?呃,应该是那数字记具体记不清。所以在这个前提之下,我们就会发现,比如说我们在技术圈子或者我们在这个 A I
浪潮中的人,有任何新东西出来,我们都知道找哪儿,去哪儿找到它,去哪儿怎么用。
但是对于很多人来讲,他就是不知道怎么用。但是你真的给他一个足够便捷的使用方式,他也会用,他也感兴趣。所以我觉得这就是一个很好的例子,证明我们做的这个事情可能有商业价值。这个其实应该还是有很大的基数的。你说到这个,我想起来我之前发生了一个特别有意思的事儿。嗯,就有一次我和一个投资人的朋友在一个餐厅里吃饭,我们是坐在吧台,所以离服务员很近。
然后后来这个人出去打电话了,那个服务员很小,大概十八九岁,就问我说:“姐,你们是不是搞AI的?”然后就说他自己在一个群里,然后有一个台湾的大哥带着他们就是用AI赚钱什么的,就给人P头像。嗯。其实就是有人给他传一个照片,然后他放到一个什么那种,当时也有一些免费的东西给你搞搞滤镜。我觉得这个事情咱们再往前几年说,就比如说当时生图模型不像现在,可能大家都把它跟大语言模型训在一起。
呃,所以说你可以看到,从可能今年的 ChatGPT 里面它上了生图,和 NanoBardanas 上了生图之后,他们的生图效果都是,首先效果好,第二是你的生图的那个 prompt 的编写也简单了很多。但是如果再往前几年,可能那时候大家在用 Stable Diffusion 或者说在用
Midjourney 去生图的时候,那一段 prompt 其实它都有点像代码,因为它不是它有一个格式啊,它不是很像自然语言。
对,然后它有一些地方你要输那个关键词,它效果就会不一样。所以在这样的前提下,就当年。我有朋友,他可能 MuleRun 帮人家生成人家想要的某一个方向的,比如说小猫咪的卡通头像,或者说小狗的卡通头像,一次也能赚十块钱。所所以就是这种需求,在门槛不够低的时候,这种就是你做一个所谓的 AI 能力和普通人之间的翻译中介的。
就是 A I 的狗腿子是能能赚钱的,这个比喻挺有意思。对对对,其实就是这样。就是说,它的能力其实已经到那儿了,但不是所有人都会用,或者能把它发挥出来。这两天有一个那个 Gemini 3 的一个,应该是他算是核心工程师,接受采访,就是说大家也好奇为什么 Gemini Gemini 3 Pro 能这么强。
他说了一句话,我觉得非常有意义,就是他说:首先,现在大模型的那个 scaling 还远没有撞墙,智力还能提升。然后更有意思的一句话是,哪怕现在大语言模型智力就停在这儿了。我们距离把它的能力榨干,可能还有一到两年的时间。就哪怕现在所有的 Chat GPT Gemini 大家都不进步了,那我们其实还没有把它能力用光。
所以我觉得这是呃,所谓大家比如说二五年是 Agent 元年,二六年什么应用大爆发。我觉得当然,因为现在的模型能力已经是可以支撑做很多不一样的东西出来了。只不过整个的,就是创业公司也好,大公司也好,我们还没有把它的能力上限炸出来。那在这样的一个前提之下,就还是有很多事情可以做的。你看到的市场上的在做类似的事儿的其他的玩家是些什么状态?
我觉得那个时候,特别在 agents 或者在 workflow 这些事情上,大家都在卷创作工具。呃,我觉得最有名的三家就 N 八 N B 发和 Code 子,就是他们当时产出的大量的产品形态是 chatbot 类似的,就是输入输出不够丰富。我讲一下他们的现状,但我觉得,因为大家都是强的创业公司或者大厂里面的,就是自己也是一个,我觉得哪怕现在很大,但是它里面的团队也是非常有战斗力的。
Commons 就是说,它很早有一个 N R 的 Marketplace,但是它的 Marketplace 是卖源代码的。就是他没有意识到这件事情的重复交易价值,我觉得他长期来看有可能会意识到,但搜目前来看好像没有意识到。然后 DeFi 的话,他更专注,因为我们跟 DeFi 很多交流,甚至我们之前有一个,就是我们希望 DeFi 做出来的东西可以直接在我们这儿跑起来。
啊,跟他们几位 co-founder 或者 slaver 的人也沟通,就他们其实也看好这个方向。然后 Dify 自己现在专注的,其实在做,啊,它商业化主要是 To B,你可以看到它其实在日本市场做的很好,在美国也做的不错。一些大的公司内部要去做一些工作流的时候,因为这些大公司内部的软件没法让外面访问,所以它需要有一个产品做出来,一个在内部可以跑的工作流,跑在内部环境,其实主要是个安全问题。
他不能让他的内部那些软件暴露出来,这是 Diff 在做的事情。那扣子的话,我觉得最早他们其实核心的逻辑还是。其实他们开发出来的大量产品,不管是 cos 点 com 或者 cos 点 cn,它上面大量的产品都还是 chatbot 类的,包括他自己的这套创作工具。我觉得他花了非常多的时间,他还是可能最早坚信低代码的。
但是最近他有一个发布会,然后觉得就他变化很快,因为他觉得可能他要做那个类似于 web coding agent。就我不是说我还要去拖拉拽了,你只要给需求我就能做出来。但我没有去看他们产品到底做的怎么样。对,我觉得他看到了一个我们更 respect 的变化,因为他这样变的话,我们觉得他就比原来那样可能更好。
我觉得其实,在目前的定位里面,我们都算上下游,但 Claude 它是个封闭生态。就是他他的东西很难,我我也不知道他是不是能做好。就就比如说在扣子里面编辑好之后拿出来部署在别的地方跑,但另外两家都是可以的。嗯,就 N B A 和 Dify 都可以,它是可以在你们的环境里跑的,但是扣子的这个你不清楚是吧?
我印象应该是不行,但我觉得以后未来会不会改这一点?对,但是字节的习惯,我觉得他应该会大闭环,所有东西都做掉。所以可以预见,字节应该是也会做这个。我相信这个 marketplace 最终大家很多人都会做,但是每个人对它的思考和里面的产品优先级可能会不一样,导致最后其实是我觉得最后是一个就是不同的选择,看最后谁能跑到最后。
那我们肯定希望我们的选择是最优化的。嗯,对,我觉得大家在路径选择上会不一样,但殊途同归,谁不想要一个新时代的 App Store?没有人不想要,都想要。但是这个路径路径选择,我我认为目前可能大家还不一样。嗯,就是蚂蚁现在做的这个灵光,它和 Agent Marketplace 的这个关系是什么呀?嗯,我觉得他也会想做这件事情。
其实大家就说蚂蚁说灵光不就是高配版的马卡龙吗?他们的生产关系选择不一样,他们的生产关系选择是我自己做自己用。你要是自己做别人用,那是 you will。林超平做的其实这个事情,我觉得大家在未来的某一个点上都有可能撞到。只不过他对自己做,别人用,他对他的理解是个社交网络,我们对他的理解是个交易市场,做出来一个东西,对吧?
你可以给大家用,但是他对做出来这个东西,我们叫它商品也好,货品也好,产品也好。他认为,他社交网络规划的一部分。嗯,我觉得他这个东西是这样的,就是其实你一个东西做出来之后,你自己用和别人用这个属性是天然同时存在。对,只说你作为一个平台,你作为一个产品,你把什么东西放在优先级,你去更鼓励和激励那种是形式啊,是的。
嗯,其实就像拍照一样,就是比如说我们讲讲拍照这件事情好了,就是它是从智能手机丰富之后,其实才更加平权化的一个事情。最早你要拍照,你可能像可能十几二十年前的时候,你要买一台蛮贵的数码相机。嗯,对,不是每个人手人手都一台数码相机的。当时你可能手机,我们那时候还在用摩托罗拉和诺基亚,它那个拍照其实是不具备美感吧。
它只有记录能力,就哪怕现在大家说有时候拍那种所谓的 CCD 模式,就是说有一点这种复古的感觉。但但那时候我们上学的时候可能拍一张就是记录了一下,非常低分辨率,噪点也很多。但是真正当拍照这个东西通过智能手机的普及进入每个人的时候,以照片这个载体也长出了各种各样不同的东西。比如说,我们可能每一个所谓的社交网络都有发图的功能,但在海外有就是 Instagram、Snap。
比如说,大家都是图,但它也长出了不同的产品。就我觉得现在 Web Coding 的产物其实。因为它太新了,那大家对它的这个产物的定义和拿它来做什么样的产品,其实是在不同的路径上做选择的。对,比如说像就是小明做 Wear
的话,我觉得他更多是把这个东西理解成一个内容。对,所以确实,他们的平台上你能看到很多东西,它是有一些呃娱乐或者内容属性的,比如说游戏,对,比如说一些作品的呈现,比如说像那种线上的 Gallery 的这种东西。
然后你们如果把这个理解成一个交易平台,其实也可以想到,就你们更鼓励的或者说来这儿的更多,他做的是一些工具和效率类的东西,生产场景的。我认为是生产力,我们认为是生产力的素材之一,生产力的。生产工具,我觉得类比是有信息损失的。我们就认为他做出来的东西是可以帮别人在工作里面解决一些事情。嗯嗯哦,你们之前还说过一个比喻,我觉得那个也比较直观,就是说它其实是一个很大的外包的劳动力的市场,你也可以这么理解啊。
是我们认为我们的当时一个自己,就是我们觉得想象力嘛。那大家总会说,哎,你们公司的上限在哪里?那我们觉得我们如果做得好,我们是一个全球最大的劳动力外包公司。因为现在 MuleRun 算是正式上线有三个月了,对你刚才也大概讲到了一些表现啊,这个可以展开细节讲讲。对,一个就说你没有觉得它涌现了那么多想象中的 PMF,可以讲讲你们本来都预想是怎样?
我们本来的预想就是,你可以理解为早期我们设定了一些很 niche 的场景,那我们这些 niche 的场景,我们希望它每一个场景能有一定的用户,可能一百个 DAU 用户。他说:“我就需要这样一个东西,帮我每天解决这样的问题。”但是目前,我觉得可能跟早期我们在,我觉得早期其实双面市场是一个启动非常难的东西,就是你一方面要去做供给,一方面还要有人进来。
那你没有人的时候,那供给说我为什么要做个东西放在那儿跑?那用户会说你这什么都没有,我来你这干嘛?所以这个东西其实是想要去就是所谓的 meeting the middle 是非常困难的一个事情。那在当前的情况下,我觉得我们有一定的好进展,就是我们在一些场景上发现了可能没有那么多,但有可能几个、十个强的 D A 用户。
那我们现在的想法就一个是说在这些看到。机会的点上深挖,另外一个就是前面讲那个丰富供给,一些 niche 场景的 DAU,这是你们关注的一个指标。对 niche 场景高频用户,还有什么是你们关注的指标吗?就你会用哪些点来衡量?我觉得第一个指标做好之后,我们接下来就是 scale 了,就是刚刚那个问题,只要能解好。
后面几乎看不到阻碍。在启动阶段,其实你们自己会做很多 Agent 的放上去,就你们官方做一些东西。官方其实不能做,不能做,不能做。哎,这个你可以讲讲。哎,这和我想的不一样。对,就像你苹果手机一样,你官方只要做了足够多的东西,那那你的 App Store 生态就很难。你可以做计算器,就做很 basic
的东西,就是比如说在我们的平台上,我们有一个很基础的产品叫 General Browser Operator,那个是我们官方自己做的。
我想问一下啊,这是我一个非常直接的想法,就是我其实是官方做的,但是我不说是我做的,嗯,我就是让这个场子热起来,这样不行吗?这个是这样的,就是其实我们中间想做这样的事情,没有选择不做是做不过来这样的一个交易平台,其实它的基建,而且早期为了丰富供给,我们走了就是对所谓的框架中立,那你意味着你要兼容各种各样的产品的部署方式,那个工程上还是有挺多要做的活。
嗯,对,其实做不过来。但我觉得回过头来看这三个月,如果我们再花一些时间去做一些可能我们就早期看得准的一些场景的
agents,不一定是坏事儿。可能那样做也会更好,但但目前我觉得,因为新的时代到来了,或者说新的创作范式到来了,就是这个创作范式如果没有那么多人拥抱的话,我们自己拥抱刚才讲那套创作范式,Claude Code 加 Run Time 加
Skill,我们也能瞬间就自己团队可能一个月,我觉得上架非常非常多,足够好用的一阵子。
你们现在团队规模是多少?呃,团队规模五十个人左右吧。五十个人左右也不小,对也不小,成本也不低。嗯,对,是是嗯。然后我们可以把有一个点再展开一下,就是你们说觉得要实现高的成功率,就比如在工作和生产场景是需要大量的 S O P 加少量的大模型,这个东西它怎么表现在你们平台上的这些 Agent 具体的产品上?
因为有些我理解是大家做好了就直接放上来了。嗯,你们是通过比如说我上架什么产品,不上架什么产品,推荐什么产品,不推荐什么产品,来鼓励这种方式吗?我们不会去限定他的工作思路,他也可以就是觉得他只要那个一小段 S O P 或者一一段 prompt 就可以让这个任务稳定的发生,这说明他厉害。嗯,但是我们的要求是说,因为我们是个交易平台,我们希望提供给我们用户的这些 agents 也好,一些小应用也好。
他对给定任务的完成率是高的,也就是说,你给我一个任务,我至少可能做一百次,可能可以错一次,或者有的任务做一千次错一次。但我不能说你给我这样一个
agents,我要跑你描述你可以跑的任务,但你跑十次错五次,这就是一个垃圾商品,我们要把它干掉。哦,所以这个是通过就是上架的审核来控制的。对我们现在其实一直在做比较复杂的 benchmark 或者 evaluation 的系统,就是说去评估你的 agent 是否有效,同时持续的监控你是否有效。
然后跟所有的交易平台一样,我们也会有有评论呀,有有这样的东西。对,就是用户也可以去反馈说,哦,我这个就是跑不通。那我们未来甚至还有什么要不要退钱呀?这种复杂的东西要上去。所以就是交易平台就听起来真的不性感,那它里面有大量的苦活要做。嗯嗯,哎,我觉得这个还是很有价值的。就如果这个用的人多,它的各种数据反馈行为都是很有价值的。
是是的,对,洞察 Agent 怎么去做?对对。其实这些输入输出是非常有价值。你们这个想法就是跟你们观察 Anthropic 是怎么做 Claude Code 的一些思路也是相关的。其实他们有很多东西重复的、简单的东西,它也是调代码来做,而不是用大模型来做。对,这个后来有一个挺好文章,回头我可以发给你。
嗯,就是一个你有可能看过木鸟写的叫《苦涩的教训的边界》。但是那篇文章我仔细的可能磕着头看了好几遍。那个文章应该是二五年三月份发的,嗯,但它其实它的底层思想跟现在 Claude Code 的那个 Code Execution
的底层思考一致,就是。很多事情你不该让大模型做,你该让代码做。大模型该做的事情是帮你判断这个问题应该写代码做,写好代码直接拿结果,而不应该直接把这么长的一大串上下文塞进我的 prompt 里面,让大模型自己去做,而且还不稳定。
比如说大家之前总喜欢让大模型去判断九点一和九点二,你你说到这个,我也想到这个事情了。这问题你就应该调一个代码呀。对,嗯,这个问题不该就是没必要嘛。你当然这个东西是检验大模型什么幻觉的一个很重要的标准,对吧?你应该能解决这个问题,但在另外一个角度,你不该用大模型去解决这类问题。这类问题应该用代码解决。
你觉得大量 S O P 加少量大模型,嗯,随着模型能力不断提升,它是持续会有效的,是吗?持续这个策略是 work。如果 A G I 实现了,人类所有的知识全部上传了,我们可能就挂了。但是我认为所有人类都可以躺在家里了。其实我们 bet 的就是一个所谓的强,因为现在有 A G I A S I 很多定义,就是我们认为一个你给他任何任务他都能给你完成的东西,短期内不会直接出现。
嗯嗯,所以有你们存在的空间,我们存在的价值。嗯,而且我觉得在那个出现之前,我们的价值非常大,在那个出现的时候,有可能我们就是那个东西。就是当我们的供给足够丰富,我们会有一个所谓的入口级 agents。你只要告诉他你要解决什么问题,他会在我们这可能一百万个供给、一千万个供给里面找到哦,就是这玩意儿能精准地解决你的问题。
这其实是所有人类每天要做的事情的这个所谓的病急有多大的问题,我认为可能也没有那么大。但是这个前提也是,就是说这个事儿不是模型直接能做的。所以你们就会成为这个东西,对,这里面就是那些知识什么时候模型厂商全都有了,可能逻辑上很难吧?逻辑上很难,因为人类大量的知识的确沉淀在你的脑子里或者线下,以及它会新出现啊,人会有一些新的需要做的事情,可能以前没有存在过的,很有道理,是的。
但大模型厂商现在太强了,你不管是他们的资金体量,就是。钱其实意味着你调动社会资源的那个能力,就是 OpenAI 假设它新的一千亿美金融到,它能不能我就抓个十万人天天给我去给更多的东西,我不知道。我觉得这个问题的最朴素的想法就是我们认为,在所谓的那个东西出现之前,我们有非常大的价值。但那个东西出现的时候,它不只是我们可能没有价值了,几乎所有的人公司都没有价值。
对,我觉得那会是一个非常大的变化,比较难想象。对,就是科幻小说的嘛。那当然,科幻小说里面想的那种场景,大家想有好的、坏的。好的就是,哎,我们就活在一个非常物质高度发达的世界。那大家可能去追求一些。个人表达呀、艺术呀之类的东西,这个世界没有苦难了,我觉得这是不可能的。对,然后还有一个就是说非常黑暗呀,我们就那个黑客帝国了呀。
世界没有苦难是不可能的,是。而且当大家都去做自己喜欢做的事情的时候,我觉得这可能是基因带来的吧,人还是有争强好胜的心理的。对,嗯,就都是搞艺术,都是做你最喜欢做的事儿,那也有做得好,做得坏,对,有你的天赋的差异,有你受到关注的差异,是的,是的,嗯,这就不知道了。我觉得那个就是到下一个大阶段了。我觉得我们做好当前阶段,我觉得还能做的事情,嗯,就是在现在这个阶段,你们要做框架中立的产品,要提供好的实时的运行环境,还有好的清晰的
skills,嗯,它的难度是什么样?
包括你们中间遇到的一些问题,你们是怎么解决的?我觉得可能下面有一些技术细节,就是这个大思路,我觉得别人想到和做出来都没有很难。我觉得就是几个月时间,我们其实把这个东西跑起来,你要去考虑说,呃,如果这个东西未来要并行启动很多,它的启动时间,然后同时它的稳定性,同时呢,你在这个创作的时候,你选择,比如说让它定义什么不定义什么,因为这个涉及到你产品设计的复杂性,你是让每一个创作者可以定义他的环境,还是我更暴力一点,所有东西全塞在一起,你只做选择。
就是这个选择是涉及到镜像的变更还是不变更,就反正会有很多的小小细节在里面,但大的逻辑上就是这套东西,我们认为和目前看到可能也有其他公司想到。因为 Anthropic 已经把谜底写在明面上了,他认为 Claude Code 就是一个非常强的 Generative 人机,你就应该让它去做很多事情。但是怎么样让它去服务每一家不同的产品,做不同的事情?
我觉得大家的选择会不一样。就把一个东西做出来,呃,这个很简单,但是把它做好,这个里面的细节可太多。呃,怎么样算好了?就简单、稳定、好用啊,都是很朴素。简单、稳定、好用。对,简单就是说这个东西可能就是你的实现有很多形式,你到底让大家参与到哪一个深度的选择?还是说你你真正实现了,就是只要写一段话,这个东西就稳定的跑起来了。
对,然后稳定就是说你这个东西,大家都是创业公司,其实每一个哪怕新的创业公司东西,就当时 MuleRun 刚上线还在测试的时候,我可能跑十次任务五六次,它虚拟机挂了。那现在可能好点,因为就是他刚用了一个美国的,这个当时跟张涛也聊过,就他们当时甚至帮那一家 AI agent 的 infra 公司修了很多 bug,是一个开源的,就是可以把 agent 跑起来的东西。
这个里面就是稳定也是很重要的,因为如果一个好东西,它就会有很多人用,你要稳定且大量的跑起来。我觉得简单好用是类似的吧,就是说你这个产品的设计怎么让别人,我们讲的都是说让他写一段话,那你让他写一段话,还是比如说一些 skill 的选择,你怎么让他去选?这个里面就可能一些产品的细节。其实最好的不是别让我选吗?
别让我选不是更简单的方法?但这个东西就是可能我们甚至要自己去训一个小模型。你就像当时最早 Cursor 做那个 Compose 和一些 Apply 这些工作的时候,他自己训了小模型的。这个认知大概在去年年底,我跟一个我觉得技术很强的朋友聊的时候,他跟我讲,然后后来我们去验证了这个猜想。但这个认知其实在国内真正有很多人知道,大概到到二三月份了。
Cursor 其实是自己训了小模型,才能在一些任务上跑那么好或者那么高效。所以说回来到这个问题,就是说如果。我们不让他选,也就是我意味着我要从你的任务描述里面知道我选什么东西能把这个东西跑起来,这当然是一个最终极和好的状态,但是这个东西的实现就没那么简单了。就是你,你写了一段需求,你要做这些事情,我判断你这事情需要某些东西给你拆装进去,这是最自然的。
但一步可能做不到位,或者一步做到位,你这中间的那个,嗯,你会损失一些体验和准确性,我觉得损失准确性,而且其实你要花更多的时间。这其实就是一个选择题,就是说,如果我们都觉得这个方向能做一个很好的创作者工具的话,我们在做到什么样的程度的时候把这盘菜端出来?有可能他是自身的时候就端出来了,也有可能他要就把别人要炸熟透了才拿出来。
嗯,那你们现在选择是做到什么阶段就给他端出来了?对我们觉得可能就是快非常重要吧,因为这个事情我觉得全球就聪明人太多,因为聪明人都在这行业里面干活,所以我觉得想到这个人这个解法的人会很多。那我们一定要足够快,你快就会大家都来你这儿用吧。你做慢,你这个事儿哪怕我比如说做的特完善,别人拿了一个百分之八十的半成品出来,但大家觉得哦,他先做出来的,我们跟他玩。
因为很多产品的迭代是跟生态一起前进的,长期来说,你看到了这个未来,就是 AI 的这种大型的外包平台,或者说大家有很多长尾的非常分散的需求,其实可以在你们的这个平台上被满足的话,对,那这个单独的 general agents 它还有多少空间啊?其实它有点像,就是比如说淘宝上有很多品牌,对吧?嗯,但是可能在消费品里,你最后看到的是淘宝这种平台的体量,它肯定是超过绝大多数的单独的消费品牌的啊。
对我同意,电商里面有一个很好玩的认知,在于说,我们当时看到很多公司出现又死掉,其实你就发现电商独立站这个事情在中国是不成立的,因为只有平台它能才能拿到足够多的流量,然后你在平台那儿拿流量的成本,甚至比你在外面直接给自己拿流量还便宜。所以电商独立站这个事情在中国其实是完全不存在,当然海外还是有的。同样的逻辑可能放在
AI 上面来讲,就是我们最早会觉得小的垂直 AI 产品最好不要做,就应该放在这样的一个大的平台上来做。
当然我们现在不够大了,嗯嗯,对。但我就觉得这个其实场景,你看现在有可能做 AI 招聘的、AI 可能图的、AI 营销的,我们认为其实大量这样的供给,未来应该涨在一个平台上。这这是我们的判断,但是就是这是我们跟所谓的垂直 AI agent 公司,如果我的判断是对的,那我们可能会去凝聚很强的一一串生产力,那他们可能是外面的。
但 Generations 我觉得始终跟我们是两个层面的生态,就很难说互相挤压的问题。我觉得会有不同的用户群。嗯,对,就是用他用的习惯的人也不想用我们,因为这里面还涉及到另外一个问题叫 Memory,这是为什么现在比如说很多人大家 ChatGPT,比如说我也是用 ChatGPT
用的最熟练,那我可能就很难换到下一个,因为它里面就他甚至都大概知道我是什么样的一个人了,我问他太多的问题,所以我在问后面的问题的时候,他能根据他的 Memory 给我一些。
更匹配我的需求的建议。以下内容是一月我与雨森的第二次访谈。此时 MuleRun Agent Builder 已经开始内测,我们更详细的聊了 Claude Code 开启的 Skills, MuleRun 如何做 Agent Builder,以及为何货架式的 Marketplace 可能不再适用。上次你有提到,你们主要做的事就是提供清晰的 skills 和一个好的运行时环境。
skills 是现在很热门的一个实践,你可以展开从头讲讲 agent 里的 skills 是什么吗?其实是它最核心的点是说,通常在过去,如果做的复杂的事情,我们要写一个很长的 prompt,但这个 prompt 有时候在就是做长任务的时候,它只要进行上下文压缩会丢失。Skills
核心是它其实我觉得它是一套机制,它让这一个 agent 在做复杂任务的时候,它可以分层,一个是分层加载,就是 Skills 通常不会在一开始把所有的东西全让你读进去,而是让你知道这个 Skills 是解决什么样问题的。
当 agent 遇到类似的问题的时候,它去看一遍所有 skills 的类似 meta 的信息,然后确定说我是否要去接下来读这个 skills 是什么,来决定我在遇到特定的问题才去加载特定的 skills。这样核心其实你可以理解为 skills,我认为都是 context engineering 的一部分。
Skills 实质是什么?是一些文档吗?是一些 prompt 组成的文档?对,它大多数是一些文档,但有时候它也会带一些工具,比如说它里面就是一个写好的程序,它告诉你在遇到一些问题的时候,你按这个方法做,甚至你可以调这段代码来做这个任务,或者说它也有可能是一个 API。他是告诉你遇到这个问题的时候,哎,你过来读了 skills,发现这个问题你不需要让大模型自己做,你调这个 API 完成拿结果就好了。
嗯,其实和早期大家做 agent 那个叫 Claude React 那个思想是一致的,就是说,如果我发现一个复杂的大量输入的问题,可以不交给大模型做,那我一定不交给它做,因为大模型的上下文窗口是非常宝贵的,你每把它的上下文变长一些,它的幻觉。会增加智商,会降低。你刚刚说 Claude Code,它 skill 是分层读取的,它什么时候该读什么 skill 是模型自己的判断。
这其实就是所谓的 agent 和传统软件最核心的区别。传统软件东西几乎是写死的,就是大量的条件判断 if else 或者 case。遇到什么样的问题,我进到什么样的分支去解决什么样的问题。但是现实世界很多时候的问题是你没法进行一个完美分类的。那在这种情况下,其实需要一个大模型在中间做那个决策或者判断。
他判断这个问题 OK,我需要我一边看着问题,一边看着我有的 skills。我觉得这个问题需要这个 skills,我就进去再看。哦,发现 perfect,我用它来解决它。因为你们这个平台就是 MuleRun,要给大家提供的是清晰的 skills。嗯,所以这些 skills
是你们官方会写一些是吗?呃,我觉得官方肯定会需要写一些,如果是足够常用且我们希望它跟我们平台上搭配的 runtime 足够配合的好的。
其实我们目前在做的工作是做一套比较有,我觉得置信度比较好的 skills 的评价系统 evaluation,因为现在 skills 网上搭写了很多嘛,因为这个东西是一个门槛其实没有那么高,大家都可以写。那其实 GitHub 上可能我们能爬到几万个,然后那我们把它拖过来之后,我们有一套自己的算法去分析哪个 skills 在同样的任务下。
就是或者说你提出了一个任务,比如说我今天就是想挑餐厅,或者说我就是想把 PDF 转成一个比较好的 PDFX 的格式,那可能做这样一个任务的 Skills 可能现在网上能找到三五个或者十个,那我该选哪一个?那这个其实需要做一套可能简单的评价机制的,然后同时可能对 Skills 你还要做一些所谓的可能安全分析,比如它里面有没有写出来一些问题。
结果你调这个 skills 的那个 cloud code 的环境是一台你自己的电脑,然后它反弹了一个 shell 出去,你电脑就被别人控制了。对我觉得也有一些安全审计方面的事情要做,所以做一个好用的 skill
marketplace,它其实意味着你在下面要做各种各样的工作。但是最终结果就是说我帮助我们的用户或者我们的创作者在选取做特定目的的 skills 的时候,我提供给他是一个在同类里面比较出类拔萃的,同时它又是无害的。
你们自己做的一些官方的常用的 skills 是哪些?可以举例说一下吗?我觉得大类的,比如说可能我们会在 browser use 这个方向去做一定的优化,因为现在你就是说操作浏览器或者就是所谓的 web automation 相关的,其实 skills 和一些工具都很多。我们自己最早在做那时候,我们也在浏览器方面觉得还是有很多事情可以做。
就比如说 Google,他甚至都觉得要做那个 Chromebook 嘛,就是觉得其实你只要有浏览器,就是你的操作系统了。所以其实现在大家很多的工作都是发生在浏览器里面的。所以如果能自动的帮很多人去完成浏览器里面的工作,它就是一个很有价值的事情。那我们希望比如说在浏览器这个环境里面,把我们的 runtime 或者说我们类似于有官方 skills 让你做一些。
很大的事情可以做好,我觉得也不一定是官方做,有可能是我们发现有人做的很好,我们就帮他做的更好,或者说配合他这个 skills 去优化我们的对应的 runtime,就是对应的一些他可以操作的软件。因为很多绝大多数,我觉得这种通用型的 skills,它可能都不只是简单的只有一些描述性的 prompt,它可能附带的是有真的工具在里面的。
就是它是有 tools 在里面的,那 skills 和 tools 其实是一个类似于联合优化的过程。但是我会觉得,其实包括 web coding 或者说我们这套基建带来的价值,其实我觉得更多我们会去关注更长尾的需求。我其实这两天翻了一下我另外一个同事,他现在正在那 Google 那会上讲那个 PPT,我觉得他那个比喻特别好。
他说过去我们大家用的是都是大量的工业制品,但是 3D 打印给我们带来的一个事儿就是你可以做你就是你需要或者就是你和你三五个朋友需要的东西,它可能是。所谓的没有大的工业价值的,但对你们来说就是很需要。我觉得我们平台的意义是在于这儿,就是你除了可以说做了一个通用型东西,让很多人用起来之外,你还可以做一个,就为了满足自己某一个特定需求,或者你和几个朋友共有的。
少数常委需求的,我们叫 agent 也好,或者叫软件也好,但我觉得可能叫 agent,因为这个事情在过去是不可能的,因为软件开发是一个成本高的,我们开发一个软件至少得可能服务一千个人、一万个人的共同需求,但现在你可以为了一个人、两个人、三个人、五个人、十个人以内的需求去开发一款软件,一个 agent 就解决你这个需求,而且解决得很舒服。
对,因为过去软件开发因为它的成本高,最后它的。组织形态就是集中式的,然后它也需要有一定的用户量才能支撑一个软件。当然,嗯,现在其实就变成因为门槛很低,对它整个开发的组织变得非常分散,然后可能每一个 agent
需要的用户也没有那么多,这是你们核心的一个假设。是的,然后我觉得再往后来就瞎讲,我觉得软件未来其实是日抛式的,就是你可以理解为软件不存在了,就有很多一次性的东西,一次性的代码,代码只是为了执行特定目的而完成,它会精确的被创建、执行。
完成销毁,这是最未来。但是我们觉得我很难一下到内部,所以在短期的步骤里面,我觉得创建一个没有那么多人用,但有一小部分人他可以每天用的很爽的软件也好,agent也好,是一个非常有价值的事情。如果这是一个未来的话,那生产一次卖很多次,这种边际成本大幅降低的商业模式还存在吗?这其实是一种很好的商业模式。我我觉得你往后看十年,我觉得软件公司如果不自我革命,大概率都会被 AI 公司全面吃掉,这个是一定的。
但是这个过程中会怎么走?呃,什么人会拥抱心智生产力,成为成为新的胜利者?什么人可能会掉队?这个说不清楚。嗯,因为我觉得一次性的东西,包括像3D打印啊,3D打印是很直观的,它就是一个制造。嗯哼,你每做一次,你就是消耗了线材。那如果类比到AI,可能你每做一个,对,你消耗了token,你消耗了算力啊。是,AI是个制造业呀。
对,就是这样想起来。虽然它一方面满足了常规的需求,但是另一方面它挺消耗能源的。是啊,那我觉得我们过去不是太阳能发电有一段发展的挺好,电都没地儿用了嘛。但现在又缺电,我觉得这个会促使人类可能更快去点亮戴森球这个科技吧。可控核聚变啊,对,我觉得现在大家都觉得电才是制约我们发展的一个核心的东西。包括今年你可以看到整个就是AI硬件上下游,CPU、内存、硬盘,所有东西都在涨价。
整个的,我觉得世界都在变得疯狂,所以所有能为 AI 服务的东西都在紧缺。你觉得 Token 的成本会低到它的这个特性变得很不明显吗?会低到那种程度吗?很难,短期很难。短期是指发生什么事情之前的短期很难。我觉得是这样的,一个东西价钱低到非常低,是说明它没有垄断性,也就是说有三五家供给的 token 都是很不错的智商、很不错的智能,能解决我们要解决的问题。
同时,他们之间分不开显著的差距,这个时候就会出现价格战。但只要当一家他的能力显著强于别人的时候,不出现价格战,这个东西就不会便宜。所以在智能还在比较快的进化演化的时候,就不太可能成本变得特别特别低,除非你用上一代的老的东西啊。对,在在最后那种情况的话,它会低到一个合理的程度。但我相信,你就像世界上现在也有一些东西是就几家,这价格本质就是供需决定的嘛,它其实是一个非常朴素的经济学的东西。
那我觉得未来它的需求,首先我目前看到是近乎无限的,就是 AI 渗透进人类的方方面面,它其实核心的是对整个人类社会的劳动力的重塑。那它不是说短期的,它是一个生产工具,它其实本质是生产力本身,所以它的需求是近乎无限。比如说我们地球上的活干完了,我们可以向那么太空里面找点活干。单纯从找事儿干这个事儿上,我觉得事情是做不完的。
所以它的需求应该是没有上限的,那你的供给其实始终还是有问题的。嗯,当然最后可能比较直观的需求是来自于人的需求。嗯,但其实中间有很多需求是技术本身会对一些新的技术有需求的。嗯嗯,一般来说,你发明的一种技术之后,它就会产生对一些新的技术的需求。呃,对啊,是的,就像我们现在觉得缺点了不大,又去回头研究核聚变了。
然后现在美国还有一些很科幻的,像这种公司,他要把数据中心打到天上去,好像有太空数据中心。对,那 Star Cloud。中国也有人在筹划类似的创业,对我我有看到。嗯,我还想补充一个问题,就是你们现在通过提供一个 runtime 的运行时环境,还有清晰的 skills。来降低大家去开发和使用 Agent 的门槛。
然后你们最近刚刚一月十六号开始内测的一个东西,还包括开发 Agent 的工具本身。嗯,Agent Builder,Agent Builder 对吧?对,嗯,你可以讲讲就是这个 Agent Builder 的思路是什么?它怎么能帮大家更简单的去开发一个 Agent?我觉得这个东西核心就是站在巨人的肩膀上,就是我们先讲 Agent 是什么。
我们稍微拆解一下 agent 的本质呢,就是你有一个可交互的大模型的 API,但同时你要在中间构建一个所谓叫 agent loop 的东西。因为通常 agent
它在做的事情,它不是一次做对的,它是在中间要做一会儿的。那它每一次都会按照你设定的循环去跟大模型有一次交互,拿到一个结果,然后同时你有一些给它加的判断条件,相当于就是预先设定一些 prompt,在你发东西或者它回来的时候,你会加上这个东西,再让它去处理。
这是中间那个叫 agent 循环。还有一个很重要的东西叫 context engineering,也就是说,我们前面说了很多次,就是那个 agent 的上下文它是有限的。所以说,当你去做一个复杂任务的时候,上下文可能会爆;或者说你在做任务的时候,当上下文窗口过长,模型的智商降低也会很严重。所以你要非常。
珍惜的使用上下文窗口,那这个就是 agent 构建过程中最核心的两个东西。当然还有所谓的 tools,因为一个 chatbot,一个大模型本身它不能跟很多东西发生交互,但你给它一个 playwright,它就可以操作浏览器;你给它另外一些 AI 的东西,比如说你给一个 agent Nano Banana Pro 的 API,它就可以帮你画图。
Models 或者说大量的 general agents 呢,他们是自己选择。自己去控制 agent loop 和 context engineering,所以他们就会有各自的能力差别,因为这是他们自己做 agent 的思路,或者说哲学或者工程决定了他的能力高低,他适合做什么样工作,不适合做什么样工作。
那当然之前还有大量像 long chain 或者一些 auto gen 一些的 agent 框架,它帮助你预设了一些 agent loop 和 context engineering 的实践和一些方式,你可以在里面做自己的调整来构建你的 agent。但是最上层就是像 Claude Code 这样一个
Anthropic 自己做的 Agent,它自己做好了 Agent Loop 和 Context Engineering,就它自己决定它中间的循环怎么做,包括它怎么样去控制它的上下文,节省上下文,这是一个就是非常工程化的问题。
之前其实那个像 Manos 的 Pick,他就分享了很多他们做 Context Engineering 相关的。思路和方法,我觉得都是很棒的。那相当于说,我们作为一家二零二六年一月份重新转型、重新出发的公司,我们很难有充分的时间再从下往上做了,所以我们一定找到现在市市面上已经。比较好的东西,比如说像当年 Manus 出来的时候,大家会调侃他们是大模型的套壳,那我们可能套的更套,就是我们甚至都是在。
Cloud Code,或者说这样一个当前市面上比较好的 Agent 上面再去做套壳,但是我们做的事情呢是说,我们先用了一个这么强的一个基础 Agent 的能力,也给它构建了好的 Skills 和 Runtime,在这些基础上,我们又开放了比较好用的编辑和架构工具,让大家在云端可以把。属于它的这样一个
agent 的构建出来,其实就是它定义了 agent 的任务,同时选择了它需要用的 skills 或 runtime,这样子其实对绝大多数普通人来讲,他就可以自己做一个 agent。
所以你们这个 agent builder 的底层就是 cloud code,我可以这么理解吗?肯定要做一点点改变,核心是这个对,因为 cloud code 本身它是没有一个命令行之外的别的交互方式的,就它还是有点使用的门槛。我理解啊,你们是用一个方法,就是让它可以更简单的用 cloud code 来做它想做的 agent。
对,但当然未来可能也不一定是 Claude Code,也因为有 Open Code 也做得很好。我们自己如果有充足的人力,可能也会选择下场去在他们的 Agent Loop 或者 Context Engineering 方面做一些东西。但是现在最快的方式就是拿一个当前几乎最好用的。Base Agent,我们大家原来就说叫基础模型,这就是这叫这叫基础 Agent。
基础 Agent 它给它好的环境,然后把整个的产品体验做好,激发大家的创造力。就像我们前面说那个 3D 打印也一样,其实拓竹在它就是做出来之前,他也不知道大家可能用 3D 打印可以做这么多奇怪的东西,甚至现在大家都会有一些很好玩的词语,比如说。他们讲那个3D打印机在那边打印,打印好之后去拿那个作品叫收菜,是吧?
甚至他衍生出了他自己的一些小的那种亚文化或者什么。我觉得一样,就是当一个东西的门槛降的足够低的时候,大家都参与进来,它就会激发很棒的创造力,或者每个人都去做一些不一样的东西。你们现在具体在Claude Code这个Base Agent上做了额外的工作是什么?就它从这个Base Agent到你们的这个产品中间的这个空间是什么?
我我觉得空间就是呃,一个是前面说的那个 skill marketplace,我们做 skills 的 evaluation,大量东西预制,所以有很多 skills 可以。直接选一键调用,就是我觉得这个东西可能就比如说大家从技术来讲都说啊,你们这做的东西好像啥也没干。的确,好像从技术角度短期来讲,我们做的东西都还比较浅。
但我觉得在这个思路下可以做出来很好的东西,而且在基础的比如说用户体验做好之后,我们就团队肯定会往下在技术层一一层一层打下去。最终其实都大家也会打到这一层。如果你不在中间做很不一样的工作的话,你长期来讲在技术层面是没有竞争力的。但是我觉得,因为过去我自己而言,或者我团队里很多人,大家也都是技术出身,而且技术做的还不错的,所以大家会很容易忽略降门槛对一个产品的价值。
会很容易觉得这个东西好像没有技术含量,所以不值得做。但可能现实世界的很多产品不是这个角度考虑的。嗯,你创业到什么时候有了这种认识上的转变啊?我觉得最近几年都挺有这个转变的。是发生什么事情让你有这个具体的转变?我觉得是 A I 这一两年的发展。其实你从 DeepSeek 来看吧,我觉得 DeepSeek 其实出来的时候,它能引起那么大的轰动,它当然做的非常非常棒。
但是如果说大家那时候你是一个 OpenAI 的深度用户,你会发现 O1 其实在同时间做到了类似的事情,也没有比它差。但是为什么 O1 没有破圈呢?为什么 DeepSeek 就破圈?我觉得一个是免费付费,包括它一开始的传播的一些势头,说它我只用六百五十万美金就训练出来这样的模型,五百五十七万啊五啊,sorry 对不起,五百五十七万。
还有说当时特别是因为它当年训练数据可能用了一些中文贴吧的语料,所以它俏皮话比较多。但综合这些东西的领先,都不是说它在技术上显著领先了别人,而是它真的对普通用户或者对大众来讲,可数达性和可传播性都好了很多。嗯,而且它当时把那个 COT 是给你直接完整展示出来,对这个就区别很大。所以我觉得,就是它的确是一个技术强大且领先,且做了很多棒的东西。
但它这个事情的胜利,其实。倒不是,就是那些东西,不是核心景点。就是比如说 O E 也很强,但它其实都没爆,但反而 ChatGPT 出圈,今年出在二五年的三四月份,那个就是它的那个生图功能上了之后,大家生成那个吉布力风格的各种图,才是让它的那个用户大规模增长的一次。包括 Google,其实去年的增长其实主要得益于 Nano Banana。
而不是说它的 Gemini,Gemini 能力提升当然是持续在做的,而且 Gemini 3 Pro 和 Gemini 3 Flash 也非常强。就是技术领先性和技术先进性固然重要,但如果只觉得没有技术好像什么事都做不了,这个其实我觉得就稍微思想狭隘了一点。勇敢的去做,好像暂时看起来。没有那么大技术深度,但是在用户体验方面有很大的进步的产品。
对,我觉得这件事儿是对技术背景的人来说要勇敢。其实对另一些背景的人来说,可能这是一个很自然的做法,因为他觉得哇,有这么点儿进步就了不起了。但其实可能大家就是如果在另外一人看来,就是说这你好像什么也没干呀,兄弟。就但不一样吧,我觉得。所以这个对我们来说也是尝试。就从我们可能产品上线到现在一天多的时间,我们就发现,就大家能用起来了。
因为之前我们会希望大家基于 N8N 或者基于 Long Chain 来开发 Agent,能发现没有太多人有这个能力。嗯,或者说我们最早希望去激活的是大量他有独特的知识或者有领域知识的这帮人,但他大多数是没有代码能力的。但是哪怕是在 Web Coding 高速发展的 2025 年整年,他都没能说我利用 Web Coding 能够去。
呃,把一个东西用一些所谓的 agent 开发框架,或者用代码写出来,同时呃部署出来或者怎么样,反正就是搞不定。那我们就在想说,怎么能让供给更丰富,怎么能让大家更简单的做出来他能用的东西?呃,那继续说的话,就是从 base agent 到你们现在做的这个事儿中间,你刚说有一层是 skills 的 marketplace,嗯,你们提供很多可以选的很好的 skills,还还有什么呀?
除了这个之外?啊,我觉得还有就是整个对 runtime 环境的打磨吧,然后提供,我觉得 skills 是这样的,就是假设是一些稍微复杂的 skills,它有可能调的工具还是外部的,它的稳定性啊那些,就是我们会持续的去看这个市场里面有没有大家都用的比较好的。那不管说我们帮助这个 skills
的开发者怎么样把它做得更好,更能让更多人用起来,或者我们下场去做,就在你们开始测试 agent builder 的同一周,Anthropic 自己发了 Claude co work,对。
它是一个有交互界面的一个 agent,它好像也是在 Claude Code 这个 base agent 上,它又做了一层。那这个和你们现在做的思路可以说是非常相似的嘛?嗯,包括这种东西出现之后,你也可以预见,可能别人也会做,就越来越多的人都会做。当然,嗯,当然,对对对,就给你们带来的变化是什么?或者你觉得对这个市场的变化是什么?
我觉得首先对对整个市场变化,就大家呃就是可能更多人意识到了 Claude Code 或者 Coding Agent 一个足够能力强的 Coding Agent 就是 Generation 的这个事情。这个我觉得在几个月前应该是非共识,现在快成共识了。所以其实创业的机会核心是在非共识变成共识之前,你把它先干出来。
我觉得整个团队反思的话,就是我觉得我们在 marketplace 这个事情上执着和纠结的时间稍微久了点,没能去快速的 pave 到一个新的我们觉得我们看到可能拥有巨大机会爆发的地方。我觉得动手慢了。就你觉得几个月前你就有这个认知,你觉得 Claude Code 是个最好的 general agent,应该做 marketplace,但你觉得做的还不够快。
不是应该做 marketplace,应该让它来做更多的事情,而不是只做 coding。这个事情,对,然后就是这四层的这个架构嘛,我可以基于它让普通人更快的开发一个 agent。哦,就是这个 agent builder 这个事儿做的不够快。对对。如果你觉得这件事儿做的足够快的话,我只做 agent builder 对你来说成立吗?
嗯,这个东西我觉得还有一个就是 To C 入口的东西,就是像我们 Marketplace 原来它有点像所谓的货架电商,那对大家来讲其实选择的难度是很大的。然后我们都知道,所谓的陈列式是第一代,第二代至少是推荐,也就是以字节为核心的,就大家就是我我永远给你推东西这样的东西。但是所谓第三代应用入口其实就是聊天式的,我也不推荐,我通过跟你聊天就能帮你解决一些问题。
那我觉得我们之前在做产品、做面向用户的产品设计的时候,我觉得不够成熟吧,或者整个团队大家没有想清楚,说我们在这个时候做一个 marketplace 是。有点逆潮流而动,因为你东西少还好。我们后来其实 marketplace,我们大家通过也是辛苦的工作,也有可能上百甚至一两百个还不错的 agent 在上面。
其实你仔细找找,有的是能帮你解决一些问题的。但是对于一个新用户进来,他两眼一摸黑,我也不知道你干嘛的。然后我好像点了两个,没有得到我好用的效果,就拜拜了。所以你们现在是想从最开始的货架式的一个 marketplace 调整成跟他聊天?呃,这个东西因为还没有发布,还没有完成这个调整,还没有调整完。但是我会觉得未来对我们整个产品核心的入口可能也是对话式的。
就是就是我们在表面上看起来会更像一个所谓叫 general agent 也好, super agent 也好,但是其实我们下面会带着一个生态,就是说当你问的问题或者你要解决的事情触发到我们某一 creator 做的一个已经预制好,你看钢琴要预制很多东西才能完成一个任务,它已经预制好的一个 agent,它就不需要你再去,因为对很多人来讲,去打磨一个复杂的 prompt 也是一个难的工作。
那你他就会配备到说这个事儿,你这个人能干你的活儿,你要不要直接用它?但是这个还涉及到一个经济系统的问题,那部分可能我们现在没有想清楚,就怎么让让有贡献的人能够参与、获得收益和分配。因为这个东西就不像当时 Marketplace,你上架一个东西,你卖多少钱,这个是一个更简单直接的。这个一个就是过来调用的这个经济系统还没有想特别好吧。
我觉得我们其实内部最近还在讨论,但我觉得整个系统的设计应该会是往这个方向走,就是让大家来讲看到一个更简单直接的地方。你进来就是告诉你要想解决,想告诉我们你想要解决什么问题。然后,如果我们能自己帮你干,就帮你干了。因为十二月底我们聊的时候,我感觉,呃,你们当时的设想应该还是更偏货架式的这样一个 marketplace。
对,我觉得。然后现在就是你觉得未来它会一定不是货架,不是货架,会是一个对话式的。这个转变的发生,跟比如说 Claude CodeWork 这种东西发布,跟他没关系。它的发出来是超乎我们预料的,但是我们觉得这是预期之内的,就是我们觉得。首先,在啊,Gentek 能力上走的最前沿的全球的公司就是 Anthropic。
Anthropic,你去用它 Anthropic 的它的外部端,你就发现你在它外部端提的一些问题的时候,它其实是开了一个沙箱在帮你家里面干活的。除了它没有在那个沙箱里塞浏览器,但是我觉得这个事儿也不复杂。但是我觉得它在一段时间内都不会把所谓的什么 SMS for Water 这类的能力放进去。所以,一个产品它从它到可用到极度易用,中间还是有可做的空间的,不然我们这套壳厂全死了。
你自己现在就是观察 CoWork Cloud CoWork,嗯,它的这个在 Cloud Code 上去给它封装或者包装的思路和你们的异同是什么?我觉得它的核心点就首先它有大量的客户端已经装下去了,你就包括其实这个里面它加的 co work 是第三个功能,它其实在 G Y 里面加的第二个功能就是
code,就是 cloud code,它还给了一个 G Y 窗口,然后 co work 哦,这个可能要解释一下,就是你刚刚说的是指 cloud,它本身有一个桌面端的 app,对,它有桌面,它有个桌面端的软件软件,其实 co work 是它第三个加上。
东西,它最早是 chat,最早是 chat,它后来把 code 也加了个 type,相当于说它会给一些人在这儿用。但是我估计这个东西没有掀起什么水花,是因为所有的程序员儿都会在 terminal 里面启动 Claude Code 干活。但是对于普通人来讲,他只是在 Chat
这边要去做一些事情。对于普通人来讲,其实回到我刚才说的,就是他的 cowork 可能做的大多数事情,你在 Terminal 里面描述给 Claude Code 都能干。
我目前还没有发现他什么是那边不能干,他能干的。这就我觉得是个产品产品设计问题。他觉得这个能力给更多的普通人来讲,就会让他们兴奋,会让他们觉得好用。同时,那些人他是这辈子不会打开 Terminal 去敲命令。我觉得它是一个用户界面的改变。我们其实改变的不是说一个用户界面,我们改变的是它的易用性的方式。
就是说,你回到之前,你要用 N 八 N 做一个东西,假设你有 Web Coding 能力,你你 Coding 出来之后,你要把它部署的,就部署其实是一个稍微复杂一点的事情。然后同时你可能还需要调用各种各样的工具,这些工具有可能不是预制好给你的,你相当于自己要把它下载好,或者说把它配置好,放在你的那个
N8N 的 workflow 的环境里面,这一套东西的打包,它都还是花,呃,就是大家很容易碰到一个卡点就搞不下去了。
但是对于我们现在这套所谓的 Agent Builder 来讲的话,我们把你可能用得到的东西几乎全放在一起了。你是通过选择就可以做的,甚至未来我们认为这一个过程也应该是对话式的。就像我刚才展示说,我去 build 一个复杂的 agent,我并不是自己去写复杂的
prompt,而是我通过对话式的方式带着他把这个活干了一遍,或者干了几遍,让他总结了过程中遇到的问题,然后整理出了一个这样的 instruction。
那这样这就成为了一个。专门干某一个特定任务的 agent,那你可以具体说,就跟你们的异同是什么?它预制了一些常用的,比如说在电脑上创建文件。然后包括帮你整理下载文件夹,然后呃准备一个会议,因为他在电脑上,他可以读你的日历,就是其实你给了他更多的信息,所以他也是预置了一些 skills。只是这些 skills 是跟你的本地电脑相关的,是的,是的。
然后你们可能重点是跟云端的云端相关,浏览器上的一些操作相关的。呃,浏览器或者云端你装一些软件,就是我我们在意的是说这个事情不需要你本地的上下文环境。嗯,但是本地上下文环境能做的事情的确非常有价值,我们不排除我们未来会做端。你们这周开始内测之后,有些什么反馈啊?当然才刚刚几天的时间,就完全不一样。就是我觉得这个事情就让我们看到了很大的。
一个希望就是过去我们那套架构,就是你需要提前用 N8N呀、 Long Graph 各种就是 Agent 创建工具创建好东西,然后跟我们上架是很复杂的。现在现在因为我们的 Base Agent 和环境都是在我们受控的,所以其实上架这个步骤几乎免去了,或者说未来的商品上架还是有一个简单的审核,但是产品上架你分享给朋友是随时可以还能。
就是你做了一个东西,你就可以分享给我来用,而且它的构建就变得非常的便捷,大家只需要几乎自然语言的交互,就可以做一个能在某一个事情上做事儿的 agent。你们现在有了这个新版的 agent 的。Build 工具之后,你们之前用 N8N 用那些更复杂的方式做好再上架那一套还保留吗?我觉得暂时保留,暂时设,暂时保留,暂时保留。
但是因为我感觉这是去跟他们劝说你们拥抱新的东西吧。哦,对,因为我是觉得这用会用这两种方式的人群不太一样。就是你刚说的第一种更复杂的人群,肯定他还是多少有点开发经验。嗯嗯,是的,嗯,你抓住了重点,就是新的这些人,我们希望拥抱更多他这辈子本来都没想过自己能做出来一个软件或者一个电脑上跑能跑的东西的人,他来做的东西。
那实际上现在开始测试之后,有这样的一些人来用吗?有什么具体的采访一填还没有?但举个简单例子,比如说我们的运营同学,他们的确这辈子也没有学过计算机,他们过去都不是一个技术人员,但是他们也有很多需求。比如说我们在外联去联系很多 K O L 或者什么的时候,我们需要做一些所谓的调研工作。那过去大家都是人肉在那扒了,然后看整理,但现在的话,只要有他能把他筛选的一些标准给到。
agent,那 agent 就可以操作它的浏览器,基于一些它的信息来去选择和判断,最终整理一个结果出来。当然,我觉得,呃,这个事情你从一个角度上来讲。你可能用一些强的 chatbot 是能做到类似的效果,但是比如说你用我们这套的好处在于说,你可以一次打通很多工具,比如说你这个写好之后就直接可以进到你的钉钉文档或者什么地方。
嗯,你们有了这个思路转变之后,你觉得未来就在你们自己的这个产品上,一个 agent 的打造工具和一个交易市场,它这个界限在于哪儿了?你问了一个非常好的问题,这个就是我们现在没有想清楚的,就是这套这套市场其实核心是该以分享为主还是交易为主?你说的分享为主,就指他你做好发给我,我来用,但是这个过程可能是不产生交易的。
嗯,它是有点偏社交传播的这么一种属性吗?我觉得不是社交就是分享。那我为什么分享了?我是你朋友,可能我也用到。所以我感觉就是社交啊,有道理。这个是真的没想清楚。我们设计了一套商业模式,但是那套商业模式很可能会被推翻,所以我觉得就没法讲。然后也有好几套,就是可能是比如说根据流量相关的,或者是以创作者为中心、这个人为中心的一些商业模式。
但是都好像没有觉得特别好。我们我觉得这可能会测一测。对,这也正说明这个事情非常新,非常新。它不是跟过去的什么东西,就是看了像是一条老路,我直接抄,然后比执行力就好了。其实它它存在了挺大的不确定性。那你们有这个思路转变之后,大概也可以想象,就是你们云端产品进去之后的界面形态也会变,对吧?一定会变。它可能会从之前,比如说进去之后,里面会展示很多,就是比如说别人做的上传的一些 agent。
变成一个入口去引导我来做一个货架,我们会放到类似于一个二级入口,就是你真的知道你自己就是进来用某一个东西的。其实你可以现在看看很多 chatbot,它是把一个类似于所谓的这种预制 agent,或者说一些特定的特定的能力是放在二级入口的,可能会做这样的调整。你们有了这个思路的转变之后,你会觉得比如说和 Claude Code Work 是有。
更直接的竞争吗?我们跟他的这个产品形态竞争还不大,因为它主要还是桌面端,我们其实是云端,所以两个位置适合做的事情就不一样。比如桌面端,它可以拿到你本地的各种的。呃,登录凭据,所以你需要更信任它。但云端我可以只把我特定的登录凭据放在那儿。比如说,我要做一些事情的时候,我甚至应该为我云端的 agent 单独创建一套账号。
我知道这个账号也能拿到一些信息,但这个账号的权限是严格受控的,它只能做它相关的东西。它想做别的东西,那个账号的权限也控制了它。所以我觉得,呃,云端会更 consumer 一些,或者说更。更面向工作或者说效率工作相关的场景,一些个人的一些东西端上会更多。对,那你可以预测一下,就是。一些你已经看到的市场上在做类似的事情的产品或者公司会怎么发展?
比如说 Codes Defy,Defy 是非常 To B 的,它现在整个也没有想往就是类似个人用户方面走很深。然后 Codes 它现在其实并到了火山,也去做 To B,去就 Codes 原来那套东西工作流的东西。然后 Codespace 和字节新出的 AnyGen,其实他们就跟 Manos 一样,就非常的 Generations。
就是你大量的事情过来直接做,我们未来的形式,我觉得一半儿会像 general agents,就是有一些基础的事情,我们我们帮你做掉,另外一些常委的需求。嗯,但是理论上 general agents 它也可以发展出一种能力,就是做 agent 本身。就是用一个 general agent 来做其他的
agent,当然,我们觉得,呃,未来就是现在本质上就是它在像 Claude Code,它本质就是 Claude Code 生产出来的。
嗯,我们最近啊,Claude Code Work 是 Claude Code 生产出来的。对,然后 Claude Code 最最近有一个特好玩的事儿,它每天发一个版本。这在过去的就是软件工程史上,或者说大量的就是这种面向全球这么多用户的产品迭代上是很少见到的。每天发一个版本,这个生产力的极大的解放,它其实带来了一些不同的产品迭代范式。
你觉得我们刚才提到的这些产品,有的会和你们一样变成一个造 agent 的 agent 吗?有的会,比如说,我觉得他那个 AnyGen,呃,字节那个飞书做的那个 AnyGen,会有可能。然后同时,我我不确定 Manus 会怎么想,但我觉得他们现在一定是他们他们反正现在是 General Agents 这个领域做的最好的玩家,他们做任何事儿都不奇怪。
我觉得团队也非常好。然后之前国内有一批 AI 的创业公司,其实大家当时在做应用的老路上都走到了做点网页、做点小游戏那条路。我不确定他们会不会往这边走,因为那条路我觉得是死路。你就说用 AI 来做网页和小游戏这条路,就是他们觉得那个是重要的内容,但我觉得那个东西不是重要的内容。我觉得这个大家判断不一样,我们会觉得怎么说呢?
就是你让大家去做一些简单的应用,这些简单的应用的价值是薄的,但你让一些我觉得领域专家把他的知识放做成一个 agent,这个事情是很有价值的。这是我们其实一直一直以来创业做这件事情的核心,就是说,我们认为人类大量知识沉淀在线下,一定有一些 SOP 和领域知识是现在没有放在线上的。所以,如果我们能有一套好的生产框架,可以让这些人把他的知识做成 agent,这个东西是有价值的。
以此来衍生出了我们做的各种各样的事情。对我觉得 marketplace 是一个尝试了,可能阶段性觉得不是很 work 的路,但是我们在尝试一条新的路。以下内容回到十二月的那次聊天,宇森分享了他从大学开始起起落落的创业故事和个人成长。你最近有试那个很流行的 Chat G P T 的 prompt 吗?
就是说,基于你对我的了解,给我画个图是吗?不是,基于你对我的了解,就是你告诉我一个残酷的真相。嗯,OK,给您念答案。可能也是我,是吗?很早之前应该有有想。我目标模糊或不够激进,行动太慢太保守。对,在琐事和自我验证上内耗,试图让每个动作都看上去合理。你觉得说的对吗?我觉得不一定对,因为很多时候我问他一些问题,不是出于我本身当时有这个困扰,说我出于一些目的性这样问的。
嗯嗯,对。对,因为其实我觉得你们还是挺快的啊。他对我的其实有一个描述,对的,因为我很多会问他稀奇古怪的问题,他会觉得我很多时候不够聚焦。这个东西其实我觉得回顾一下,我之前就是我后来的第二段创业历程,就我当时同时做两家公司,搜猫和啊交给猫吧,嗯呃一家游戏公司和一家数据安全公司,其实是我觉得年轻人可能都有这样一个阶段,就觉得自己无所不能的阶段。
我当时觉得自己好厉害,我应该可以两件事同时做都做好了。其中游戏公司后来我就是关掉了,因为我们第一个项目其实失败了。然后也学到了挺多东西,但失败了就失败了。但那家安全公司现在还是持续存在,但目前其实也是因为中国后来其实你看企业软件或者安全最近几年都不好做,所以它就是可能一个继续在做的状态,但其实可能也有挑战吧。
但我觉得那边的同事也都非常的棒,因为其实,在在这样一个环境下,我们其实也做了好的产品,服务了不错的客户。就是在中国这样的市场,你很难赚到足够多的钱。To B 软件的通病吧。对这个正好也是我想跟你继续讨论的,就是你之前的一些创业经历。嗯哼,二十岁你从浙大毕业之后就开始创业,是的。就当时做长亭,做了你们应该是一四年到一九年,对,五年,一九年十月份卖给卖给阿里了,卖给阿里云了,嗯,对,是的。
所以是最开始五年的时间是在做网络安全,对,然后来阿里一段时间,然后后面你又有创业,然后现在又创业,又做了,又继续待了大概有一年多的时间,快两年,就是相当于我在第一段的,然后就在长亭待了几乎七年整的时间,然后后来就开始了第二段的两个事情的创业,嗯,对,嗯,然后再到这次创业啊,对,再到这次,你这次创业没有想过做 AI 安全之类的和你过去的经历更 match 的一些东西吗?
呃,对,你怎么选这个大的方向?安全它其实是一个。你可以理解为它是个重要的事情,那它的重要性取决于你在前面的,就是你要去守护安全的那个事情,它本身得足够大。但我觉得 AI 现在还在可能比较新的阶段,你为什么不直接做 AI 呢?嗯,我自己会觉得说,你从一个角度上来讲,我觉得也希望自己的人生的广度可以多一点吧。
当然,这个就很多人会觉得有点那种贪多嚼不烂。就 ChatGPT 认为啊,Yes。其实我后来做游戏那次也一样,我觉得还是稍微急了一点。我觉得进入一个新行业还是花多点时间去学习。我是大概自己做了一两年,好像弄明白里面那回事了。但是因为可能融资节奏也断掉了,或者说,其实我觉得可能团队团队其实一起走下坡路的时候,人心还是比较难凝聚起来。
的那那时候我自己的状态比较差,所以其实是公司账上还有一些钱,但是我们觉得还是关掉了。嗯,你当时做的什么游戏?我觉得这个也是一个核心的问题,就是当时因为钱融的比较多,所以我们其实一开始想做一些稍微独立一点。有一些玩法创新和题材创新的小团队的 PC 游戏,就我觉得其实当时这个事情如果慢慢做可能会好一点。
就是我们融了比较多钱,但是我们花一些小钱去失败一下。就当时我其实看了很多游戏设计相关的书籍,也去看了很多的,就是你进入一个新行业,你先去看别人都说什么嘛。里面有一个很经典的话,其实我现在还记得,就是你做的前十款游戏大概率都是垃圾,所以你要从今天开始去做你的第一款游戏。对我觉得当时就是我们在第一个事情上太笃定了,就觉得自己判断一定会对。
就是我觉得那个时候就不太敬畏自己不懂的东西,觉得自己学东西很快。虽然现在也觉得自己学东西应该是很快,但就是你不要觉得好像这个行业里面这些人都都不会做事儿一样的,然后就觉得说一开始自己第一次就能做对或者做个大的,这个概率是极低的。就是你还是要去花一些时间。去失败来换取成功的经验,你觉得当时这个心态和你们第一次创业做长亭算是成功退出了有关系吗?
我觉得当然有,而且长亭现在的状态也不错嘛。因为后来其实我们是从阿里 spin off 出去,然后现在嗯也还是原来的我们一起大家一起创业的朋友文雷,我觉得是非常强的吧。然后他还持续在做这个事情。现在你要算的话,长亭也算是中国还没上市的安全公司里面应该最大的一家了。我觉得第一次创业能成也是因为其实我们做的是自己擅长的事情。
就文莱大学其实他是有几段创业经历的,参与过一些事情,但是那两个事情也都没有做起来。所以后来就是大家都快毕业了,选择做这个事情,就是因为我们当时技术已经算是国内在那一代前后的年轻人里面最强的一批人了,就是安全技术里面是最强的。对,你不能说所有嘛,因为隔几年就是江山代有才人出。我觉得在那我们前后一两年以内,我们那批人应该算是最强的之一。
所以做自己在技术上擅长的事情,但是商业上其实那几年我觉得我们的迭代和进步也是很大的。包括公司其实哪怕在我们当时卖的时候,我们应该收入也算是国内几乎那一批安全创业公司里面最大的一家。就在收入上一直做的还不错,然后就是一些典型的案例啊,反正就当过过去时了嘛。所以那个时候就有点自信心爆棚,觉得自己好像无所不能了。
嗯,对。当时为什么要卖给阿里云,不选择继续独立发展?我觉得几个点就是我们会觉得独立的安全公司在当时可能会遇到一些挑战,就是当时因为整个不管是阿里云、腾讯云、华为云也好,进展都非常快。然后我们也会看到很多单子,在后来你其实会碰到碰到云厂商的销售,他们会从 infra 层面把一个客户的需求直接全部吃掉。
嗯,所以我们会觉得当时在一个所谓的高峰时间点去跟一个。云厂商上有深度的合作,可能也是一个不错的事情。但当时可能还有一个,就是可能一八年的时候已经看到融资环境有点变得恶劣了。因为再往后去做,其实可能还需要一两轮的钱才能支撑我们走到上市。但我觉得这个判断对也不对。对,就是我觉得大方向判断对了,因为其实你看到国内的融资市场,就是特别是稍微泛化一点的,大概在二一年达到了一个高峰,其实到现在都没有恢复。
就整个中国的 VC 市场,现在只在特定领域,比如说机器人芯片,还是持续能看到大量的投资的。所以当时我觉得就判断早了点。我觉得那个就是再往后,我当时一八年、一九年大家做的这个判断,我觉得再往后其实钱很难融到,就是会进入一个比较固定的洗牌期。但是你看,后来我自己的行为也不太对嘛。我二一年出一出来创业,而且又做回安全,就是你说回到就是在交易上,你可能看对了一些事情,但是你能不能遵从自己最早的判断?
因为你这个判断有可能它的方向性是对的,但时间准确性上是不够精确的。嗯,对。所以你二一年当时又创业,是你觉得那会儿市场是回暖了,你还是想创业?我没有觉得市场回暖,我当时在想,难道判断错了?因为那段时间都并购之后还是在大厂里面嘛,然后后来想了想,就自己还是可能更习惯于那种创业公司的感觉。而且那时候其实主要是想做游戏,然后做游戏的同时呢,其实当时我有不少朋友就找过来,无论是可能投资方也好,可能一些安全行业的技术的伙伴也好,就大家还是觉得说你之前在这个行业做的还不错,那要不要继续做安全?
但是后来呢,可能就觉得说。要不要试试?就同时做两家公司,因为可能也都融到了一些钱,特别安全,觉得自己经验或者说还有一些在行业内的资源也都还不错,所以就。我觉得有一点试试看的心态,也有一点年轻时候就觉得,嗯,好像自己还挺能干的,要不就干吧。但后来我觉得,显然会觉得说,还是要要去敬畏吧。就是你,你哪怕我觉得在安全这个领域,我再后来第二次创业的时候,比在第一次的时候,显然更有经验,也有更多的东西。
第一次什么也没有,只有一些技术。但是在这样一个时间窗口过去的前提下,想要把一个事情再做起来,也是很有挑战。嗯,你们最开始就是上大学的时候,因为你们长亭创业的班底其实蓝莲花战队嘛,对,就你们去打这个安全比赛,是不是也都是正反馈很多呀?对,正反馈太多了,就是几乎都是第一,就国内的吧,然后海外的几乎也全都是国内最好成绩。
它可能有好几种不同的赛事吧,有一种就是解题,就是每一个安全的东西,不管是可能逆向工程啊,一些什么密码的破解啊,一些它做成一个个题,那大家去解题,然后有排行榜。那还有一种呢,就是更强对抗式的,每每个队伍去可能维护一台服务器,服务器里面有一些有漏洞的二进制的程序,你要去逆向分析它,然后去找到它的漏洞,用这些漏洞写成就攻击脚本去攻击别人服务器上对应的应用。
控制他的服务器啊,就大家的服务器的漏洞是一样的,漏洞是一样的。你先分析自己的,然后你再去整别人,然后同时你还要 patch 它,然后同时它还有一些健康检查,你不能说我就关机了,不行,这个服务要持续对外提供它正常的 service,那你要把它漏洞 patch 定,而且它通常一个里面都不只有一个漏洞,所以还是蛮有挑战的。
DefCon 是决赛,二十个队伍全球来的,打打五十多个小时。一个队多少人啊?一个队我们现场八个人,有的队可能在酒店里还有一个人。当时有一年那个美国的一个冠军队叫 Samurai,他应该是八十多个人在 Vegas
包了一个总统套房,现场八个,上面八十个。这种事情不靠人多,靠人厉害。然后同时你就看到说,这样中间有一个很强的队伍,来自于美国的 Samuel PVP,他有一些很明星的选手,像 Ricky,还有那个 Joe Holt。
九号就当时应该是个人最早破解 iPhone 的一个,就一个爆炸头,你可以搜他名字,非常酷。就那几个人就很强,你就特别是搞完那个比赛之后,你就发现计算机行业的天才和非天才之间的差距。大到没边儿,所以你就会发现技术真的还是非常有意思的。因为你们就是从年轻的时候就一起去打比赛,然后包括后面做公司卖给阿里,然后在你后面自己创业,它中间有很多就是起起伏伏和正负的反馈啊。
嗯,你觉得这些给你现在创业的影响是什么呀?嗯,我觉得韧性更强了吧?我觉得第二段的整个创业经历,走下坡路比较多。第一段几乎没走过下坡路,几乎没走过下坡路。你们当时销售难道商业化也很顺利吗?肯定当时不算顺利,但是后来因为顺利,你就我觉得人会忘记一些痛苦的经历吧?你肯定当时吃闭门羹或者遇到一些困难挑战也肯定很难受。
就像最早我自己是,我算是当时长亭第一个sales嘛,就我自己去干。然后闭门羹也没少吃,然后冷脸也没少看,但是我就过来了,也就过来了,也不会天天去想这些事情。所以你对那段的记忆,它最后给你的印记是一个整体走上坡路的。对,或者你看日线图,它可能还是有一些大的回撤的,但是你看周线图好像就是一路在往上的,或者看月线图,嗯,就一直在增长。
那七年,我们几乎是每年至少翻倍。当然,就是你做公司,肯定哪有一帆风顺,肯定就是每天八十件头疼的事儿,两三件开心的事儿。但是那些头疼的事儿做了之后,你都都还是往前进的。对我觉得创业公司好处的点就在于说,你只要是在快速发展的,就大概问题都是可以解决的。嗯,后来那两个经历就是你觉得让你韧性更。对,因为你处理的可能每天还是八十件糟心的事儿和有一些开心的事儿,但是开心事儿就越来越少了,然后可能八十件糟心的事儿变成了呃两百件糟心的事儿。
呃,整个团队走下坡路,然后到最后决定把公司关掉,就这个完整经历下来是一个什么样的过程和感受?当时自己感觉自己重度焦虑,挺严重的,就躺床上都要起不来那种。这个经历在第一次是不曾有的,嗯,就比如说你会严重的失眠,你会想到底是哪里出了问题,是不是自己就是个车头车尾的傻逼?对,就觉得嗯,怎么能错这么多,这么多错误的判断?
所以这件事情就很强的自我怀疑,很强自我怀疑,觉得自己好像什么都不会啊,之前应该都是全是全是运气吧。就是我们公正去评价之前的经历,我觉得肯定运气成分有,但是自己肯定能力提升上,包括处理事情上,肯定是有很大的进步和成长。就能力肯定还是在的了,就包括去做很多别的事情。但你就发现,在那样一个巨大的失败摆在面前的时候,你会陷入对自己人生一个彻头彻尾的怀疑。
因为在走下坡路的时候,周围的事情也会越来越逆风。比如说,你会意识到,整个团队也其实没有什么向心力,或者说很多反馈,甚至就是内部的各种各样的矛盾都会很奇怪。而且你无法获得核心团队的其他人的认可和信赖,有可能就可能你能感受到他们对你的信任或者说期待也是慢慢减少了。呃,会有会。所以那个时候就是会,我觉得压力很大吧。
嗯,你觉得这个状态它的最低谷是在哪一年啊?我觉得最低谷在关公司之前的那段时间吧,就二三年的中下旬。哦,因为那个时候其实 A I 浪潮已经起来了嘛,因为二三年年初的时候,这个 Chat GPT 就在国内已经非常非常火。是的,甚至当时你还能做的一个思路就是说,如果真的是很有动力,我就比如说在当时公司的基础上原地。
把过去业务的一些人员就是解散掉,然后我们可能找一些人来从头做,因为二一年出来。融的钱就融的真的挺多的,嗯,然后估值也高,所以当时这样其实还是有一批我觉得能做一个事情早期启动的资金嘛,还有几千万。但是那个时候我觉得自己状态不在,嗯,就我觉得现在缓过来一点,这是为什么后来重新开始做一些新的事情,嗯。所以你当时的状态和你的心理的这个趋势和整个外部环境是错开的,对,衰竭了当时。
嗯,因为当时整个科技界还是一个非常当然啊,ChatGPT 兴奋的状态。对,因为我们当时做做游戏都发现,就是之前你比如说要做多语言版本,你要外面找翻译公司,后来我们就全部东西丢在 Excel 里面,AI 一遍做出来的比外面翻译公司做还好。对,包括像蔡后宇还单独就是从米哈游也的日常工作表单出去做这个新的 A I 游戏的公司,跑到硅谷也拉了很多人,但他们的第一个游戏最近也下架了。
哦,这是你说的吗?前十个游戏,就很有可能是失败的。我觉得他们都是我们游戏行业里面人的传奇了,就是常胜将军也会遇到。他的低谷嘛,我觉得这是人生里面很重要的一环。就是我觉得在人生前面的那么多年,无论是上学的时候,然后上学的时候,我也属于上学的时候还蛮爱打游戏,那时候游戏也打得好。而且你还是保送浙大的,呃,对,然后嗯,一路升学也算顺利。
当然,在上大学之后,也不算是那种学习特好的人,但是我在我自己感兴趣的领域,我觉得还是做的比较拔尖的。就我当时。可能就我大一大二的生活就是天天上一小部分课,然后大部分时间在网吧打游戏。然后大三觉得好像再这样玩下去就玩成弱智了,那就应该找一些感兴趣的事情做。然后觉得哎,安全真的很有意思。然后钻进去之后发现就真的非常有意思。
然后同时你做的一些事情也有正反馈。我觉得正反馈是人生中很重要的一个事情。就是我很佩服那些在长期没有正反馈的事时候还能坚持下来的人。我觉得我自己其实大多数时候还是需要一定的正反馈才能坚持在一个方向上做的足够深入的。但是只要正反馈足够多,我可以做的非常深入。后来其实跟搞技术的很多网友们关系都很好,这是为什么?
后来就去北京跟大家一起创业去了。就是在二三年这个低谷之后,你是怎么走出来的?就是据我了解的话,你是后来又有一段时间是回了阿里,对对,回阿里做了一段事情嘛,各种各样的事情。当时可能主要做的可能偏国际化方向的一些事情。然后后来也是,我觉得无论是说去看美国一些硅谷公司的发展,还有说其实到就阿里的海外的布局,都看到跟AI的相关性越来越大。
那在这个前提之下,我觉得可能跟一些AI相关的事情是非常值得去做的。这是为什么?就是去做,呃,就是。先去探索,然后找到团队,然后去做 MuleRun 这个事情。就是你当时就走出这个低谷的状态,这个过程中间你自己是怎么去行动?包括你觉得外界有些什么帮助,让你能逐渐的从这个比较低谷的状态出来?我觉得就是那时候,你还感觉到自己好像过去的人生没有差到说大家就是人嫌狗气那种。
比如说当时很多朋友就知道我状态很差,大家有有有那种,就是原来我我还挺感动的。我俩初中同学就说啊,我好像感觉你最近不太顺,这样我们过来找你玩,然后我们去网吧打两天游戏玩。就这个就对我很 comfortable,因为我从小到大可能最喜欢的事儿之一就是跟朋友在网吧打游戏。对,然后或者自己躺那看看小说什么的,就那个时候你就发现其实也不用太多别的,因为就是那种安慰的话语其实也比较千篇一律嘛。
大家都知道,就是朋友肯定不会觉怪罪你什么,就是哎,这胜败乃兵家常事啊什么。就这种事儿,你可能自己已经安慰自己一万遍了,所以再多听这些话没有什么意义。但那种时候,我觉得一些陪伴或者一些分心就很重要。那你最后怎么下定决心去和投资人去讲这个事情?这不用下定决心吗?就失败了就失败了。那是一个什么场景啊?之前肯定有预告嘛,就跟大家说这个事情的确也不好做了。
就投资人那边的确很感激,他们也支持。但是这个事儿就是我觉得做不下去了,它就是做不下去了。我非得把剩下那些钱给你花掉也能花嘛,我们公司就熬着,但我也没有状态。我觉得再把剩下的剩下的钱翻牌的概率是非常低的嘛。因为你之前已经有很多创业经历了,然后你这一次来创业,就是你有一些告诉自己的什么一定要做和什么不能做的事情吗?
一定不要在选择题上出错吧。但这个东西好像说出来没有什么意义。这个东西不是说你说不做就不做的,也有可能我现在已经做错了。那就像当时游戏那次创业一样,呃,我自己最早想好了我们可能要做什么样的东西,但因为钱融的比较多,所以我们觉得为了给股东回报,或者说为了支撑起这样一个融资体量,我们要做一个更大的事情。就我觉得可能一定要做的就是先做自己能力和认知匹配的事情,而不是要做自己一些外部条件推动的去做的事情。
嗯,对,我觉得这个是一个一定要和一定不要。然后另外一个事情,我觉得其他的要和不要,可能更多都是因为已经做了很多年的创业公司了,我大概也知道有一些 general 的坑在哪儿,不会去碰那一些,可能一些重要的事情也要做。我觉得那些好像没什么可讲的。我觉得可能只要 OK 的创业者,可能大家能说出类似的东西。
你最沾到了的坑是什么?比如说什么用人不要用错呀这些东西,然后一定要对自己,比如说做的事情亲力亲为啊,千万不要就是觉得好像这个事情怎么样,然后自己因为有一些创业经历或者有一些经验了,就不去动手,不去一线感受这个浪潮。我觉得一定是要自己下水划水,就去花足够多的时间吧。就很多,很我也认识一些可能就当然更成功的一些创业者,就他去做第二个事情的时候,其实花的时间不够多,所以失败也是很常见的。
就是你会习惯于说,哦,我找两三个能干的人。去帮我做就好了,但自己不做失败的概率是极大的。嗯,就是含藏含藏特别重要,我觉得我也会部分犯过类似的错。你刚说的第一点就是一定要做和一定不做,我觉得那个其实很有意思的,就是你说不要做。被外部条件推动的一些选择,对,而去做和自己的能力匹配,或者说你自己最开始看到的那个方向相关的那个选择。
其实我觉得他这个是涉及到,就是说创业的时候你自己真心做的那些选择,我觉得输了大家也是认认的。对,我觉得你这个。就是总结非常好,就是我当时做游戏,就是我,我最后输了,我都有点不认,我就说我怎么做了个这样一个,我也不喜欢。对我最近还在想,就是所谓大家不是天天搞什么文化价值观嘛,后来我就在想,我到底觉得怎么样做事儿是能把事儿做对的?
我觉得两个字儿,用心。这个东西就是把人直接划为了两个大群,就是很多人他只是把他当一份工作,他是不用心的。你给我什么,我做什么。其实你只有用心,你才会去热爱它,才会去思考它,然后就会把它做的跟别人不一样。那我觉得这个事情是一定重要的,无论是说我对自己的要求,还是说我对可能团队合伙人或者对团队的要求,我觉得用心非常重要。
嗯,对,我觉得这两个词很好,而且用心甚至它都不是指你仔细认真。嗯,就你可以做一件事儿非常仔细非常认真,你觉得不用心?对,但不用心啊,你在完成你的任务。嗯。对你在机械化的做一些工作,对,因为我觉得我自己就有这个问题,所以我对这个还是有体会的。对我,我觉得自己后来很多失败就是不相信。我很直白的讲,我觉得第一次创业太用心了,就是真的是每天只要醒着的时候都在想怎么把这事做成。
我觉得第二次有一些所谓的骄傲或者傲慢在,就是觉得。好像这个事儿想到这儿就差不多了。当你有这样的心态的时候,这个事儿就不可能成功。因为我觉得聪明人很多,哪怕我觉得就回过去前面的人生,我觉得自己也算走的比较顺的,但每一个阶段我都能发现,在很多方面比我优秀的人。其实有段时间就想哦,可能自己也就是个挺普通的人,就你还不错,就是还不错的普通人那样。
但然后来第一就从当时开始搞安全的技术,包括说后来创业,就觉得哦,我好像自己还是可以做一些不一样的事情的。但是我后来又有些骄傲或者翘尾巴了,就是也不好。所以我觉得,就这次真的重新出发,我觉得就是刚你问的问题,就是怎么样去总结,一定要做,一定不要做。我觉得这个词就可能总结了很多的东西,就一定要用心,一定不要在很多事情上半途而废也好,或者说就是觉得哦就差不多了,就创业这个事儿没有差不多,你只有不停的去逼自己,才有可能有一线生机。
嗯,你现在有回到之前在长亭的那个状态吗?就是可能你醒着的时候,很多时间都是在想。是的,MuleRun 的事儿。是的,因为这个事情我觉得足够大吧。我们当时就内部大家非常一致的点,就是我们觉得这个事情一定出很大公司,或者说有很大的机会。只是我是不是我们?因为我前面讲,就是我们你们也看到很多不同的公司,或者大家殊途同归,就其实就是路径选择的不一样,但其实做的事情最后可能差不多一件事情。
呃,就像 coding,反正那么多大公司也做了。我觉得 App Store 这个东西,我觉得你像 ChatGPT、Gemini,Gemini 以最近上了类似的东西,我觉得大家都会做。那其中的路径选择就会非常重要。就你不停想的这个过程中间,你更多的是感受到了一种快乐和兴奋,还是因为它是一个很大的机会,然后这种竞争的紧迫性会让你不停的在想这个。
我觉得都会有这个东西,就是想和去执行一些操作,然后有反馈,然后再去想这件事情。它本身就是一个在过程中能带来正反馈,也能带来很多的疑惑和思考的过程。它有乐趣,但同时它有很多痛苦,因为你会觉得我说想错了。我最早可能有几个假设,后来验证了发现这个假设好像不对。那这些假设会不会支撑我原来那个判断就不对?就我觉得其实是始终重复这样一个过程。
就创业也一直是这样的,就比如说你当时在可能第一次创业的时候,我觉得 OK,我好像发现了某一些 pattern,我 follow 这个 pattern,我可以把这个事情去规模化。但是后来我发现哦不对,遇到这儿遇到坎儿了,我是要打个补丁,还是说我之前那个假设就错了?我觉得其实你把事情看到,比如说去做某一些事情的方法,或者说用人的方法,其实都是类似的,因为那时候就是刚毕业,什么都不懂。
我去选择什么样的人,就加入我们公司员工,或者说,我怎么样去管理他们?我们怎么样去定义我们的客户市场?这些东西其实一直都是在不停的学习的,但是这里面也是,就是我前面说呢,八百个糟心事儿和两三个好事,那大量的痛苦也会过来,疑惑也会过来,你怎么去熬过他们?我这也是跟很多朋友聊,我觉得我自己的韧性应该也是算不错的,但是我觉得跟那种真正强韧性的人比还是差一点。
你现在三十三岁,重新回到创业状态,和你当年二十二岁的时候开始创立长亭,你觉得相同的地方和不同的地方是什么?我觉得相同的地方,可能就是对这个事情都还是有热情的,对自己做的事情,怎么说呢,都是重新开启了一段新的旅途吧。然后不一样的点,我觉得就是年龄和见识比当年年纪大了嘛。然后头也秃了,身体状态肯定不如年轻的时候那么精力旺盛。
因为那时候,比如说最早跑赛尔四的时候,我可以基本上是每天都是红眼航班到一个地方,啊,忙一天再换,然后睡几个四五个小时就能处理很多事儿。但那时候我觉得就是因为太忙了,就我回过头来看那时候身体状态其实很差的,因为那时候经常会口腔溃疡,或者说就是有点小感冒或什么,就经常在不停的生病,肠胃不好。那现在身体状态也会好一点。
心态反正也恢复过来了,前面关公司那段时间的确也是比较比较差的,但后来就好很多。然后我觉得重新出发就是。啊,还是用一个很好的心态去处理。那虽然自己年纪大了些,可能不如年轻人那么能拼,但是我觉得也多了点经验嘛。还是很年轻的啊啊,谢谢谢谢,嗯,对你这次想把 MuleRun 做到什么状态啊?就你会给这一次创业定一个什么样的目标?
我觉得我们就是宏大的目标肯定很大嘛,但那个东西其实不能指引方向,能精准指引你方向和给你带来正反馈成就感的,其实是一个一个 milestone 的实现。我觉得我们现在比较专注的就是第一个,我们能够真正去丰富起来我们的供给,也就是前面讲的一件事情。就是我们能够有非常简单好用的创作者工具出来,然后能激活很多他没有代码能力的人,也能做一个 agent 去解决他工作里面要面临要解决的一些问题。
对,我觉得这个就是一个很棒的成果。嗯,这是你的下一个马斯登,下一个马斯登。我觉得我们希望他能够在半年以内吧,半年以内看到一些好的成果。那你觉得整个明年会发生什么吗?你可以讲讲你们自己,你希望会发生什么?你这个行业你觉得会发生什么?我觉得,对我我们自己其实就刚那件事儿,我觉得那件事情就是我们的非常重要的一个 milestone,我们就激活了这个双面市场,我们就可以看到会有什么样棒的事情在这儿发生。
如果顺利的话,就是扩大规模,是吗?再往下的话,对,我觉得扩大规模,而且看到真正的一些非常强的,有很多人用的 agent 出来。甚至是我们,就是我觉得我们的成功一定是 out of 我们 expectation 的成功,就是我们都没有想到,哦,这儿能有这样的东西。就像苹果最早出来,它能有那个汤姆猫和那个愤怒的小鸟,这也不是他们设定出来。
而是他们有了这样 App Store,有了这样的好的硬件,那就有创作者在上面做出来这样的东西。所以,我我们会觉得这个是让我们兴奋的点。那对行业来讲,我觉得二六年就是一个应用非常重要的年吧。就是你可以看到这个世界整个的互联网巨头也好,呃,所有人对 AI 的投入达到了一个巅峰。那这个巅峰一定是要看到下一个东西的,因为你单纯的现在在说大模型变得更聪明一点。
它也没有产生很大的直接的实际价值,就比如说我现在大模型比原来更聪明点,它新解决哪些问题吗?还没有。大家其实大多数人目前最大的就 AI 应用还是 Chatbot,对国内可能都有八九千万元宝。那海外的话,比如说就是 ChatGPT、Gemini 和 Claude,就大多数的场景还是在聊天。但是应用层的一个类似 massive adoption 的应用,目前没有看到。
对,比如说今年下半年,我们可以看到,在视频模型上其实进步很大。从最早我们都觉得很多东西很鬼畜,到现在可能一些物理定律都成都已经可以了,包括苏然兔它多镜头直接训进模型里面,然后音画都同样。就我觉得。我们看到了模型能力的持续提升,但还没有看到模型能力持续提升带来就是一个完全不一样的应用出现。那我觉得这个。
你觉得二六年可能会出现会有很大的,就是或者说它一个足够大的吧?那我不知道这个足够大怎么定义?可能它的年收入有个现在大家都讲 A R 一亿美金吧,能不能有一个 A R 五亿美金甚至十亿美金的真正 A I native 的东西出现?就是这个东西是有了大模型之后才出现的一家新公司。比如说今年收入增长很快,国内像那个就 Manos,然后美国 Higgs Field 也都是应用层大的,但但还不够大。
我觉得能不能更大一些,或者有更新一些东西出现?就是他真正把大模型的能力变成了生产力。那你对模型本身的期待是什么样?模型能力你觉得它接下来会往什么方向发展?或者说你们作为一个 Agent Marketplace,你希望它往什么方向去强化?我肯定希望它在那个 coding 和 agentic 的能力上强化。
其实这就是很好的方向。那国内你可以看到,Kimi 它其实也不去追那种 general 的大方向,它其实它现在很想它在 agentic 的能力和 coding 的能力上去做强化。我觉得我们肯定希望看到这点,因为我们本质是一个希望那个大模型它不是说智力提升,比如数学竞赛考得好对我意义不大,但它能更好的用工具,更准确的用工具,更高效的用工具,对我是意义很大。
那今天非常感谢宇森做客晚点聊,分享了 MuleRun 的整个创业的故事,然后接下来他们要做什么?他们致力于是给很多想来开发 Agent 的人。包括各种行业专家或者有重复任务需求的人,提供一个非常简单的开发的平台,可以部署在这里,然后也可以把自己做的东西分享出去,可以赚钱。然后同时有这些需求的用户也可以在这个平台上来使用这个东西。
嗯,然后 marketplace 也是 agent 到了一个相对成熟的阶段之后。出现了这样一个创业的机会。后面我们也延展聊了,就是宇森之前连续创业的一些经历,中间有一些比较顺的过程,也有一些比较走下坡路的状态。然后这些给现在的创业带来了什么?那今天节目就到这里,各位再见,拜拜!谢谢,拜拜。本期连点呈现,分享对最近 Agent 领域一系列快速变化的小观察。
从 Cloud Code 在二五年年初发布,二五年下半年变得越来越好用,其实很多人都逐渐意识到,它就是一个能力最强、最好用的 General Agent,通用智能体。宇森这期提到,这在几个月前可能还是非共识,而现在越来越变成共识。而 Cloud Code 带来的机会,如果一句话总结,我觉得就是用 Agent 造 Agent。
这比用 AI 造 AI 大模型更早实现,或者也可以说它是一种广义的用 AI 造 AI,而它在应用或者说需求上满足的就是每一个用户可以为自己的独特流程来打造工具。雨森提到的应用的 3D 打印机就是一个很形象的比喻。而一旦 agent 可以做 agent 了,就会有很多产品形态的推演。我觉得去年下半年至今的多个产品都在多少表达或顺应这种技术趋势。
就包括比较早提出 personal agent 的马卡龙,号称高配版马卡龙的蚂蚁灵光,从社区更转向工具的 you wear,包括最近 MuleRun 的变化,在我的理解里,其实也是一个从复刻淘宝的货架模式的交易平台。变得更像一个工具,只是这个工具里也带了交易系统,还有这期提到的字节飞书的
AnyGen,包括我们没有提到的 Tree 去年上线的 Solo 模式等等,当然还有最近大火的可以直接从 WhatsApp 等我们习惯的通信产品里发出 AI 指令的 Claude Bot。
但总体来说,这个方向还有很大的提升空间。Cloud Code 的命令行交互对绝大部分人来说非常难用。虽然 Anthropic 已经亲自下场做了套壳 Cloud Code 的 Cloud Co Work,但非 Max 用户。暂时要在 waiting list 里等待,而且套壳是有很多方向的,这就有创业小团队的机会。
个人手搓 agent 的这个趋势,在二零二六年一定会产生新的东西,引爆点也不难想象。一个真的门槛够低,对非编程人员也易用好用的产品。那就看谁先抢到这枚果实了。本期节目就到这里,感谢收听。如果你对今天聊的话题有观察、好奇或疑问,欢迎在评论区分享想法,这也会成为我们节目的一部分,让整个讨论更完整。你也可以把我们的节目分享给对这个话题感兴趣的朋友,推荐更多你想听的主题和嘉宾。
你可以从小宇宙、苹果 Podcast 等渠道关注“晚点聊 Late Talk”。也欢迎关注我们的公众号晚点 late post,下期再见。