开路者:在无人区种下第一颗种子

2026年1月8日,智谱AI正式登陆港交所,成为中国首家上市的大模型公司,也成为全球大模型第一股。这一历史性时刻背后,是智谱CEO张鹏带领团队长达近十年的坚持与探索。访谈中,张鹏回忆起创业初期的艰难:当他们向投资人阐述“认知智能”这一方向时,对方完全听不懂——“什么东西?你们怎么挣钱?怎么商业化?”有投资人甚至直接问:“这东西你们能变成钱吗?”更有一句尖锐评价流传甚广:“智谱就像水泥一样,它能干得很漂亮,但是它就是没有太多的情绪价值。”

张鹏坦言,智谱并非市场最热门的明星项目,而是技术延伸型、长期主义型的代表。他们选择了一条更难但更本质的路径:从基础研究出发,推动下一代人工智能——认知智能——从实验室走向产业实践。正如张钹院士所强调的:“人工智能不是一个纯科学,它是一个工程实践加理论科学同步演进的综合性学科。”因此,技术突破必须与工程落地、商业闭环紧密结合,才能真正推动AI向前发展。

‘Break a leg’,摔断一条腿。它通常意味着祝您好运。

智谱是AGI历史上的一个先行者,就开路的人。

从Paper to Product:清华实验室的产业化基因

智谱的诞生并非偶然。张鹏自1998年进入清华大学,此后始终扎根于此,长期负责实验室的工程转化工作。他所在的“知识工程”实验室,早在2000年代初就已具备罕见的国际化能力——“少有的能挣美金的实验室”,靠的是与国外企业合作交付真实系统。这种实践导向的传统,源于导师提出的“Paper to Product”理念:研究成果必须转化为可用的系统或产品,而非止步于论文。

到2016年,随着上一代AI企业(如旷视)的成功与瓶颈显现,张钹院士带领团队开始深入探讨“下一代人工智能”问题。他们意识到:感知智能已近天花板,而通用人工智能(AGI)尚不可定义,唯有‘认知智能’可作为可操作的下一步台阶。这一判断成为智谱的起点。团队在内部达成共识:AI不仅是研究课题,更是产业命题;既要在前沿理论中突破,也要在产业一线验证

它能取得的产业效果也就这个样子。那下一代的技术是什么?

人工智能这件事情,它就是一个跟产业紧密不可分的事情,你们就应该去产业里面去做这个事儿。

体制外的体制内:在规则缝隙中寻找路径

2016年,智谱核心团队已初步成型:教授们专注科研突破,张鹏带队负责工程转化与产品交付,知识产权专家德斌推动技术推广与合作,市场高管三本则带来产业视野与生态资源。分工清晰,目标一致——将认知智能从概念转化为可落地、可商用的系统

然而,创业之路远比想象复杂。工程转化不仅是把原型变成产品,更涉及硬件适配、场景嵌入、成本核算与商业模式设计。张鹏坦言,早期报价时“心里没啥底”,因缺乏财务体系支撑,只能“拍脑袋估价”,多数项目仅能覆盖成本、发点奖金。更关键的是体制障碍:2016年前后,在职教师创业属敏感行为,虽存在灰色地带,但官方路径缺失。智谱团队选择主动寻求合规化路径——“不悄悄做,而是找官方渠道”,希望“走得顺畅,不留首尾”。这也反映出其理性务实的底色:不靠侥幸突围,而靠系统性构建可持续的创新机制

嗯,所以确实是变化很大吧,但是也很感慨智谱能走到今天,也非常不容易。

破冰:第一个吃螃蟹的清华团队

2016至2017年,智谱团队在启动科技成果转化时,并未选择“先悄悄做、后被动应对”的路径,而是主动寻求官方认可的正式渠道,希望整个过程“走得顺畅、不留后患”。彼时清华大学已具备转化意愿——校方成立了如数据科学研究院等产业转化机构,并聘请有产业背景的人员负责,显示出明确的政策信号。真正关键的转机出现在2018年:国家多部委联合发布专项文件,首次明确允许科研人员利用已有成果开展科技成果转化,并规定收益分配原则——一部分归单位,一部分归团队自由支配。然而,该文件仅提供方向性指导,并未细化操作细节:分配比例模糊、成果评估机制缺失、流程规范空白,导致执行层面举步维艰。

作为首批实践者,智谱团队与学校共同探索这一“无人区”。当时清华科研院金院长、师姐志鹏及多位校领导均高度支持,双方在理解与配合中厘清规则。整个流程耗时一年多(2018年初政策出台至2019年6月公司完成注册),核心难点在于:如何将非货币化的科研成果转化为可估值的资产——例如已有获奖成果的鉴定等级、技术成熟度、未来商业化潜力等,均需转化为股权分配的货币基准。最终达成的协议虽未公开细节,但被团队视为“比较顺利”的成果。正如张鹏所言:

‘我们是第一家,我们系里面第一家……整个清华都是第一家。’

‘因为你毕竟是第一个吃螃蟹的嘛。前面没有人走过这个路,嗯,学校也没走过……大家是在互相理解、互相的配合,找到这个切合点。’

从情报平台到认知智能:技术演进的逻辑

早在2016年,团队即以A Miner(学术搜索与分析平台)为核心开展产品化探索,组建20余人团队专注科技情报服务。该平台凭借算法优势,在国际上获得广泛影响力,客户包括Google、IBM、美孚等头部企业,年横向科研经费达近两千万,实验室成为清华“最赚钱”的团队之一。但受限于体制内规则,收入无法个人化,促使团队更坚定走向产业化。

他们选择科技情报作为切入点,不仅因其具备明确的市场需求,更因该领域高度契合其对下一代人工智能——认知智能的构想。团队认为,传统AI(如图像识别、语音翻译)仅解决“已知问题”,属于“感知智能”;而认知智能则需实现“我知道我不知道”乃至“我不知道我不知道”的层级跃迁——即理解、推理、综合与生成新知识的能力。情报学本质上正是认知能力的密集应用:从海量文献中提取知识、综合演绎、产出新知,这与人类知识演进逻辑完全一致。

大客户(如Google)付费委托的正是此类高阶任务:预测未来3-5年某技术领域的热点方向。这类预测无法依赖人工经验或传统咨询,而需依托机器学习模型对规范化学术数据(论文、专利、报告)进行自动化分析。与依赖专家问卷的传统情报工作相比,A Miner平台以算法驱动,显著提升效率与覆盖广度。尽管当时算力有限,但其方法论已与大模型时代高度同源——用数据与算法构建认知模型,而非仅依赖规则或经验

‘情报学要做的事情……它特别像我们刚才说的那个认知的能力,就不是像它本质就是认知能力的一种应用,啊,非常密集的一种应用,啊,非常典型的一种应用。’

从场景出发的技术创业

智谱的创业起点并非凭空而来,而是基于一个明确的应用场景——即在高校中已有一定用户基础的产品与平台。张鹏提到,公司成立时虽聚焦于核心底层技术(如何用数据和机器学习算法构建模型),但这一技术路径与当下大模型解决的问题本质高度一致,只是当时采用的是上一代方法(如BERT等早期预训练模型)。尽管创业初期“也在亏着”,但已具备初步商业化能力,并在完成学校科技成果转化后迅速获得第一笔天使投资。投资人认可的正是这种“已有产品与用户基础”的确定性,而非空谈技术前景。

“我们已经在学校里面已经服务了这么多客户,所以这个事情大家一看,哎,这已经有了,都不需要等你去做产品了,是一个相对确定性的事情。”

“其实本愿还是在于我们要去探索AGI到底是什么,这是这才是我们的本愿。”

GPT-3的冲击与GLM的诞生

2020年中GPT-3发布时,恰逢智谱成立一周年。公司邀请战略顾问张钹院士座谈,深入探讨这一技术突破。张院士虽盛赞其为“机器学习的里程碑式进步”,但也明确指出其核心缺陷:模型不知道自己不知道——即会一本正经地胡说八道。这一判断促使智谱团队迅速转向对自回归预训练机制的研究,并很快跟进GPT路线。

然而,当时业界尚未形成对GPT路径的统一共识,团队更倾向于探索自主创新。由此诞生了GLM(Generalized Language Model)算法:它并非简单复刻BERT或GPT,而是巧妙融合二者优势——将BERT的“双向填空”能力转化为可控的单向生成顺序,从而兼具填空与续写能力。GLM还因采用部分双向注意力机制,在训练稳定性、参数分布集中度等方面表现更优,进而带来量化精度损失更小的工程优势。该算法最终获得学术与产业界的广泛认可,被视为“独树一帜的流派”。

“它其实不知道,但是他会编一个答案给你……所以他实际上就是不知道自己不知道。”

“GLM是在BERT和GPT之间,我们当时想综合这两种算法的这个优势。”

千亿模型决策与OpenAI的镜像对照

2021年底,面对Scaling Law已被验证的行业趋势(参数量翻倍即性能跃升),智谱团队面临关键抉择:是否基于GLM训练一个千亿级大模型?当时GPT-3训练成本已超2000万美元,智谱预估自身投入亦需千万级人民币以上。尽管存在资金与技术风险,团队最终仍果断决策——必须自己做

这一决定背后,既有对OpenAI“研究驱动+工程落地”模式的深度认同(张鹏称其论文“思考非常深入”),也源于对自身技术积累的信心(GLM的优越特性保障了训练成功率)。整个模型训练历时约9个月(2021年底至2022年中),并于2022年8月首次开源发布。开源既是出于“扩大国际影响力”的战略考量,也因当时团队判断:技术开源比短期商业化更紧迫

“为什么还要去追求这种更好的技术?……其实本愿还是在于我们要去探索AGI到底是什么。”

“我们很果断地去做。当然,这个主要还是科学家团队在里边起了很大的一个作用。”

开源战略与早期影响力

智谱在2022年8月启动了首次开源,这一决策背后有清晰的战略考量:一方面,当时大模型技术尚处于早期阶段,短期内难以实现商业化变现;另一方面,开源是快速建立国际影响力、融入全球技术生态的有效路径。彼时中美技术关系尚未高度政治化,开源文化在学术界与产业界均被广泛接受。开源后不久,智谱的GLM-130B便出现在斯坦福李飞飞团队2022年10月发布的权威大模型评估报告中,成为报告中唯一进入前列评估的中国模型,其性能与GPT-3处于互有胜负的水平。这一成果不仅验证了技术路线的正确性,也极大提升了团队信心与行业能见度。

我们当时开源之后,应该是那个报告,斯坦福那个李飞飞那个报告……唯一一个参与这个评估而且排的比较靠前,来自中国的就是我们。

G M 幺三零 B,所以影响力非常不错。

融资寒冬与ChatGPT的转折点

尽管技术上取得突破,2022年智谱在融资过程中却遭遇了严峻挑战:多数投资人对大模型缺乏理解,反复追问“这东西你们能变钱吗?”甚至有投资人建议“把估值降一半”,融资进程并不顺利。转折点出现在2022年11月ChatGPT发布、2023年春节前后在国内引爆热潮——短短半年内,市场认知发生剧变:投资人不再质疑技术本身,转而主动询问“你们什么时候能把ChatGPT的东西做出来?”。

ChatGPT的出现极大降低了市场教育成本,智谱迅速推出对标产品ChatGLM-6B(60亿参数),并开源部署版本,使单张家用GPU即可运行。此举极大激发了研究社区热情,成为其首个在开源社区爆火的项目。同期,国内大模型创业潮兴起,百度、阿里、智源等机构亦已布局,但智谱凭借先发优势与技术积累,迅速确立了行业领先地位。

你们这个版本把它推上线……大家都很惊艳。

你之前其实做了很长一段时间……十年干什么什么无人知,一招什么什么天下晓。

百模大战中的清醒与焦虑

2023年被称为“大模型元年”,“百模大战”成为行业主旋律。大量企业、创业者涌入赛道,连王小川、袁金辉等成功企业家也纷纷二次创业。智谱团队虽身处浪潮中心,却保持清醒:技术远未成熟,模型仍仅能充当基础聊天机器人,无法支撑医疗、决策等高阶应用;更关键的是,团队担忧市场可能经历“烈火烹油—极端泡沫—快速坍塌”的循环,最终导致整个生态失温。

当时行业争论焦点集中于“通用模型 vs 垂直模型”,但张鹏事后反思,这一争论实为伪命题——所谓垂直模型在后续发展中几乎未留下实质影响,反证了当时许多声音缺乏技术根基,混杂着故事与泡沫。他强调,真正决定成败的,是能否穿透表象,聚焦模型能力、推理、循证等底层问题的解决。

我怀疑,我怕的是整个这个市场有一个极端走向另外一个极端之后……如果这个市场都没有了,你做的再好也没用。

你所谓的垂直模型根本就在市面上没有什么声音……它里边被人加了一些佐料。

从Chatbot到专业场景:大模型落地的真实挑战

单纯把大模型当作一个聊天机器人(chatbot)是远远不够的。真正有挑战的应用场景,比如情报分析、医疗诊断等,需要模型具备预测能力、逻辑推理能力、证据支撑能力等多维度的综合能力——而这些能力在当时都尚未解决。张鹏指出,当用户说“我今天哪哪不舒服,你给我推个药”,模型敢推荐吗?用户敢用吗?答案显然是否定的。这背后反映出一个现实:大模型从技术演示走向可靠落地,仍是一条漫长且复杂的路

更重要的是,这个问题无法由单一团队或公司独自解决。它本质上是一个开放性问题,需要整个行业共同参与、协同推进。张鹏提到,他与王小川曾多次在科技园楼下长凳上交流,甚至在机场摆渡车上讨论行业共识问题。王小川曾提出将模型分为 L0(基座)、L1(专业化/垂直化)、L2(应用层)的分层框架,并希望推动行业形成统一认知。张鹏对此表示认同,并补充强调:垂直模型或专用模型是可以做的,但必须建立在一个足够强的 L0 基座之上

“你相信通用?我不是相信通用,因为我是相信说,足够高的智能这件事情,它不是一个专项能力,哪怕一个最好的医生,它一个基础教育,对它也是个非常均衡的这个知识的。”

“垂直模型这件事情或者专用模型这件事情是可以的,是没问题的,但是它一定要基于一个足够好的 L0。”

MaaS的原始构想与中美商业化路径差异

早在2021—2022年,智谱就已提出 Model as a Service(MaaS) 的构想,其内涵远比当下普遍理解的“提供模型API”要丰富得多:既包括云上通用API服务(像用电一样即开即用),也涵盖本地化部署、软硬件一体化可移动产品等多种形态。张鹏强调,这种多维服务模式是他们后来商业化探索的重要基础。

然而,MaaS在落地过程中面临一个关键问题:如何让通用模型变成一门能盈利的生意? 投资人反复追问:“基座模型好挣钱吗?专业模型比如医疗多容易挣钱啊,你这个通用的,大家怎么给你付费?”这一质疑直指行业核心困境。

中美市场差异进一步加剧了这一挑战。张鹏坦言,美国SaaS和C端订阅模式(如ChatGPT每月20美元)的成功难以在中国复制——中国C端用户付费意愿极低,B端SaaS订阅模式也长期难以跑通。他曾分析:“如果你直接照搬ChatGPT那一套模式在国内,除非你能像他一样抢到一个非常巨大的首发市场优势,否则很难。”

因此,智谱很早就做出战略选择:不押注单一路径,而是并行探索多种MaaS形态。虽然也推出了“智谱轻言”APP、ChatG.M.云端版本等C端产品,但很快发现其商业模式受限:用户使用高峰集中在工作学习时段(早8点至晚6点),夜间极少;实际使用场景多为家长辅导孩子作业、员工提升办公效率——本质上是作为效率工具,而非高频娱乐或社交产品。尽管通过VIP会员制获得少量收入,但ROI(投资回报率)测算显示,C端规模化盈利并不划算。

相比之下,To B路径更具确定性:虽然故事不够“性感”,账也难算得清(一个客户值多少钱涉及交付、定制、成本等复杂变量),但行业存在基本默契——低价抢单虽偶有发生,但普遍底线是“不能罔顾成本”,否则无法保证交付质量与可持续性。甲方也清楚:过低报价往往意味着交付风险。因此,To B市场虽复杂,却更稳定、更可预期。

“你看美国活得很好的SaaS,在中国活得很惨,对,是吧?”

团队扩张与行业演进:在快速变化中构建护城河

2023年,智谱团队从百余人迅速扩张至200多人;2024年进一步翻倍至400人;截至当前,已超800人,基本实现“每年翻倍”。为匹配发展节奏,公司三年内搬了三次办公室,均在同园区内:从柯建→赛尔大厦B座→现址。张鹏形容这种变化“非常快”,既源于技术迭代加速,也来自市场需求的快速演进。

2023年最大的挑战,是在技术快速迭代(如GM2、GM3密集发布)的同时,搭建起清晰的商业化框架:MaaS架构、To B企业服务、开源生态、研究进展四线并进。张鹏认为,那一年“把基本的商业化架子搭起来了”,为后续发展打下基础。

面对行业新势力(如MiniMax、Kimi)的崛起,张鹏持开放态度:一个新兴行业必然迎来更年轻、更有想法的参与者,这是技术演进的自然规律。他评价杨志林“非常聪明”,是典型的“学霸型”人才,虽出身实验室背景,但具备极强的商业洞察力。

谈及To B业务的长期竞争力,张鹏指出:技术理解深度是最高溢价来源。作为AI原生企业,智谱对模型底层逻辑、训练与推理成本、部署约束的理解远超外部厂商——这意味着在同等效果下,他们能用更少人力、更短周期交付,形成难以复制的效率优势。这种“技术驱动的降本增效能力”,正是AI时代To B服务的核心壁垒。

“我用同样的钱,你买订阅一个月花十万块钱,我可以用十万块钱买十个人一个月,帮我把这活干了。完了就全是我的,本质上是因为这个,还是因为这个成本的原因?”

年轻力量与行业演进:新入局者的必然性

在谈及大模型行业涌现大量年轻创业者这一现象时,张鹏认为,这是一个全新行业发展的必然趋势。由于技术边界尚未固化、范式尚未稳定,年轻人往往更具创新活力与探索热情,更容易在未知领域中提出突破性构想。这种代际更替并非偶然,而是技术演进中创新扩散的自然结果。

以杨志林为例,张鹏评价他为“非常聪明的学霸型人才”,从清华大学毕业后赴海外深造,早期在学术圈已有显著影响力;其创办的循环智能、月之暗面(Kimi)均展现出扎实的技术积累与战略定力。作为同门师兄弟,张鹏强调清华工科背景赋予团队成员高度理性与坦诚沟通的特质——即便在商业竞争中,彼此仍能保持尊重与开放对话,“碰到盐商,该怎么样就怎么样,各自有一套规则”

原话:“碰到盐商,碰到了该怎么样那就怎么样,各自有一套规则。各自有一套沟通的方式。”

而在与严俊杰的交流中,张鹏注意到其强烈的商业化导向:他不仅精准锚定了消费级市场与情绪价值方向(如Talkie、语音、多模态应用),更将技术路径明确服务于商业闭环的快速构建。这种“目标先行”的务实策略,代表了另一类大模型创业者的典型路径。

原话:“他很明确,他也非常明确……他做的很多事情……都是朝着这个方向去的,消费、娱乐,然后大家的精神价值、情绪价值。”

AGI信仰:拒绝曲线救国,坚持长期主义

当被问及“谁真正在追求AGI”时,张鹏斩钉截铁地回应:智谱坚定地将AGI作为终极目标。他强调,融资只是手段,资金本质是“盘缠”——用于支撑寻找并集结同一信仰者同行的长期旅程。在他看来,AGI之路漫长且充满不确定性,若缺乏共同信念,团队难以持续协同攻坚。

他明确反对“曲线救国”逻辑——即先通过短期商业化积累资金,再回头投入AGI研发。理由有二:其一,人性使然,人极易在绕行中遗忘初心;其二,技术上,局部突破(如特定任务的感知能力)并不必然导向通用智能。他以自动驾驶为例指出:早期基于白盒控制理论的方案虽在常规场景有效,却难以应对“路上突然窜出一只兔子”等corner case——问题不在于算力或数据量,而在于缺乏泛化能力

原话:“人也是这样啊……教你开车,会手动挡的车,让你去开自动挡的车,其实你会很快就会。为什么?你会去尝试啊?……自己就能学会,这就是你学习、反馈、试错,然后再应用到新的情况上去。”

认知智能的本质:泛化、试错与经验学习

张鹏进一步阐释了认知智能与传统感知智能的根本差异:真正的智能不在于死记硬背规则,而在于具备泛化能力——能从有限经验中总结规律,并迁移到新场景中主动试错、修正与举一反三。他引用数据专家观点指出:“含有试错过程的数据”比纯净正确数据更具价值,因为智能成长恰恰源于对错误的识别与纠正。

这一理念与2024年图灵奖得主Sutton的“经验为本”(experience-based)理论高度契合——智能的本质是基于包括成功与失败在内的全部经验进行学习。这也解释了为何当前大模型训练越来越重视后训练(post-training)与强化学习(RL):模型需在与环境的交互中积累“经验”,而非仅依赖静态预训练数据。

基于此,他梳理了AGI实现的五个阶梯(L1–L5): - L1:预训练——记忆世界知识; - L2:对齐与推理——学会正确组合与应用知识(SFT主导); - L3:自学习——通过强化学习在试错中优化策略; - L4:自我认知——明确自身知识边界; - L5:意识层面——尚无明确定义。

原话:“真正的认知的这个能力……是能搬到一些我没见过的情况下,能泛化,能泛化的,这个才是我觉得是认知智能和原来的感知智能最大的一个区别,有脑子,对,得有脑子。”

Scaling Law的演进:从暴力堆算力到精细调优

张鹏指出,Scaling Law并非一成不变的物理定律,而是随技术阶段动态演化的经验规律。在L1阶段,性能提升依赖参数量、数据量与算力的线性增长;进入L2后,推理时计算开销成为关键;而当前L3阶段(自学习),强化学习的样本效率与训练策略优化才是核心

面对算力成本飙升(2023年起显著上涨),他坦言“非常贵!成本受不了了”。对此,团队采取双轨策略:一方面积极融资以维持战略投入;另一方面极致优化成本结构——例如GLM-130B训练总成本仅约1000万人民币(含人力),约为OpenAI GPT-3年代的1/14。其优势在于:中国团队擅长“雕算法”,在消费级GPU上实现千亿模型推理,将成本从百万级降至二三十万

他强调,近期发布的GLM-4.7表现优异,并非依赖参数量激增,而是通过更精巧的架构设计、训练策略与推理优化实现效能跃升——这标志着行业正从“暴力美学”转向“智能精细化”阶段。

原话:“你从一百多万的成本,一百大几十万的成本,降到只需要二三十万。就大家也很 happy 啊……好并不是因为它把参数量又加了一倍或者什么之类的,没有啊。”

克制规模,专注效率与成本优化

中国团队在大模型研发中的一个显著优势在于对细节的极致追求与对成本效益的高度敏感——这种文化使得我们在模型调优、推理部署等环节具备较强工程能力。例如,智谱早期便实现了在消费级GPU上运行千亿参数模型推理,将成本从一百几十万元降至二三十万元,大幅提升了部署可行性。这一“降本”主线贯穿公司发展始终:从硬件适配到模型架构设计,均以单机八卡推理为关键目标,避免过度依赖多卡扩展。

以最新发布的GLM-4.7为例,其性能提升并非源于参数量翻倍(仍维持在三百多亿),而是源于三方面:训练效率更高、数据利用率更优、架构本身更具推理友好性。这种“小而精”的路径,本质上是对scaling law现象的理性回应——我们并不迷信参数规模,而是在能力范围内,通过数据工程、训练策略、结构设计等多维度协同优化,实现性能与成本的帕累托改进。

“好的点就在于说,首先第一,我的训练效率更高,数据利用率更高,对吧?模型的架构本身就有这个优势。”

“降成本一直是一条主线……一直是重点。”

超越Transformer:在粗糙中寻找更优解

尽管Transformer架构已广泛应用,但其注意力机制远未达“终极答案”。自2022年起,各类Attention变体(如Linear Attention、Sinkhorn、MHA+MLP混合结构等)持续涌现,DeepSeek、Meta、智谱自身均在探索其潜力边界。我们持续投入研究,既在现有框架内深度优化(如微调、数据组合、多任务融合),也积极布局非Transformer路径。

2024年初DeepSeek的出现,极大刷新了行业认知:它通过跳过SFT、直接在Base上做强化学习等激进策略,验证了更高效训练范式的可能性。这促使我们重新审视自身路径——强化学习投入不足、工程优化未达极致、范式探索仍显保守。随后,我们快速推出SLAM框架,将多任务强化学习有机整合于统一系统,支撑GLM-4.5至4.7的连续跃升。

“DeepSeek让你们吃惊吗?……确实是给了我们很多的启示和提醒。”

“其实这个问题真的好像还不是最终答案。”

开源的悖论:免费≠可用,服务才是壁垒

开源是智谱自成立之初便刻入基因的理念——自2022年起已发布近70个开源项目,累计下载超六千次,是国内最具影响力的开源系列之一。但我们清醒意识到:开源不等于免费,尤其在商业化语境下,二者存在本质差异。

DeepSeek的彻底开源虽推动技术普惠,却也强化了市场对“开源即免费”的认知偏差,导致部分客户延迟采购决策:“你都开源了,为何还要收费?”对此,我们坚持用实践回应:开源模型虽可本地部署,但缺乏与企业系统集成、安全合规、持续迭代等商业化服务能力。DeepSeek自身亦不提供此类支持,最终多数客户在试用后选择回归专业服务。

“你不要把这个事儿混到一起。”

“过了一段时间之后,你会发现,大部分人都掉头回来……因为DeepSeek也不提供商业化服务。”

开源与商业化:动态平衡中的战略定力

在开源与商业化之间的选择上,智谱并非摇摆不定,而是始终坚持开源路径,并明确将二者分阶段、分目标推进:开源用于技术扩散与社区共建,闭源用于商业化产品与服务交付。张鹏指出,早期(2023–2024年)公司就清晰划分了开源版本与商业化产品的边界——开源提供基础模型与技术细节,而商业化客户获得的是集成工具链、专业部署支持与系统级服务,而非仅几十GB的参数文件。许多客户初期因无法对接内部系统而转向其他方案,但最终因缺乏真正的落地能力而“delay后又回来找我们”。这说明,当客户真正理解商业落地的核心锚点是生产力转化与客户价值实现时,自然会回归智谱。

DeepSeek也不提供商业化服务。就算我部署了这个东西,我顶多也就是把它当聊天机器人去问一问,我没有办法跟我的这个内部的系统什么之类的去做整合。

当大家想通这个商业本身它的核心的锚点是什么的时候,他自然而然会回来找我。

开源的全球意义:智力平权的催化剂

开源对中国乃至全球AI生态的影响远超技术本身。张鹏认为,DeepSeek的彻底开源打破了美国商业公司对顶尖模型的垄断,推动了全球范围内的“智力平权”——尤其让资源有限的国家和地区也能使用高质量大模型。他指出,即便没有DeepSeek,也会有其他力量推动开源,但其行动确实加速了这一进程。值得注意的是,DeepSeek自身也承认其技术成长受益于开源社区,这体现了开源的正向循环机制:贡献—受益—再贡献。

DeepSeek对世界的影响仍然是被低估的。尤其是在开源上。

如果开源这件事情是开启了一个新的局面,就是让这个更多的公司都开源了……我觉得这个是有一定的道理的。

AGI路径:统一模态与在线学习的闭环

谈及AGI(通用人工智能)的实现路径,张鹏强调两大关键方向:一是多模态原生融合(如语言、视觉、代码、执行动作等),二是在线学习(online learning)范式——即推理与学习不再割裂,而是形成“感知—推理—行动—反馈—再学习”的自动化闭环。他提到,当前Agent任务泛化性不足,根源在于数据质量、模型认知上限与长程记忆机制等基础问题尚未突破。而AGI的曙光,或许来自多模态统一建模 + 在线强化学习的结合:先构建一个具备多维感知能力的“大脑”,再赋予其与世界交互并即时学习的能力。

你可以想象这样吧,就首先第一,你造出来一个脑子……然后再给它装上手脚,它能去叫世界模型去解决这个问题嘛?

如果这个实现了,会是AGI吗?我觉得AGI就看到曙光了,应该再加上刚才我说的那个在线学习,可能他就真的就看到曙光。

上市:从一级市场到二级市场的关键跃迁

智谱AI的上市进程其实早在2022年、2023年就已开始规划,彼时团队已系统性地思考商业化路径、收入模型、成本控制与团队扩张等关键问题。张鹏认为,此次上市不仅是智谱自身发展的里程碑,更是整个大模型行业的标志性事件——它向市场证明:AGI并非空中楼阁,而是可落地、可产业化的现实路径。从资本市场角度看,企业从一级市场(早期投资与孵化)跃迁至二级市场(公开交易与公众监督),意味着从“学习阶段”进入“商业化验证阶段”,这本身即是对技术可行性与商业可持续性的双重背书。

“它还是可以走到这样的一个阶段的,它是一个真的能走到一个产业级的这样的一个事情。”

“上市并不是终点,后面还有很多事情,很多路要去走,很多事儿要去做。”

资本逻辑差异:中美AI公司的分野

面对OpenAI可能的上市路径,张鹏指出其背后是典型的“三高逻辑”——高风险、高投入、高回报,契合美国资本市场对颠覆性技术的容忍度与期待;而智谱则更强调稳定性、可控性与可预期性,这与中国当前的产业环境、政策导向及资本成熟度高度适配。他进一步驳斥了所谓“2026年AI将迎泡沫破裂”的担忧:是否泡沫不能仅凭情绪判断,而应回归本质——投资是否创造了真实生产力与基础设施。他以互联网泡沫为例指出,即便当年泡沫破灭,其沉淀的网络基础设施与技术遗产至今仍在驱动世界运转。当前中国在AI领域的投资强度远低于美国(约为其二十分之一),且多分散投入基础设施,集中度低,因此“在中国,不存在所谓AI泡沫,只有严重不足的投资”。

“你为什么要担心bubble?担心自己刚好是被戳破的那个?说白了,还是担心自己兜里的钱。”

商业模式与自我定位:Boring but Stable

针对外界将智谱视为“to G项目制外包公司”或“不够性感的to B企业”的刻板印象,张鹏澄清:企业客户贡献约60%营收,政府客户仅占20%,公司本质是“服务企业”——因为企业是社会生产力最集中、效率转化最高的单元,而大模型作为生产力变革级技术,理应优先落地于此。尽管团队曾探索to C方向(如面向上班族、学生、程序员的工具型产品),但在DeepSeek入局后便主动收缩重心,转向更契合自身技术基因的B端与开发者生态。他坦承智谱在用户触达与情绪价值营造上不如Kimi等竞品“酷”,但强调工程师文化、开源精神与扎实交付赢得了开发者群体的高度认可。这种“水泥式”的稳定感,恰是其长期主义的底色。

“你任何时候都是没有准备好的……只要认准了方向,愿意去学习、去提升,就可以去做。”

技术理想主义与商业化落地的统一

在谈及技术理想主义时,张鹏强调,智谱所追求的不仅是让机器像人一样思考,更要让思考的结果产生实际价值——即“思考完了之后,反过头来能用得上”。这与单纯实验室导向或纯商业化导向的路径存在本质差异。他明确表示:“我们不光要让机器像人一样去思考,还得让它思考完了之后,反过头来能用得上,产生实际的价值。”

他进一步指出,技术理想主义若脱离现实场景,便容易沦为空中楼阁;而纯粹的商业驱动又可能牺牲长期技术积累。因此,智谱选择了一条“卷起裤管、撸起袖管”的路径:既深耕模型研发,也深入客户一线解决问题。这种“不是你买了我的东西,拜拜再见”的务实态度,构成了其技术理想主义的实践底色。在他看来,技术理想主义与商业化并非对立,而是同一枚硬币的两面;若能实现AGI,自然也能成为伟大的商业公司——“哪怕实现了AGI,然后挂了也可以吗?说这个话就太不吉利啊!”

六年半:在孤独与高光中前行

回望六年半的创业历程,张鹏分享了几个令他动容的瞬间。2021年底,他孤身赴深半年,为深圳某大客户促成合作,最终带着几千万合同返京——这不仅是商业成果,更是技术价值被市场验证的关键节点。他坦言:“给公司赚钱是一种什么感觉?还是挺自豪的。哦,就是证明我们还是有这个挣钱的能力嘛,我们的技术还是有人愿意买单的,能给我们的客户去创造价值。

另一高光时刻是发布手机智能体时,AI现场发红包虽因数字输入错误出现小Bug,却意外成就了“AI给人类发的第一个红包”的历史性场景。而2024年7月发布GLM-4.5时,发布会转为低调线上举行,现场仅数十人,却在海外获得高度评价——“开源了,然后现场就是我也就很平淡的跟大家讲了讲……但在线上,在海外很多评价很高”。这印证了他的信念:“你本质上还是把这个事情做好,大家认可你,自然而然这件事情它还是会有这相应的这种回响。”

准备,是抓住机会的唯一方式

面对外界对“魔幻三年”的描述,张鹏归因于长期积累与持续准备。他引用数学导师的话:“机会永远是留给有准备的人的,哪怕是你在海上漂着,有一块木板从你眼前飘过,你也要扑腾两下,才能把它抓住。

在他看来,精准预测未来不可能,但系统性准备可实现——关键在于“日复一日、年复一年,坚持认为你觉得正确的事情,不要懈怠,不断的积累,不断的去做这些事情,沿着这个你认为正确的路走下去。”他强调,“不要被噪声所干扰”,而应专注构建真实能力。当技术突破、开源生态与国际认可(如海外厂商直接采用其模型)接踵而至时,正是这种长期主义让智谱得以在浪潮中站稳脚跟。

最后,谈及历史定位,他希望未来人工智能史书能记载:“智谱是 AGI 历史上的一个先行者。”——这个“先行者”的称谓,比“创新者”更重:它意味着在无人区开路、在不确定性中坚持、在沉默中积蓄力量