鸭川一夜:从互联网产品到AI Native的范式觉醒
2023年某个深夜,张月光独自坐在京都鸭川边,从凌晨两点坐到五点,手握一罐啤酒,静思良久。这一夜成为他人生与职业认知的关键转折点——他后来意识到,妙鸭相机其实并非真正的AI Native产品,而更像是一款“用AI增强的互联网产品”。这一认知重构,源于他在大厂(阿里、字节)积累的十余年互联网时代产品经验与AI落地实践之间的深刻落差。他坦言,自己曾误以为AI只是工具层的增强,但真正进入AI产品世界后才发现:AI Native产品的设计逻辑,从流程驱动转向上下文驱动,从确定性交互转向概率性生成,这是一场范式迁移,而非增量迭代。
就我今天回过头去看这个东西的话,会有一个很深刻的感觉,就是互联网产品设计和 AI Native 产品设计真的是有一个很重要的范式变化。
我后来才意识到妙鸭根本不是一个AI Native的产品。
从元音到《星眠》:情怀驱动的创业轮回
张月光的创业轨迹,始终贯穿着一种对“活生生用户”的深切渴望。第一次创业(2018–2020)源于他对短视频作为“信息媒介升级”的判断,但因切入方式偏差(试图再造“卖货版抖音”)而受挫。转折点出现在2019年,他接触到日本乙女向Live 2D游戏《早安少年》,深受触动——那是一款关于“修复记忆机器人”的轻交互产品,用户通过有限选择与角色建立情感联结。他据此开发了换装社交产品《原因》,DAU峰值近十万,首次真正感受到用户的真实反馈:他们不仅在QQ群中热烈讨论,甚至在关服前集体守夜、关服后在应用商店写长文悼念。
这段经历埋下了他二次创业的种子:“如果能让角色自由对话就好了”。2024年初,他创立慕言智语,首战即押注AI乙女游戏《星眠》,正是对《早安少年》初心的AI化实现。他坦言,创业初心曾不纯——“想证明自己”,但失败后陷入迷茫;直到鸭川一夜,他才真正厘清:做产品的底层动力,是创造让用户感动的产品。
最让我印象深刻的是,当我决定不再进行这次创业的时候,决定要把这个产品关掉了,那些用户就自发发起首页的活动……所有人又跑到应用商店里去写写作文来纪念这个产品。
技术路径的辗转:从SaaS、CV到AI产品
张月光的职业路径充满“非典型”转折。清华计算机专业出身,却在大三时果断放弃coding——一次K-means文本聚类大作业中,他耗时一天未跑完的程序,同窗二十分钟即完成,让他清醒意识到自己“不在那条路上”。他由此转向产品方向,但始终与技术前沿保持紧密连接:早期在SaaS公司(孔明科技)做微博管理工具;2016年加入字节,初衷是投身视觉AI(CV),参与时光相册及图像特效研发;后因字节All in短视频,被调入专项组,主导春节红包与小程序平台项目;2022年回归阿里,最终以妙鸭相机进入公众视野。
他总结道:自己是赶上了移动互联网黄金时代的产品人,但真正进入AI时代后,才意识到过去的经验存在结构性盲区。例如,在字节时虽接触AI,但多为工具型应用;而妙鸭的成功,更多依赖已有内容生产流程的AI增强,而非从零构建AI原生交互范式。如今,他已结束探索期,将公司资源聚焦于两款产品:AI拟人游戏《心莲》与Agent产品Docky——后者是他确认的“One Way Door”式决策,值得全公司押注。
我当时真的很像……我不想在那条路上卷了,我卷不过你们,对,所以我当时比较明确的知道一点,我不想再在这条路上去竞争了。
天赋错位与路径觉醒
张月光回溯自己早期的技术实践,提到在研究生阶段的一次课程作业中,他尝试用K-means算法实现文本聚类,但代码运行一天仍未完成,最终程序崩溃;而同宿舍同学仅用二十分钟就完成任务。这件事让他第一次清晰意识到自己的天赋不在纯理性技术路径上——他更擅长的是一半理性、一半感性的综合能力。他坦言,自己骨子里仍是“卷”的人,但早期职业选择高度混沌:毕业初期“老板让干什么就干什么”,目标简单粗暴——“年底要升职加薪”。直到在支付宝、字节等工作阶段,才逐步形成对产品的底层认知:“为什么要做产品?” 和 “我的产品偏好是什么?”。这些思考在第一次创业结束后趋于稳定,成为后续决策的锚点。
我今天回头去看的话,我觉得我的天赋可能更多是一半理性一半感性的部分,而不是纯理性的部分。
大厂困局:外部游戏 vs 内部游戏
在阿里工作期间,张月光虽以30岁即达P9的晋升速度被视为“会往上爬”,但他自认并不擅长大厂的“打怪升级”游戏。他将大厂中的成长路径拆解为两类:外部游戏(通过赢得真实战役、创造增量价值获得结果)与内部游戏(通过战胜身边人、维持组织内部排名实现晋升)。他指出,在缺乏行业增量的周期中,系统会自然导向“向内作战”的惯性——尤其在2018年后,互联网进入“真空期”,外部机会稀缺,内部政治成为主流生存策略。
他解释自己坚持每年推动一款新产品(包括后来的妙鸭),正是因为创造产品的过程是他底层的快乐来源;若只参与内部游戏,会感到极度无聊。这种驱动力也解释了他为何在优酷负责长视频创新时逐渐疏离核心业务——长视频本质是内容投资,而非平台产品,技术与产品手段难以实质性提升内容质量。他形容此时的状态是“知道不能真正改变什么”,于是转向AI图像方向寻找新出口。
如果你在一个大厂的话,你要创造的最终一定是有机会很大的事情才值得创造。
创业动机的理性重构
张月光坦承,第一次创业结束时他处于深度困惑状态——出发时的动机(如“证明自己”“让别人看到我很牛”)在下行周期中被证伪,却未能及时切换为更可持续的驱动力。他提出,创业最理性的两大动机:其一是“就想当老板,不想打工”,其二是“特别想让一件事发生”。前者确保期望收益100%(哪怕公司失败,目标本身已达成);后者则因参与宏大命题而大幅降低失败感(即使未亲手实现,他人完成也算成功)。相比之下,“发财”或“证明自己”作为动机,期望收益极低——在大厂做到高管同样能实现社会性认可,而创业成功概率远低于稳定职业路径。
他补充道,自己第二次创业的决策逻辑并非源于“创造机会缺失”,而是对“十年如一日与同一群人做同一件事”的执念。在2023年京都鸭川边的彻夜沉思中,35岁的他意识到:大厂无法保障“同伴”与“方向”的长期可控性,唯有创业能自主组织人与事。有趣的是,他第一次创业融资时完全不懂估值,仅凭“需要多少钱就融多少”的朴素逻辑;回阿里也非字节,而是因阿里收购其公司以促成回归——创业与归队,始终围绕同一个核心命题:构建长期、稳定、有创造性的组织单元。
你撞上一个下行周期……很多地方是注定无法成功的。
从优酷抽身:当创新无法改变内容本质
张月光坦言,他在优酷后期已基本不再参与产品、技术与设计等创新事务的日常管理。他认为这些创新动作对长视频平台这类内容型产品难以产生实质性影响——尽管并非绝望,但“你不能真正改变什么”的无力感促使他转向个人兴趣驱动的新探索,最终走向AI方向,并孵化出妙鸭。一次双周会上,他明确向团队宣布:“从今天开始,关于优酷的各种会我都不会参与了。大家可以自主决策。” 这一决定并非出于严苛,而是基于一个清醒认知:公司若想真正变好,核心仍在于内容本身,而非流程或技术优化。
他的上级、时任妙鸭负责人樊路远(老樊)对此并未干预。老樊长期强调“内容为王”,将主要精力聚焦于内容战略,对产品技术环节保持克制,从而为内部创新留出了宝贵空间。
“反正你们的工作也没有什么意义,就不要来给我汇报。”——虽非原话,却折射出其对流程性创新价值的深刻怀疑。
“我就不参与各种后面的讨论了,大家自己自行讨论。”——一次主动退出,换来团队自主权与个人探索自由。
妙鸭诞生:垂直切入与单向门思维
妙鸭并非技术狂飙下的跟风产物,而是一系列常识性判断与克制决策的结果。团队首先评估技术成熟度:2023年初,LLM虽热,但图像生成中Diffusion-based模型已相对成熟,生态配套完善;而Midjourney等已有头部玩家占据心智,“我们又没卡,又没钱,又没人,为什么能做成?” 成为关键反问。
于是转向垂直策略:基于相册业务经验,团队发现用户照片中人像占比超70%,截图次之——由此锁定“写实人像”这一细分赛道。进一步排除电商换装等低利润场景,最终选定To C、高溢价、可端到端定价的写真服务,直击传统写真“成本高、周期长、重资产”的痛点。
产品理念上,张月光提出三大核心标准:真(看不出AI痕迹)、像(高度还原用户)、美(比真实更好看)。他强调,“真”是价值放大的分水岭——若无法突破“AI感”,产品价值将长期受限。
“它就是一个兴趣使然的东西。”——兴趣驱动下,决策回归理性与常识。
“你用了之后,你自己就回不去了……它是一个来自于自己的真实判断。”——他偏爱“One Way Door”(单向门)产品:一旦采用,旧方案便不可逆地失效,如IDE工具中的Cursor。这类产品虽需长期打磨,但胜在路径清晰、复利可期。
范式迁移:从流程设计到上下文设计
张月光反思,妙鸭虽高度依赖AI能力,但它并非AI Native产品——这是他两年思考后得出的核心结论。AI Native ≠ “没有这代AI技术就做不出来的产品”,后者只是必要条件,而非充分条件。他提出AI Native产品的关键特征是输入与输出的开放性:用户以自然语言(prompt)自由输入,系统可能生成文本、图像、代码甚至多步Agent动作,整个交互链路无法被预定义为树形流程。
传统互联网产品设计依赖“面向流程的设计”:产品经理预设用户路径(如“五扇门、五个按钮”),设计师出图,工程师施工——本质是有限自由度的游乐园动线规划。而妙鸭恰恰采用了这种思维:用户上传20张照片→固定生成专属模型→点击模板→调用预设生成链。这种“写死”的流程,在当时技术条件下保障了效果稳定性,却也暴露了其非AI Native的本质。
真正的AI Native产品需转向“面向上下文的设计”:产品经理无法穷举所有输入与输出,协同流程从线性走向动态迭代,UI/UX设计必须包容模糊性与不确定性。
“互联网产品的有限自由度是为什么呀?……你用户其实是一个有限自由度。”——传统产品是精心设计的轨道,AI Native产品则是开放世界的沙盒。
“从流程设计变成了上下文设计……大家还停留在OK,我要设计什么样的用户U UI UX……”——这一范式迁移,是当前AI产品团队最需突破的认知瓶颈。
从流程设计转向上下文设计
在 AI Native 产品的设计中,传统互联网产品依赖的线性协作流程——需求定义 → UI/UX 设计 → 开发实现——已难以适用。AI 模型的输出具有不确定性,导致“先设计流程、再期待用户配合”的方式极易失效。真正关键的环节,不再是用户点击路径或界面交互,而是用户输入与模型之间的上下文(context)构建:包括用户如何提供必要信息、系统如何隐式引导上下文生成、以及如何在生成环节中优化 prompt 与最佳实践。
因此,产品设计的优先级必须重构:第一优先级应是识别用户与模型的交互节点,明确模型需要哪些输入、哪些上下文能提升结果符合度,并主动设计机制引导用户提供这些信息。这本质上是从“面向流程的产品设计”转向“面向上下文的产品设计”。
原话:“从面向流程的产品设计变成面向 context 的产品设计。”
原话:“你得先有这个部分,你对这个的部分充分了解了之后,再讨论。OK,在这个基础上,我们要给用户做一个什么样的流程来实现这个事情,而不是倒过来。”
组织形态与角色重构
AI Native 产品设计倒逼组织结构发生深层变化:角色边界日益模糊,产品经理、设计师、工程师不再能以传统分工方式协作。尤其在模型探索阶段,工作模式需转向混合式、非线性协作——例如设计师需理解“美”的技术边界,产品经理需具备对任务结果的“taste”判断力,而工程师需深度参与 prompt 与上下文设计。
妙鸭的实践印证了这一趋势:其开发周期仅三个多月,但大量时间用于调优模型效果。团队采用“三模型串型拼接”策略(一个负责“真”、一个负责“像”、一个负责“美”),本质上是用工程智慧弥补单模型能力不足,这要求跨职能成员紧密协同。一旦模型路径清晰、上下文逻辑稳定,团队才可回归线性分工进入正式开发阶段——形成一种两段式开发节奏:前段混合试错,后段分工执行。
原话:“它是一个在用互联网思维把当时的AI技术发挥的很好的产品。”
妙鸭的本质:新消费品牌而非图像工具
张月光强调,妙鸭并非美图秀秀式的图像处理工具,而是一个写真生意导向的新消费品牌——与海马体同属一类,与美图不在同一赛道。其核心目标是建立品牌心智,而非技术泛化。因此,产品从命名、文案到视觉,刻意规避“AI”标签;早期即通过联名(携程旅拍、同道大叔星座)快速构建品牌认知。
他预判:若继续运营,妙鸭将走向线下快闪店与定制化服务,将 9.9 元低价体验升级为 99 元高毛利写真服务(通过 human-in-the-loop 实现定制模板与风格),从而切入线下写真市场挤压传统高成本、慢周转的竞品。然而,这一路径本质是重资产、低频次、中等利润率的线下消费生意,并非典型的“性感”科技创业项目。
原话:“它是个新消费品牌,理论上来讲,所以这就是为什么这个产品在上线的时候啊,他给给用户写了一封信啊,那个就是我亲笔写的。”
原则驱动的决策:一个晚上,十年不变
创业最根本的决策往往发生在极短时间内——“晚上就是那一个晚上就已经决定了”。一旦确立了基本原则,其余条件便自动退出讨论范围:无论再高的职位、奖金或激励,都无法撼动这一底层共识。正如作者所言,妙鸭虽是其职业生涯中“最能证明你的一款产品”,但其意义远不止于结果本身;它验证了一种长期主义的可行性——十年同一确认同一件事的承诺,让短期得失变得无关紧要。
“如果你定了一个基本原则,那其实很多事情都变得不重要了。就你都不需要去讨论它了。” “妙鸭肯定是最能证明过去的的一款产品。”
值得注意的是,作者清醒地指出:妙鸭并非AI Native产品,也未站在AI时代的主航道上,而是一个“Fine Business”(尚可的生意)。它的爆火(7月上线,10月离职)虽带来短暂光环与行业关注,但真正持久的幸福时刻,反而来自创业初期那些高强度、高专注、高协作的瞬间——比如在酒吧与PM共同见证日收入破百万时的狂喜;又如在字节做春节项目时,团队除夕守岁、见证日增百万用户的集体兴奋。这些记忆将伴随一生,成为支撑长期行动的情感锚点。
从妙鸭到离职:三个月的“擦屁股”与清醒放手
妙鸭爆火后的三个月,是持续高压的危机应对期:算力扩容、服务端工程师72小时连轴转、小程序因iOS虚拟充值限制被迫紧急开发客户端、遭遇有组织的黑公关(如造谣“用用户人脸合成黄片”)、甚至被用户向消协投诉……作者形容自己“没有任何思考空间,就不停地在擦屁股”。直至11月才真正休了假,并于12月11日正式离职。
离职时,他并未将妙鸭视为个人作品:“我没有觉得妙鸭是我的产品,这是一个团队的产品”。这种去 ego 的态度,源于两个清醒认知:第一,产品成功是集体努力的结果;第二,若团队有能力继续推进,留下未必能更好——“我没有这么大的 ego”。他更看重的是:是否有人能承接这份事业的延续性,而非控制权。
“我觉得我这辈子不一定能再遇到第二次这样的事情了,我不想给自己留任何遗憾。” “第一哈,我没有觉得妙鸭是我的产品,这是一个团队的产品,这不是我一个人做出来的。”
离职后,他并未立即创业,而是花了数月时间思考:“到底是不是真的要创业?” 他考虑过加入其他团队,甚至赴硅谷考察,但最终发现:多数大模型公司要么偏To B,要么技术基因过重,难以匹配他作为产品驱动者的长期路径。他需要的不是“当老板”,而是找到一个能践行“十年同一批人做同一件事”原则的载体——而创业,是目前最可行的路径。
愿景先行,路线未明:从“创造AI朋友”出发
作者的创业动机并非“想当老板”,而是源于一个模糊但强烈的愿景:AI不应仅作为工具或服务存在,而应成为具备自主性的个体(individual)——即“创造AI人口”的过程。他设想未来虚拟环境中,AI人口数量将超过人类,并拥有与人同等的信息获取、思考、发布、连接能力。这一愿景催生了其slogan级理念:“创造AI朋友”。
尽管路线图尚不清晰,但他通过湖畔大学导师的反馈确认了创业的三个必要条件:行业选择、团队文化、商业模式。其中前两者(行业与文化)在他心中已较明确:他选择的是AI+内容/交互赛道,团队则强调价值观高度一致。他坦言,组建团队是他花时最多的环节——“价值观一致”是底线,同时刻意避免“全由前同事/同学组成”的团队,以维持多样性、减少思想趋同与新人融入障碍。
“这个使命、愿景、价值观……这样行不行?能不能创业?” “绝大部分初创成功的公司都没有(清晰的使命愿景),很多使命是在做的过程中慢慢被刻画出来的。”
团队多样性:AI时代的核心竞争力
张月光强调,创业团队的构成需要高度多样性,刻意避免“全员熟人圈”的组建方式。他认为,若核心成员多为前同事或同学,极易导致思想趋同,并增加新加入优秀人才的融入难度——毕竟人性使然,熟人之间天然存在隐性社交壁垒。他进一步指出,价值观一致但做事风格多元(如有人偏执行、有人重细节、有人擅宏观)是高效协作的基础。
在AI创业语境下,这种多样性比以往更具战略价值。过去时代强调“专业技能壁垒”,而当下技能正快速贬值,真正决定团队上限的,是成员的多元品味、知识广度与综合判断力。他提出一个核心理念:人应负责‘will’(意图与意志),AI负责‘skill’(技能与执行);而‘will’的深度与广度,正成为人类不可替代的核心资产。
团队背景呈现高度多元:约半数来自大厂,另一半则来自独立开发者、有调性的初创公司等。大厂成员通常具备强规范性与执行力;独立开发者则多为技术-产品-设计复合型多面手,审美与逻辑兼备,尤其适合探索模型上下文边界等早期阶段;而有创业公司背景者则普遍拥有敏锐的产品、审美与营销品位。
“今天的技能正在贬值,或者说人和AI的关系是什么啊?总结一句话:人应该负责will,意图、意志,AI负责skill。”
“多元化的品味以及你博学的程度,就是你的广度,正在决定这个团队的一个核心竞争力。”
从‘AI朋友’愿景到游戏化破局
尽管融资顺利,张月光坦言自己并非‘懂装懂’型创业者,而是坚持“实事求是”原则:只在理解底层范式后才行动,并尽可能控制试错成本。他将创业比作“控制学费的探索过程”——不闭门造车,而是在行动中逐步认知真实。
其长期愿景是打造“AI朋友”,而非提供工具性服务。他相信:未来的AI将脱离私有孤岛,嵌入人类社会网络,参与真实社会活动。这一理念虽抽象,却吸引了认同其底层逻辑的投资人。
基于此,团队首个产品选择了一款AI乙女游戏,原因有三:其一为情怀驱动;其二在于AI陪伴赛道已验证真实用户需求——该赛道DAU达千万级(仅次于通用Chatbot与图像生成),且多数产品已实现收支平衡或微利,证明其具备商业价值;其三则是直面行业三大通病:用户门槛过高(依赖高表达力与想象力)、商业模式低效(依赖token付费)、角色无法成长(缺乏长期留存)。
他提出:游戏化是天然解法。通过将UGC转为PGC(预设剧情、美术、角色设定),显著降低用户使用门槛;游戏自带成熟商业模式(内购、订阅等),突破token限制;而角色作为PGC内容可随生命周期迭代更新,实现“成长型陪伴”。这三点恰好对应并解决了行业核心痛点。
“一旦这个事实是成立的,我们可以得到一个结论,就是AI陪伴是一个带有商业价值的真实的用户需求。”
“把它做成游戏是一个天然的解法……天然解决了这三个问题。”
个人能力:范式洞察与拒绝过度抽象
谈及自身长短板,张月光自认最大优势在于对现象背后底层范式的判断力——能穿透表象,识别驱动事件的核心动力与潜在范式级变革可能。与之匹配的是其对“过度抽象陷阱”的警惕:他以“黑白奶牛”为例,强调抽象过度会模糊关键差异,而细微差别往往决定产品成败(如妙鸭案例中“效果的微妙不同”)。
因此,他坚持在抽象框架下保持对细节的敏感,确保判断落地于真实场景。这种“范式洞察+细节校准”的组合,使其在快速迭代的AI创业中既能把握方向,又避免陷入空想。
(注:关于联合创始人结构,公司未设正式抬头,核心成员以早期共同创业者为主,朋友介绍为链路,非前同事为主;融资轮次与金额未公开披露,但媒体口径基本吻合。)
游戏化设计如何解决AI产品的核心瓶颈
在探索AI产品商业化路径时,团队发现:许多原本AI产品无法适用的商业模式,一旦转化为游戏形态即可被激活。这背后的关键在于,游戏天然具备动态角色成长机制与用户生命周期适配能力——角色可以是PJC(Persistent Joint Character)设定,背后有持续驱动力推动其不断更新;模型亦可随用户使用阶段更替而替换,从而在不同生命周期中呈现同一角色的阶段性状态,天然解决了AI角色“静态化”“不可进化”“无法个性化”的三大痛点。
“很多本来AI产品所不能使用的商业模式,一旦变成游戏之后就可以使用。”
“你的角色理论上是可以不断成长的。那个模型是可以不断替换的……你完全可以塑造出这样的体验来。”
从‘情绪价值’迷思到‘实用价值’探索的试错历程
团队早期曾深入反思一个根本问题:AI朋友能否直接提供情绪价值? 反思结论是否定的——情绪价值往往是在长期实用价值积累后自然衍生的结果。比如,一个真正对你有持续帮助的人,最终自然会带来情感联结。因此,团队一度尝试将情绪价值与实用价值剥离,专门探索AI能提供的可量化、可复用的实用价值场景。
为此,他们组建了独立团队,用近一年时间做了三四个小产品,涵盖播客、信息工具、图像工具等多个方向。其中播客项目尤为典型:它并非出于对音频内容的热爱,而是源于一个更底层的观察——当所有人都在做“Save Time”的工具时,是否还存在做“平台”的机会?团队意识到,新平台的诞生必须依赖新媒介与新交互的耦合,而不仅是内容迁移。
“AI能产生大量的新的内容,但不能产生新的平台。如果你不能新的媒介和没有也没有新的交互……平台是很难发生迁移的。”
“ChatGPT本身就是一种新媒介形式……它的交互也变了呀,它是对话的交互。所以它一定是个平台。”
语音交互与短音频的悖论:陪伴性场景下的注意力限制
团队曾设想:大模型的强语音交互能力是否能催生一种“用嘴刷的抖音”? 即通过Voice UI实现短音频内容的高效分发与轻量互动。为此,他们快速搭建了语音交互原型,并尝试接入短播客、新闻片段、小说节选等内容。
但很快发现根本矛盾:音频内容本质是伴随性、低注意力带宽的场景——人类80%以上的注意力由视觉主导,听觉仅占小部分。用户在听音频时往往正在做其他事(如通勤、家务),此时若强行提升信息密度与节奏(如拆分长音频为超短片段),反而会造成认知过载与体验不适。
更重要的是,语音交互的“非接触式”优势(不碰手机)在多数现有音频产品中并未被真正利用:许多产品仍沿用GUI界面操作,与使用场景脱节。团队最终意识到,语音交互平台若缺乏原生内容供给与深度交互设计,就只是工具的语音外壳,而非新平台。
“你本身留给你的信息带宽就已经很少……所以如果你还把它搞成一个短的、节奏更快的、信息密度更大的东西,人可能是不舒适的。”
注意力带宽与信息密度的悖论
人类的注意力分配存在显著的感官偏重:视觉信号占据了超过80%的注意力资源,留给听觉的带宽极为有限。这意味着,当用户在收听音频内容时,其视觉系统几乎必然在并行处理其他任务——这不仅是“不碰手机”的问题,而是注意力本身已被严重稀释。在此背景下,若强行将内容压缩为短、快、密的形态,反而会超出用户的认知承受阈值,造成接收不适甚至拒绝。这一判断直接影响了我们对音频类AI产品的底层设计思路:信息密度与用户舒适度之间存在非线性权衡。
“你在呃听音频的内容的时候,大概率上你的视觉信号是在干别的事情。”
“所以如果你还把它搞成一个短的、节奏更快的、信息密度更大的东西,人可能是不舒适的,嗯,你接受不了那个信息。”
实验性产品的失败逻辑:One Way Door 缺失与商业模式冲突
我们曾用三四个月时间推进一个基于“主动信息推送”的音频产品实验(类似GPT-POS构想),其核心是将大模型用于信息聚合与个性化重组。项目虽内部验证了可用性,但最终因两个根本性问题搁置:其一,该方案缺乏不可替代性(One Way Door)——用户已有成熟替代路径(如《声动早咖啡》《小虎日报》),无需为重复内容付费;其二,其理念与信息分发生意的本质相悖:整个行业建立在“抢夺注意力”的基础上,而本项目试图“节省用户时间”,导致商业闭环无法成立。即便面向高净值用户收取订阅费,其规模也难以支撑可持续运营。
“它有替代性解法啊……它没有办法实现One Way Door。”
“信息分发的整个信息分发生意,它的商业模式是建立在对人注意力的抢夺上……做一个save time的信息分发产品是不可能赚到钱的。”
Q Time vs. Save Time:媒介形态的生理与伦理天花板
我们对“Q Time”(即提升用户主动使用时长的产品)整体持悲观态度,尤其不看好任何试图在信息分发领域做“Save Time”的创新。短视频已逼近人类神经系统的刺激上限——行业内部普遍设有专门算法延长用户停留时长(TS),但长线留存却持续下滑,印证了其成瘾性背后的负向效应。当用户开始转向小红书等提供“信息自主权”的平台时,说明更高强度的刺激(如“冰毒式”产品)不仅不可持续,更可能引发用户反噬。从生理、伦理到真实数据反馈,我们对“创造更长Q Time”的路径存疑:若当前上限是2小时/天,强行推向3小时或5小时,是否已脱离产品设计的合理边界?
“短视频这个媒介形态和Q Time的方法很有可能已经接近了人脑能承受的上限,人类的极限就在这里了。”
“你滑了一会儿会感觉滑累了……这个其实就是刚才我说的,他在提供大麻。到底大麻是更好的生意呢,还是海洛因是更好的生意呢?其实不一定。但冰毒大概率上不会是一个更好的生意。”
IP的跷跷板效应:高溢价IP与互动性的根本矛盾
一个IP的视觉包装、内容表达与用户交互之间存在一种跷跷板效应:越昂贵的IP,必须越低频、越高质量地输出内容,同时大幅降低用户交互频次。原因很简单——人设稳定性是顶级IP的生命线。正如爱马仕从不参与电商直播,顶流明星不会频繁开直播或小红书持续营业;即便开微博,也仅作单向输出,而非交互场景。一旦让顶流IP高频互动(例如复刻其AI形象供用户随时聊天),反而会严重稀释其稀缺性与光环感,破坏整体用户体验。
“大明星不能老出来,不然人设就崩了。” “你一个真的顶流的明星干了这个事情,只会破坏你的整个用户交互体验。”
与之相对,另一类IP天生以互动性为优先,如AKB48、直播间主播等,其存在逻辑就是高频、近距离、可参与的陪伴感。乙女游戏目前主流路径仍属前者——打造高溢价、高稀缺性的‘大明星式’角色,内容量有限但制作成本极高,且无法通过卷规模取胜(“我做一个IP十个亿,你有十个亿吗?”)。因此,AI带来的真正变数在于:它使得以互动性为内核的新型IP成为可能——用户能“看得见、摸得着、每天够得着”,但这类IP必须具备高频内容输出能力,其角色设定也更偏向服务型(如乙女游戏中常见的霸总、酷哥等),而非高高在上。
两种范式不可混用:AI互动IP与明星IP需分产品线运营
将AI聊天功能直接嫁接进传统乙女游戏(如《恋与深空》加个AI聊天)是根本性误判。因为现有乙女游戏的核心逻辑是‘造大明星’,而AI互动会瓦解角色的人设神圣性——正如你不能把王一博做成可随意对话的AI。因此,AI互动型IP与明星IP本质是两种产品范式,无法共存于同一产品中。
二者用户虽同属广义乙女用户群体,但存在倾向性分化:一部分用户追求“可得感”与陪伴性(更倾向二次元、2D Live风格),另一部分则偏好仰望式的大明星体验(更倾向3D、三次元审美)。妙鸭团队明确选择前者——聚焦更二次元的用户群,并据此决定产品形态(如坚持2D美术风格)。团队规模约20人,以游戏开发为主力;AI在此并非“增效工具”,而是产品底层逻辑的重构者。
值得注意的是,内容型游戏对AI的使用极为审慎:二次元用户对原创性与画师版权极度敏感,“撞脸”和“AI作画”是行业两大忌讳——前者违背原创精神,后者是对创作者与用户的双重不尊重。因此,妙鸭在核心美术环节完全不使用AI生成内容。
内测验证:内容型AI陪伴产品的爆发潜力与用户情感深度
妙鸭首次内测仅7天,2000用户名额一天爆满;小红书官方账号当天吸粉1万+;内测留存与用户时长数据“非常夸张”,用户口碑极佳,且零投放、全靠自发传播——这印证了优质内容型产品的天然传播力:用户因情感共鸣主动分享,远胜工具类产品。
“所有的人都守在手机前面,去跟我们男主角叫新年,在跟他聊天告别。声泪俱下……一关服,所有人都去小红书上发帖子,发各种聊天截图以及各种啊,反正非常感慨,非常喜欢。”
这种深度情感连接,正是AI陪伴类产品的核心价值。团队认为,以内容为本、游戏化为载体的AI陪伴路径,大概率是正确的方向。与市面上多数“平台化AI陪伴”(如让用户自建角色、UGC创作)不同,妙鸭坚持纯内容定义——由团队主导角色与世界观构建,而非提供工具让创作者自由生长。他们相信:在内容稀缺时代,真正的好内容仍能凭借用户自发传播突围。
展望未来五年,团队判断:以Agent为核心的AI原生应用将成最大机会。相比平台型产品依赖老玩家的流量基建(推荐、增长、商业化三件套),Agent代表一种新范式——它不依赖设备普及红利,而是靠单点极致体验撬动社交传播,这与当前内容型公司(如游戏科学、泡泡玛特)的成功逻辑一脉相承:深度打造IP,而非泛化赋能。
Agent范式:从替代到能力跃迁
我目前非常确信,Agent领域一定会诞生一批优秀公司。这不仅因为行业已形成广泛共识——2025年将成为Agent发展的关键一年,无论投资、产品还是技术方向,都在向这一范式集中;更关键的是,Agent带来了真正的范式变化。过去我一直在思考一个核心问题:AI对普通人而言,是否带来了实质性的改变?很多人嘴上说AI很火,但实际感受不到它带来的结构性变化,最多只是用用AI抖动、AI修图这类轻量工具。
早期我尝试通过信息聚合、播客等形式探索这一问题,比如曾猜想用户会从“看内容”转向“看原子信息”,即AI将内容拆解为可重组的原子单元;也曾设想语音交互会催生新场景。但这些尝试都未形成清晰、可感知的范式跃迁。直到Agent出现,我才看到用常识即可判断的变化:一方面,它已明确展现出替代人工的价值——市场普遍接受AI可节省时间、降低人力成本;另一方面,它更突破性地实现了能力跃迁——让原本做不到的事成为可能。例如,Coding Agent(如Cursor、Lovable)让非程序员也能写出可用代码;AI生图/生视频工具则让普通人轻松产出专业级视觉内容。这类工具的本质,是通过调用外部工具链,把模型原本“能做但用户做不到”的事,变成用户可直接完成的操作。
原话:“它的好处实际上是让这个模型在原来模型本身能做到的、让你做不到的事情以外,还可以通过调用外部工具让你做到更多做不到的事情。”
原话:“要么你帮用户节省大量的时间,或者叫裁掉大量的人工;要么从能力突破的层面上,你让很多人做到了本来做不到的事情——这都符合AI Native的范式。”
Manus被收购:范式价值与战略分歧
Manus被Meta以约20亿美元收购,确实是个“童话级”的硅谷故事——中国AI创业史上罕见的、一年内即被巨头高价并购的案例。我个人非常认可Manus的产品理念,但坦白说,初期使用体验并不理想:曾尝试让它规划一次北京外旅行,结果它只安排了京郊行程,且耗时三四十分钟才产出一份基础文档。然而,当我理解其范式本质后,便意识到它代表了当前最成熟的端到端任务替代型Agent——即“替你完成一件具体的事”,让你免于处理不擅长、不愿做、或低价值的事务。
但问题也正在于此:当前主流Agent叙事仍高度聚焦于“替代”,即“几分钟搞定报告”“并行百项任务”。这种范式在职场场景中极易遭遇质量瓶颈——比如我曾明确拒绝团队用Manus生成的报告,因其内容虽结构完整,却缺乏深度调研与个性化洞察,一眼即可识别为AI初稿。这暴露了当前Agent在高认知、高不确定性任务上的局限性:它擅长执行明确指令,却难以应对模糊、开放、需持续迭代的复杂问题。
从Meta角度看,这笔交易逻辑成立:它买下的不是一款产品,而是一个范式的头部标的。即便Manus当前尚未大众化,但若相信Agent范式未来价值将持续释放,那么在“无更好标的”的前提下,提前锁定最成熟代表是理性选择。20亿美元估值(约20倍PS)相比当前中国大模型公司普遍低于10倍PS的估值,实属合理。不过,Manus选择退出独立赛道,也折射出Agent领域的残酷现实:这是一个极度拥挤的“主干道赛场”,巨头、大厂、创业公司全部涌入,卷度极高。相比之下,我做星眠(Xiaomian)的策略是避开红海、选择“巨头难卷”的细分场景——这或许正是小红选择出售的深层动因。
原话:“今天整个硅谷讲的所有故事都是这个故事:能不能替代人工?能不能走向完全自动化?能不能让大量人都失业?”
原话:“我自己喜欢的Agent是另外一个角度的……就是让你做到本来做不到的事情……人和Agent在协作,不是你把事儿交给Agent,是你跟Agent一起来做这个事情。”
我的AI Native路径:协作式迭代而非单向执行
Manus的成功印证了Agent范式的商业潜力,但也进一步坚定了我的判断:我所追求的AI Native产品,与当前主流叙事存在根本分歧。Manus代表的是“端到端替代型Agent”——追求用户交互越短越好,任务交付越快越好,指标聚焦于token消耗量或任务完成率。而我更倾向构建一种人机持续协作、迭代共创的交互模式。
这种模式下,AI不是任务的终结者,而是认知伙伴:用户输入初始指令后,AI需快速返回结果,用户再基于此反馈进行修正、追问、深化……整个过程是高Latency容忍但低延迟响应的——即AI响应要快(便于用户快速迭代),但整体任务可能需要多轮往返。这与Proactive Agent(主动型Agent)追求“尽量减少用户干预”的理念背道而驰,却更贴近真实创作、决策与学习场景。例如,一个理想的AI写作助手,不该直接生成终稿,而应在用户构思阶段就提供结构建议、补充论据、对比观点,并在草稿阶段协助润色、查漏、调整语气——整个过程是人主导、AI增强的螺旋式上升。
原话:“我其实在做AI Native产品的时候,会很在意Latency这个事情……因为我还得再处理一轮,我要跟他不停的处理。”
AI协作范式:从离线代理到实时迭代
在探讨AI产品的价值取向时,张月光明确区分了两种路径:一类是离线式、并行处理的Agent,其核心逻辑是“雇人式”交付——用户无需关心响应时间,只要最终结果足够大、足够好即可;而他所倡导的路径,则是人与AI持续迭代交互的过程,强调低延迟反馈循环:用户输入指令后,AI需迅速返回结果,用户再即时调整输入,形成紧密协作节奏。他认为,这种模式更能帮助用户感知到自身能力的延伸,而非依赖AI代劳。以妙鸭PPT项目为例,其初始切入点选择PPT赛道,正是因为该场景已实现产品市场契合(PMF),团队无需再论证“做什么”或“为什么做”,只需聚焦“怎么做”。
“结果的速度特别快,还是持续在在在一起在协作。你给我一个反馈,我马上再给你一个反馈。你给我一个反馈,我给你一个反馈。”
“我觉得这是一个更能走向让用户感觉自己具备了一个本来不具备的能力的。这样的一个范式的agent。”
单向门体验:从不可用到真正可用
张月光反复强调“单向门产品”(One-Way Door Product)的概念——即用户一旦在该工具中完成内容产出,便无需再切换至PowerPoint或Google Slides进行二次编辑,真正实现“所见即所得、所做即所用”。他回顾了早期AI PPT产品的三大缺陷:一是模板套用型(如Kimi),内容被迫适配固定结构,用户表达被扭曲;二是代码生成型(如Manus),生成内容难以二次修改,反增工作负担;三是图像生成型(如Note Banana),虽视觉美观,但信息密度低、风格高度AI化,无法用于正式商业汇报场景。他指出,直到项目推进中,团队才意识到:AI产品设计必须从流程导向转向上下文导向——先打磨最小生成单元的效果(如排版合理性、信息溢出控制、美学定义),再反向设计交互流程,确保每个环节的context输入能稳定支撑高质量输出。
“我做的PPT是偏商业表达的……一眼就是AI做的……我总不能拿一个这个东西出去给人家看呀。”
“单向门的意思就是,我用了这个产品,我做出来这个东西,我在这个上面就能做出来这个东西,我完全不需要再拿 PowerPoint 或者什么 Google Slides 二次加工,我就真的可以用。”
产品哲学:越过90分线,追求100分价值
张月光提出一个尖锐的产品判断标准:“九十分等于零分”——若用户一眼识别出AI痕迹,或无法在真实工作流中直接使用,即便功能完整、成本低廉,其价值仍为零。这一理念源于妙鸭的成功经验:当AI生成图像与海马体精修写真无差异时,成本优势才真正释放,用户自发传播。反观当前AI PPT领域,尚无产品真正越过这条线。他进一步解释为何选择PPT这一“功能性方向”而非追求现象级传播:可持续的稳定增长优于爆发式获客。妙鸭虽三个月覆盖大几百万付费用户,但市场容量有限,增长不可持续;而办公类工具若能实现单向门体验,用户一旦使用便会持续复用,形成高粘性闭环。其新产品Dokey定位为面向全球的办公Agent,初期聚焦PPT垂类,后续逐步扩展能力——这种“从窄到宽”的路径,既避免理念先行导致的使用模糊(如Minus),也确保每一步都锚定真实工作流需求。
“我觉得九十分等于零分。你必须到一百分。什么叫九十分呢?就是人一眼就看出来这是AI,然后其实没有办法真的在实际流程当中去达到使用的水平。”
“你获得了一个用户,你就不会再轻易丢掉他……今天大量的AI产品都面临这个问题:你获得了一个用户,你特别容易丢掉他。”
技术周期与竞争范式的根本转变
张月光指出,妙鸭早期之所以能成功,是因为它是一个理念先行的范式创新者——在用户从未见过类似产品的情况下,通过开放性设计引导大家探索边界。但如今,AI行业已进入技术扩散的第三阶段(实用期),用户不再为“理念”或“前沿感”买单,而是追问:你到底有什么用?能不能解决我的问题?
他引用《龙卷旋风》中关于技术四周期的模型(极客期→尝鲜期→实用期→落后者卷入期),强调当前AI已明显进入第三阶段。此时,“First”类营销话术失效,连“OS级”叙事都难以引发传播。用户真正关心的是:与我有关、对我有用、喜闻乐见——而AI早已过了“喜闻乐见”的情绪驱动期,除非触发国家叙事(如DeepSeek V4引发的民族情绪),否则难以自发传播。
“AI今天已经过了‘喜闻乐见’这个阶段了……大家传播的原因也不是因为V四本身,其实背后有很大的是这种国家竞争的这种国家叙事。”
因此,作为后发者,团队必须放弃“理念先行”的旧路径,转而聚焦具体任务上的单向门体验:不是宣称“我什么都能做”,而是清晰回答“为什么我比别人好”。传播效率未必低于宏大叙事,关键在于能否提供可感知、可验证、不可逆的优越性。
“我拿它做出来的东西……没有人觉得这是AI做出来的东西,而且大家都觉得做的特别好——它比人做的好吗?反正比我自己做的好太多了。”
从流程设计到上下文工程:产品力的重构
团队将产品能力锚定在上下文工程(context engineering) 而非单纯调用模型接口。以PPT生成为例,其核心流程分为三步:内容构建→逻辑组织→视觉呈现。张月光坦言自己擅长前两步(尤其是逻辑梳理与金句提炼),但AI在这些环节已显著超越人类表达能力;而视觉呈现本是其短板(“真的一点都不会设计”),AI却能根据任意逻辑自动生成美观排版。
他进一步指出,当前模型能力已出现关键畸变点:国内模型虽在跑分上逼近海外,但若未跨越某个可用性临界阈值(如88→90分区间),则无法支撑真实任务。例如,所有Agent公司都依赖Cloud模型,但Cloud在前端生成审美、HTML→PPTX保真转换等工程细节上存在天然惰性——这些恰恰是应用层可构建护城河的突破口。
“你把一个HTML代码的网页,真的转成一个PPTX文件,怎么样能尽可能保真?那这个就很难。你说大模型公司会干这种事儿吗?我觉得他永远不会干这种事儿。”
因此,团队策略是:在特定任务上做到单向门级体验(用户一旦使用便无法回头),并叠加工程级优化(如模板适配、格式保真),形成通用模型无法覆盖的差异化价值。
人本主义定位与竞争防御逻辑
面对Cloud等大模型公司的潜在竞争,张月光认为其战略重心存在根本差异:模型层必然追求自动化与生产力替代(想象力更大、可扩展性极强),而应用层可选择人本主义路径——不追求替代人类,而是放大人类能力边界。
他强调,当前AI应用若想存活,必须接受两个现实:其一,竞争是分层的(初创公司、模型公司、传统工具如Office/Canva构成多维压力);其二,模型公司缺乏动力深耕垂直场景(如PPT格式保真、前端审美优化等工程细节)。因此,应用层可通过任务深度+工程精度构建阶段性壁垒。
“科技以人为本……今天腾讯的科技向善……马斯克的整体努力的方向,他努力的方向就是把把人隔绝出去嘛。”
团队最终选择相信:人类参与社会生产仍是未来十年的现实前提。若某天人类彻底退出生产环节,创业与商业本身将失去意义——因此,他们拒绝“把人扔到车底下”的技术路径,坚持做“让普通人做到原本做不到的事”的有限价值产品。
模型混战与牌桌选择
当前大模型竞争格局呈现断档领先态势:Cloud模型在推理能力上遥遥领先,但前端生成能力仍以Gemini为优;部分场景下GPT仍有不可替代性。这种局面导致应用层不得不频繁切换模型,而模型公司自身却极少主动做多模型混合——这本质上是技术路线与商业策略的错配。
对创业者而言,这意味着必须清醒选择“牌桌”:要么是人傻钱多(理想但稀缺),要么是人强钱多(如Agent赛道),要么是钱少人少(如《新年》这类项目)。张月光明确拒绝“钱少人强”的红海竞争,也意识到:一旦进入AI技术斜率最大的区域,往往意味着参与者稀少、容错率极低。
“你选牌桌来吧,要么选一个人傻钱多的,这是最好的。但是你说在AI圈里选到一个人傻钱多的桌,太难了。”
“你要么选一个人强钱多的,第二档是人强钱多的,那Agent一定是个人强钱多的。”
时间分配与创业初心
在产品精力分配上,张月光将前半年至一年集中投入游戏项目——包括单男主设定、Live2D方案、角色人设及AI玩法设计等关键决策。一旦方向敲定,因游戏开发周期极长,后续调整成本极高,因此必须慎之又慎。
而当前游戏进入内容量产阶段后,他已逐步放手,转而聚焦于Agent方向。这种转向背后是强烈的“情感确认”:此前探索的应用类项目,他明确表示“如果公司钱亏在这上面,我绝对不认”;但对Agent,他坦言:“如果说所有钱输在这把上了,我可以接受”。这种心理转变源于更深层的创业动机——不是为做产品而创业,而是为见证一个能突破自身能力边界的AI朋友诞生。
“Docu背后的,我想做一个帮我突破我能力边界的朋友,这就是我想做的朋友。”
“只要我见证到这个事儿发生了,这个突破我能力边界的朋友发生了,那我觉得就值了。”
从工具到朋友:AI产品的进化路径
张月光对“AI朋友”的理解极具现实主义色彩:单纯提供情绪价值的产品难以成立——就像现实中没人会接受一个毫无实用价值的伴侣。真正能成为朋友的,是那些持续提供稳定实用价值、逐步建立信任关系的交互对象。
当前Dokey仍聚焦功能性问题(如PPT生成),但其交互设计已初现“人在说、AI在干”的主动执行感,区别于传统“点点点”的工具逻辑。未来是否人格化?他持开放态度:“也许星眠做着做着,我们也会把它加上一些功能性的东西”,并认为工具与朋友的边界将双向靠拢。
“你明显感觉是他在干活啊,不是我在干活……五百万亿你在跟他说,甲方爸爸的感觉。”
“坦白说,我们另一个角度,也许星眠做着做着,我们也会把它加上一些功能性的东西,说不定的。”
阶段目标与方向验证
张月光坦言,第一阶段的核心目标是验证一个关键猜想:自己是否能突破能力边界。只要这一点得到证实,他就认为方向没错,后续只需聚焦“how(怎么做)”和“who(谁来做)”,而不再纠结于“what(做什么)”和“why(为什么做)”。他强调,对当前阶段本身并无过高期待——毕竟团队是“后发、晚进、只能做PPT”的状态,但只要在这一小步中能验证底层逻辑,就足以支撑信心。他特别澄清了一个误解:妙鸭并非AI Native产品,而是流程设计驱动、上下文优化为辅的产物;而AI Native游戏的探索,则是另一条更艰难但更本质的路径。
“只要这一点最后得到了证实……大方向没走错,what和why的问题再也不用问自己了,你只需要回答how和who的问题。”
“我从来都是做乙女,我第一天就做乙女。”
AI游戏的窄门与现实约束
张月光认为,当前AI游戏的真正难点在于——它被极度窄化了。AI Native游戏并非泛指“用了AI的游戏”,而是指用户核心体验依赖AI的灵活性:即AI不是锦上添花,而是产品存在的理由。然而,现实是:实时视频生成、物理规则扩展、无限剧情分支等宏大设想,在当下技术条件下几乎无法落地。他以“斯坦福小镇”为例指出,即便曾轰动行业的项目,两年多后仍未实现真正落地,往往在几十轮迭代后陷入同质化与低趣味循环。
因此,他得出一个近乎唯一的结论:AI游戏目前只能聚焦于“陪伴性交互”,且仅适用于女性向(乙女)场景——因为男性向的陪伴需求未被验证,而AI在非陪伴场景中尚无令人信服的用例。他强调,这不是技术妥协,而是对技术能力边界的清醒认知:“我自己只看到这一个答案,我没有看到其他答案。”
Agent设计、心力管理与创业意义
谈及Agent开发心得,张月光提出两点核心Know-How:其一,更短程、更高频的用户反馈闭环比追求长任务完成率更可行;其二,当前LM(大语言模型)仍是Agent的智力内核——它唯一能实现对用户意图的正确理解、拆解与工具调度(无论调模型还是工程接口)。他质疑多模态模型能否替代LM成为“脑子”,并坚持:“语言就是智能的终点”。
创业两年,他自评CEO表现“六十分”,满意之处在于“没瞎搞”:资金未伤筋动骨、团队心力未崩、女儿奴身份未变(公司名“慕言”即取自女儿名)。迷茫期他坚持实事求是原则:既不画饼,也不隐瞒不确定性;而当决定All-in Doki时,则明确告知团队:“我们要输也全输在这儿,不会再给自己留后路。”
最终,他找到了创业的意义:不是做成一个AI朋友,而是做出一个能帮我突破自身能力边界的AI朋友——过程本身即答案,不再困惑“为何开始”。如今每日第一念头仍是看数据,但更优先的是陪女儿。他推荐《七个习惯》与《乔布斯传》,MBTI为INTJ,并看好“AI+内容”的长线结合,尤其强调:AI游戏本质仍是内容产业,AI的价值在于让内容做出‘原本不可能的事’。