147: 访谈OiiOii闹闹：“先抖音后剪映” 不再成立，AI 时代的创作工具和内容社区

创作路径的再思考：从‘先社区后工具’到‘先社区后工具’

过去十年，OiiOii 创始人闹闹经历了从微信到剪映、再到二次元社区产品“离谱”的职业轨迹。在剪映的发展中，他观察到一条清晰路径：先有抖音这样的内容社区，再有剪映这样的创作工具，呈现出从 UGC（用户生成内容）向 PGC（专业生成内容）演进的趋势。这一模式曾被默认为通用逻辑，但当他基于此思路推出“离谱”社区产品后，开始反思其局限性。他指出，AI 时代的内容生产节奏与用户预期已发生根本性变化：过去抖音初期用户能容忍内容单调，而如今用户已习惯高丰富度的内容环境，若新平台无法在初期就提供足够多元、可消费的内容，用户留存将极为困难。因此，“先社区、再工具”的路径在当下未必成立，反而需要更早地以工具能力支撑内容的丰富性与专业性。这一认知转变，直接引导团队转向以 AI Agent 为核心的创作工具设计——它不再是传统剪辑软件的 GUI 替代，而是通过“以终为始”的方式，将专业创作者的思路封装为可复用的 prompt 模板，让普通用户也能高效产出高质量动画内容。

AI 工具的不可替代性：从‘可替代的 GUI’到‘以终为始的 Agent’

闹闹指出，当前许多 AI 创作工具仍停留在 GUI 层面，本质上仍是“可替代的工厂式界面”，而 OiiOii 的差异化在于采用了 Agent 架构——它不是让用户自由操作，而是围绕特定内容类型（如卡点动画、混剪 MV）构建“以终为始”的生成路径。这意味着工具本身已内嵌内容逻辑与审美范式，用户只需输入目标，系统便自动完成从意图到成片的链路。他强调，这种封装并非简单模板复用，而是将专业创作能力转化为可调优、可组合的 prompt 模板，其优势在于：即使 prompt 完全一致，生成结果仍具丰富多样性；而不同用户输入的 prompt 组合又天然存在差异，从而在保持一致性的同时，释放出极强的个性化潜力。这一设计，使 OiiOii 不仅是一个工具，更成为内容社区的“内容引擎”：团队可提前预设垂类内容模型（如国风短剧、热血番剪辑），在社区冷启动阶段就高效产出具备消费属性的内容，实现“工具即社区基建”的战略闭环。

动画产业的结构性机会：从‘供给瓶颈’到‘AI 零门槛’

动画行业长期面临一个核心矛盾：产能极度集中且专业门槛极高，而消费人群却持续扩大。从 B 站上 LWD 等难用工具仍吸引大量爱好者自发创作可见，市场存在大量“被压抑的供给”。闹闹认为，AI 的出现首次让动画创作门槛趋近于零，打破了“画技”这一历史枷锁。他观察到，动画受众早已超越儿童群体，国漫、海漫等持续拓展非儿童市场，消费意愿与规模同步增长；而一旦供给端因 AI 获得释放，消费量级将自然扩大——正如抖音普及后，人们开始对“普通人生活”产生兴趣一样，“供给一旦上去，消费它自然而然就会有这种可能性”。从剪映的演进路径看，内容平权总是遵循“专业工具→简化工具→全民工具”的路径，而动画领域此前从未发生过类似跃迁。OiiOii 的使命，正是补上这最后一块拼图，让动画从“小众热爱”走向“大众创作”。

多 Agent 协作：为动画工作流注入新逻辑

OiiOii 团队在产品设计初期就确定了以 多 agent 协同架构 为核心的技术路径。他们并非为所有视频内容设计统一方案，而是针对动画这一高度专业化、流程固化的领域——其制作逻辑长期沿袭传统影视工业的线性分工模式（如导演→分镜→原画→动画→合成），即便对个人 UP 主而言，也难以跳脱这一范式。相比之下，短视频等 UGC 场景因内容短平快、无需复杂角色与分镜，反而不适用该架构。

与 Movie Flow 将全流程封装在后台、仅向用户提供 prompt 输入与成片输出的方式不同，OiiOii 选择将整个工作流透明化呈现：用户可实时查看当前节点进度，并在任意环节进行编辑与调整。这一设计源于其对创作者心理的深刻理解——AI 工具不应取代创作者，而应强化其主导权与掌控感。正如团队所言：

“我们想把创作者当成导演，他在控制整个团队……即便很多东西是团队做的，但是他自己会有这种掌控感，所以他会有说这个作品是，嗯，由我来出发发的，是我的，对这个感觉是很重要的。”

这种“半自动化+强参与”的产品定位，虽在技术实现上远比封装式方案复杂：既要确保多 agent 间任务分配的准确性（如分镜 agent 面对‘画图’指令时需判断应交由角色设计师还是艺术总监），又要兼顾工作流的稳定性与动态可编辑性（如用户中途从角色出发反向调整剧本），还需保障前端编辑操作与后端 workflow 的实时同步。团队坦言，当前大量 bug 正源于这些高维排列组合下的不确定性。

“你比如说，呃，我在角色设计时候改完，然后再交给分镜师……他有可能是从中间开始，或者说我只是想要啊，那所以你要保证他一定的自由度。”

聚焦 PUGC：填补动画内容生态的产能缺口

在排除了面向机构的 AI 漫剧赛道后（原因包括：高度依赖人工剧本能力、属流量驱动型生意、且行业本身仍以人工提效为主），OiiOii 将目光投向了 PUGC（专业用户生成内容）群体——即以 ACG 类自媒体账号为代表的中小型内容团队（通常2–3人，周更频次）。这类创作者虽有持续产出动画内容的动力与付费意愿，却长期受限于制作成本高、效率低的瓶颈。

团队调研发现，全网 ACG 类账号约 180–200 万个，其生产效率几乎未被数字化工具改造。而 OiiOii 的目标是将动画制作效率提升至“一日十更”级别——即便保守估计为“一日两更”，也已是动画领域的颠覆性突破。更重要的是，该工具不仅适用于 ACG，还可广泛赋能历史、财经、情侣、职场、教育、科普等非虚构类垂类内容：这些领域本就缺乏现实拍摄场景，若动画成本低于实拍，自然会成为更优表达形态。

因此，OiiOii 的产品逻辑清晰而务实：以 PUGC 为锚点，释放其被压抑的产能，并通过工具化支持实现内容生态的横向拓展。有趣的是，内测阶段已有漫剧公司主动接洽，但其真实需求并非全流程成片，而是“剧本输入→批量生成高质量分镜→自行下载剪辑”的中间环节支持——这恰恰印证了 OiiOii 对“轻封装、重参与”路径的正确判断。

从 To C 到 To B：定位决定路径

在内容创作工具的定位上，团队曾明确排除了直接为慢剧机构提供重度 To B 服务的路径——并非未来不参与，而是初期不擅长、也不愿投入。他们观察到，许多慢剧公司虽主动接洽，但其核心需求并非“一键生成成片”，而是高效产出大量可用分镜素材，供后续人工剪辑使用。这类需求恰恰契合了团队“提供内容素材与信息量”的产品理念：不追求交付成片，而追求交付高效率、高自由度的中间态内容资产。

更深层的差异在于商业逻辑与创作初衷：慢剧公司以“快速变现”为初衷，因此高度依赖已验证的爆款公式；而团队的初心是“做动画”，更关注内容的表达自由与想象力拓展。这导致二者在产品策略上天然分道：前者是垂类工具+爆款导向，后者是平台生态+风格包容。正如团队所言：

‘我们不是奔着做爆款去的，我们的初衷是很想做动画。’

‘它的初衷是为了挣钱……这个初衷会导致你整个动作会完全不一样。’

动画生态的广度：风格、题材与时间的三重丰度

团队对自身内容取向的定义，可概括为三重丰度：风格多样性、题材多样性与时长多样性。他们希望覆盖从乐高、《辛普森一家》到水墨、像素、手绘、水彩等广泛视觉风格；题材上既包含沙雕、二创、穿越等轻快类型，也容纳原创、温情、脑洞等多元表达——关键在于：这些内容虽常被归为‘非漫剧’，却同属动画的广义范畴。

这种取向也反映在技术实现上：团队拒绝单一模型依赖，转而构建多模型协同的工作流。例如，Midjourney（尤其是Niji模型）擅长保留用户指定风格，但角色一致性弱；而Sora与Nano在角色保真上表现优异，却难以维持风格发散性。因此，团队采用工程化分流策略：对图片生成环节，基于明确规则预设模型组合路径；对视频生成环节，则引入智能Agent，依据分镜内容语义（如“打架”“哭泣”）动态选择最适模型。

值得注意的是，这种“智能+工程”混合策略并非终极形态——当前视频模型的智能选择功能虽已启用，但团队坦言此路径未来可能调整，暗示其仍在探索更鲁棒的自动化路径。

模型即抽卡：在不确定性中寻找惊喜感

面对当前AI模型的局限性，团队提出了一种务实而富有创意的应对哲学：将模型调用类比为‘抽卡游戏’——不追求每次完美，而是通过组合、筛选与保留机制，在可控范围内最大化内容表现力。

具体而言，若某模型在特定条件下生成了超出预期的抽象表达（如非写实动作、反物理规律的动态），即使不符合原始意图，只要具备视听上的“惊喜感”，团队也会选择保留。这种策略源于对动画本质的理解：观众对反常识、非现实的动态包容度远高于视频内容，因此“不完美但有灵性”的输出反而更具动画魅力。

这一理念也延伸至工程实现：团队对模型能力边界有清晰认知，因此优先保障基础稳定性，再在边缘场景中释放创意弹性。例如，在图片生成阶段，因对风格/角色保真度要求极高，采用人工规则分流；而在视频生成阶段，因模型输出天然带概率性，反而引入智能Agent实现动态适配。这种分层策略，既规避了当前技术的不稳定性，又为未来扩展预留了空间。

模型选择与能力边界：智能与人工的分水岭

在内容生成工具的演进中，视频模型与图片模型对“智能”的依赖程度存在本质差异：视频生成天然具有概率性——它不追求确定性结果，而是依赖“大概率合理”的输出，因此更适合由模型驱动；而图片生成若涉及明确规则（如像素级还原、精确构图），则仍需人工干预。这一逻辑也延伸至 Agent 的决策机制：其能力源于训练库与预设策略的组合，而非通用智能。

当前团队已暂时关闭旧有模型路径，将全部资源聚焦于 Sora Two——因其生成原理独特、效果显著优于既有方案。但 Sora Two 并非完美：一致性表现较弱，而自然感、音画同步能力极强，尤其在贴近真实场景方面优势明显。这种“重文轻图”的生成范式（以文本为主导、图像为辅助）与另一派“重图轻文”的模型（如 Tailwind，以首尾帧为基准推演）在技术路线上难以兼容。因此，模型选型不仅是技术问题，更是对内容本质的理解与权衡。

“它是一个概率，它是一个概率决定的东西啊，那它就可以用模型来解决，就是用智能来解决，但前前面是一个百分百概率的。那它一定不能用模型来解决。”

“Sora Two 的生成的整个原理和其他的是不一样的，我们只能另开一条路为 Sora Two 让让路。”

复合型人才：左右脑协同的稀缺资源

构建高效内容生成系统的核心壁垒，不在于模型本身，而在于人——即能否找到并组织一类罕见人才：既懂内容结构、又具技术理解、还保有审美直觉的“三合一”个体。这类人才需将感性认知（如镜头语言、节奏感）拆解为可执行的理性逻辑（如提示词设计、模型参数调优），再通过大量排列组合测试，找到当前场景下的最优解。

在实践中，团队常以“技术美术（TA）”为参考模型招募设计师——他们兼具工程思维与艺术感知，但又不拘泥于游戏行业的固定经验。目前核心团队约 4–5 人，由产品与设计师共同构成，前者把控逻辑框架，后者主导效果验证，双方均具备较强的左右脑协同能力。创始人坦言，这类人才“凤毛麟角”，尤其在抖音这类高影响力平台上，即便品牌号召力强，精准匹配仍极难。

“多模它就是要两个半脑要都很发达，对吧？……这类人是呃比较少见的。”

“你熟悉了这一套人力模型之后，你在面试的时候或者是在跟他配合的时候，你已经能 get 到他有没有这方面比较好的潜力。”

从极限运动社区到创作者服务：创业认知的迭代

对比两次创业，创始人指出：第一次创业（2014–2019）更多由热情驱动，虽在极限运动领域积累了丰富内容（如国内首批飞盘赛事、滑板纪录片），却因节奏失衡（过早投入重线下）、认知偏差（误判用户圈层规模）及能力错配（内容强但电商落地难）而受限。当时设备落后、短视频生态未起，导致 App 构想难以落地，最终聚焦内容制作才实现正向运转。

这段经历让他深刻意识到：自己真正擅长的是内容本身，而非运动垂类。因此第二次创业（OiiOii）明确转向“服务于创作者”的通用工具层，依托平台生态，以轻量化、高复用的模型组合赋能内容生产。作为 CEO，他仍深度参与架构设计与最终决策——尤其在模型排列组合的“最优解”判断上，需兼顾技术可行性与内容表现力。

“我退出来的一个很大原因是，我觉得公司它可能能养活自己，但是呢，它长不大……我当时很想去做服务于创作者的事情。”

“我现在回想起来，可能冲动是大于很多能力的储备的吧。”

从热爱出发，却撞上现实的墙

闹闹坦言，自己本质上是一个不惧挑战、乐于尝试新事物的人。从微信产品经理岗位离开后，他并未延续产品路径，而是选择回归内心热爱——动画创作。他学了半年动画，却很快意识到：作为一个习惯于简洁产品逻辑的人，面对Maya、3ds Max这类极其复杂的行业软件，他几乎“抓狂”，工具门槛远超预期。更现实的打击来自行业生态：2014年，他曾在互联网公司拿两万月薪，而动画公司实习却要倒贴钱；一位建模总监工作五年，月薪仅七八千，环境恶劣。这种理想与现实的巨大落差让他清醒——“没办法为热爱牺牲到这个程度”。

“当时我主要是学动画呀，我就真的很喜欢动画……很想从事这种很纯粹的事情，然后又很专注的事情。”

“我好像还是对物质稍微有点需求的啊，在那个时间点。”

尽管如此，他对内容创作的渴望并未消退。他转而选择切入一个当时中国几乎无人涉足的赛道：极限运动视觉内容。他并非深度玩家，只是滑板、滑雪等项目的“泛爱好者”，但正因如此，反而能以 outsider 的视角捕捉圈层精神内核。他受纪录片《半坡山地电影》启发，反问：“老外这么牛的人都可以拍出来纪录片，为什么中国人没人拍呀？”——这种冲动+使命感的混合驱动，让他一头扎进拍摄实践。他从零学摄影、剪辑，靠直觉和热情做出一批高质量内容，在圈内赢得良好口碑，也验证了自己在内容制作上的潜力。

关键转折在于：他意识到，自己真正擅长的不是单点突破，而是‘从负一到零’的系统搭建能力。这段创业经历虽未带来财务回报，却锻造出一种稀缺的底层能力：在不确定性中持续前行的韧性。

触底反弹：在焦虑中长出‘精神抗体’

2014–2016年是公司相对高光期，但闹闹却敏锐察觉到“空中楼阁感”：业务看似增长，实则缺乏电商运营、线下活动规模化等关键支撑能力。当行业泡沫破裂时，他的预感“非常准确”，焦虑随之而来。但与其他创业者不同，他并未被击垮——他找到了属于自己的‘着陆与反弹机制’。

这个机制并非来自商业策略，而是精神层面的重构：2016年底起，他开始接触佛法、禅修，并找到一位长期导师。他总结道，人之所以焦虑，核心在于对‘无常’的抗拒，以及过度执着于“我”的形象与得失。而禅修让他体验到一种更广阔、更安全的内在状态：“你真正的你是非常宽广的，很广大的，是非常安全的。”

“当你其实就是你会发现，这只是你的一个壳子，就是你你真正的你是非常宽广的，很广大的，是非常安全的。”

“安全感从……甚至它解决了死亡的这种恐惧，那你最本质的死亡的恐惧都已经消散了……创业的这个担忧，它必然在基本上那个大的脚链就已经去掉了。”

这种认知转变带来直接效果：焦虑自然降低，思维从“害怕结果”转向“聚焦动作”——不再反复想象灾难，而是拆解为可执行的小步骤，逐步积累正向反馈。他将此称为“精神抗体”：不是避免问题，而是在问题中保持稳定、理性、行动力的心理系统。这种能力后来成为他重返大厂、主导剪映增长的核心资产——他不再被环境波动裹挟，而是能冷静判断、精准发力。

带着‘抗体’重返平台，服务创作者的再出发

离开创业公司后，闹闹选择加入抖音/剪映团队，将此前在内容制作与产品思维上的双重积累，转化为服务创作者的基础设施。他强调，自己作为“产品出身+内容实践者”的复合背景，让他对创作者痛点极为敏感：自己曾运营工作室，深知移动端创作工具的缺失——当时抖音生态已爆发，但缺乏专业、易用的剪辑工具。

他加入剪映时，产品已有500–600万日活，而他主导期间，DAU增长至3600万。这一成绩源于两方面：一是平台红利（抖音与剪映均处高速增长期）；二是他系统性补足了团队建设、产品策略与传播落地能力——比如如何筛选人才、如何让产品功能真正契合创作者需求、如何提升工具的传播效率等。他坦言，此时的自己已不再依赖一时冲动，而是带着清晰的方法论与心理韧性，去推动长期价值。

他最终确认：创业的终极考验，从来不是‘从零到一’，而是‘从负一到零’的穿越能力。而这段穿越，让他明白——真正的成长，是让精神成为稳定器，而非情绪的奴隶。

从剪映到特效：在字节构建技术驱动的内容工具链

在加入剪映时，该产品已拥有500万至600万日活用户（DAU），而作者主导的后半程将其提升至3600万DAU。他自认对剪映的最大贡献并非具体功能开发，而是为组织筛选出最适配的产品人才；另一关键贡献在于打通了抖音投稿、简易模板、特效业务与社区增长之间的逻辑闭环——他亲自负责抖音特效业务，将技术敏感度转化为高频爆款：如全球首款实时变漫画特效、变老/变小/变性别、皮克斯风格滤镜等。他主导建立了一套爆款评估与打爆机制，涵盖从技术调研、上线评估到规模化推广的全流程，显著提升了全球范围内的爆款率。

“它是一个很好的技术，然后变成一个产品让大家用起来，这是我擅长的。”

“大家都在打一个胜仗的那种感觉……组织能力真的很强，部门墙比较弱，目标一致时协同非常迅速。”

作者特别强调字节当时极强的组织协同效率与数据基建能力：平台能基于科学流量策略，精准计算“谁该看到谁用了特效”，从而驱动模仿行为与使用转化。这种以数据为驱动的策略思维让他深度参与算法设计，也意识到此类方法论在创业场景中难以复用。尽管享受这段纯粹的技术产品实践，但后期因组织架构调整，其原有创作者服务方向被拆解——创作者身份日益多元（电商、直播、广告、生活服务等），导致业务分散、人力模型错配，他最终因“责任在撑，而非心流在推”而离开。

转向动画与AI：从B站生态洞察到OiiOii的创业起点

离开字节后，作者短暂调研内容赛道，最终选择加入B站——核心动因是系统性理解中国动画创作者生态与产能瓶颈。他观察到：B站虽拥有高质量创作者与用户，但动画产能严重受限，“被憋着了”的状态在AI时代尤为凸显。他在B站期间已与团队探讨AI动画方向，但受限于技术与资金，未能推进。这段经历让他确认：AI是释放动画产能的关键杠杆，而当前市场亟需一个聚焦动画创作的轻量化工具平台。

“如果我要真的还是很想做动画的话，我对这个大体的市场情况不了解，那肯定是做不了的。”

“产能被憋着了，被阻碍了那个感觉，就是在这个过程里头，其实得到了验证了的。”

基于此，他启动OiiOii项目。当前节奏快于预期：用户反馈倒逼功能上线提前。规划分四阶段推进——① 完善现有音乐类与故事类内容体验（约1个月）；② 垂类内容填充（搞笑、MV、科普等，约2–3个月）；③ 拓展小B客户（如游戏公司、玩具厂），通过授权IP支持二创与营销传播，实现商业化；④ 海外拓展（暂定1月中下旬启动，需摸索区域内容特质与人群）。他强调，社区建设需以工具为“承接层”，先保障内容可刷、可玩，再通过策划引爆内容实现留存与正向循环——“爆款是新增，留存才是核心”。

产品演进：从P端切入，顺势而为拓展B端

OiiOii 闹闹指出，当前产品的核心策略是从P（Professional）人群切入，即专业创作者群体；在此基础上，产品会自然向上延伸，服务于小型漫剧公司等B端客户。她强调，产品开发始终遵循迭代逻辑，而非强行押注某一趋势。例如，尽管今年漫剧赛道异常火热，团队并未盲目将重心转向B端大客户，而是保持观察、顺势而为——只有当市场出现明确的收益信号时，才会考虑组建小团队，针对性开发中大型B端功能。这种策略本质上是生态驱动型决策：先让用户和创作者在生态中自发聚集，再根据真实行为数据判断是否扩大投入。

它其实产品它是一个迭代的过程嘛……我们切的是P这个人群。再往上一点，就是一些小小型漫剧的公司，它就可以用了。

就很多东西，它是在生态里头看到迹象，然后你就顺着这个迹象把它放大就好了。

用户互动：从数据到“活人”，重建产品温度

当前团队的工作重心已显著转向用户反馈的直接处理。闹闹坦言，过去在大厂时，用户常以抽象数据形式存在；而如今，她每天深度参与150个社群（含124个测试群及20+合作群），亲自回复创作者问题——这些社群覆盖微信群、Discord及企业微信渠道。她特别提到，这种高强度互动不仅验证了产品的口碑传播效应（“大家都在口碑宣传，这个本来就是我们的初衷”），更带来了高质量反馈：用户建议多具建设性，而非情绪化攻击。这种“触达真实的人”的体验，被她视为创业早期极具价值的反馈闭环。

用户也质量很好，就是很有建设性的在给我们提建议，而不是……而不是就是谩骂呀或者是什么……我现在在两个群里头在回复创作者的问题……他们跟他们进行互动的感觉还是挺好的，很真实。

裂变机制：平衡增长质量与扩散速度

在邀请码机制上，团队采取了渐进式开放策略：第一阶段仅官方发放；第二阶段允许老用户（需为真实活跃创作者）获得5个邀请名额。为防止因过度裂变导致用户质量稀释，团队设定了明确门槛——用户需完成作品创作并保持活跃（约2–3天），方可解锁邀请资格。这一设计体现了对“真实活跃用户”的重视，而非单纯追求注册量。目前，邀请码仍通过公众号文章等渠道分发，形成“创作者自发传播”的良性循环。