创作路径的再思考:从‘先社区后工具’到‘先社区后工具’

过去十年,OiiOii 创始人闹闹经历了从微信到剪映、再到二次元社区产品“离谱”的职业轨迹。在剪映的发展中,他观察到一条清晰路径:先有抖音这样的内容社区,再有剪映这样的创作工具,呈现出从 UGC(用户生成内容)向 PGC(专业生成内容)演进的趋势。这一模式曾被默认为通用逻辑,但当他基于此思路推出“离谱”社区产品后,开始反思其局限性。他指出,AI 时代的内容生产节奏与用户预期已发生根本性变化:过去抖音初期用户能容忍内容单调,而如今用户已习惯高丰富度的内容环境,若新平台无法在初期就提供足够多元、可消费的内容,用户留存将极为困难。因此,“先社区、再工具”的路径在当下未必成立,反而需要更早地以工具能力支撑内容的丰富性与专业性。这一认知转变,直接引导团队转向以 AI Agent 为核心的创作工具设计——它不再是传统剪辑软件的 GUI 替代,而是通过“以终为始”的方式,将专业创作者的思路封装为可复用的 prompt 模板,让普通用户也能高效产出高质量动画内容。

AI 工具的不可替代性:从‘可替代的 GUI’到‘以终为始的 Agent’

闹闹指出,当前许多 AI 创作工具仍停留在 GUI 层面,本质上仍是“可替代的工厂式界面”,而 OiiOii 的差异化在于采用了 Agent 架构——它不是让用户自由操作,而是围绕特定内容类型(如卡点动画、混剪 MV)构建“以终为始”的生成路径。这意味着工具本身已内嵌内容逻辑与审美范式,用户只需输入目标,系统便自动完成从意图到成片的链路。他强调,这种封装并非简单模板复用,而是将专业创作能力转化为可调优、可组合的 prompt 模板,其优势在于:即使 prompt 完全一致,生成结果仍具丰富多样性;而不同用户输入的 prompt 组合又天然存在差异,从而在保持一致性的同时,释放出极强的个性化潜力。这一设计,使 OiiOii 不仅是一个工具,更成为内容社区的“内容引擎”:团队可提前预设垂类内容模型(如国风短剧、热血番剪辑),在社区冷启动阶段就高效产出具备消费属性的内容,实现“工具即社区基建”的战略闭环。

动画产业的结构性机会:从‘供给瓶颈’到‘AI 零门槛’

动画行业长期面临一个核心矛盾:产能极度集中且专业门槛极高,而消费人群却持续扩大。从 B 站上 LWD 等难用工具仍吸引大量爱好者自发创作可见,市场存在大量“被压抑的供给”。闹闹认为,AI 的出现首次让动画创作门槛趋近于零,打破了“画技”这一历史枷锁。他观察到,动画受众早已超越儿童群体,国漫、海漫等持续拓展非儿童市场,消费意愿与规模同步增长;而一旦供给端因 AI 获得释放,消费量级将自然扩大——正如抖音普及后,人们开始对“普通人生活”产生兴趣一样,“供给一旦上去,消费它自然而然就会有这种可能性”。从剪映的演进路径看,内容平权总是遵循“专业工具→简化工具→全民工具”的路径,而动画领域此前从未发生过类似跃迁。OiiOii 的使命,正是补上这最后一块拼图,让动画从“小众热爱”走向“大众创作”。

多 Agent 协作:为动画工作流注入新逻辑

OiiOii 团队在产品设计初期就确定了以 多 agent 协同架构 为核心的技术路径。他们并非为所有视频内容设计统一方案,而是针对动画这一高度专业化、流程固化的领域——其制作逻辑长期沿袭传统影视工业的线性分工模式(如导演→分镜→原画→动画→合成),即便对个人 UP 主而言,也难以跳脱这一范式。相比之下,短视频等 UGC 场景因内容短平快、无需复杂角色与分镜,反而不适用该架构。

与 Movie Flow 将全流程封装在后台、仅向用户提供 prompt 输入与成片输出的方式不同,OiiOii 选择将整个工作流透明化呈现:用户可实时查看当前节点进度,并在任意环节进行编辑与调整。这一设计源于其对创作者心理的深刻理解——AI 工具不应取代创作者,而应强化其主导权与掌控感。正如团队所言:

“我们想把创作者当成导演,他在控制整个团队……即便很多东西是团队做的,但是他自己会有这种掌控感,所以他会有说这个作品是,嗯,由我来出发发的,是我的,对这个感觉是很重要的。”

这种“半自动化+强参与”的产品定位,虽在技术实现上远比封装式方案复杂:既要确保多 agent 间任务分配的准确性(如分镜 agent 面对‘画图’指令时需判断应交由角色设计师还是艺术总监),又要兼顾工作流的稳定性与动态可编辑性(如用户中途从角色出发反向调整剧本),还需保障前端编辑操作与后端 workflow 的实时同步。团队坦言,当前大量 bug 正源于这些高维排列组合下的不确定性。

“你比如说,呃,我在角色设计时候改完,然后再交给分镜师……他有可能是从中间开始,或者说我只是想要啊,那所以你要保证他一定的自由度。”

聚焦 PUGC:填补动画内容生态的产能缺口

在排除了面向机构的 AI 漫剧赛道后(原因包括:高度依赖人工剧本能力、属流量驱动型生意、且行业本身仍以人工提效为主),OiiOii 将目光投向了 PUGC(专业用户生成内容)群体——即以 ACG 类自媒体账号为代表的中小型内容团队(通常2–3人,周更频次)。这类创作者虽有持续产出动画内容的动力与付费意愿,却长期受限于制作成本高、效率低的瓶颈。

团队调研发现,全网 ACG 类账号约 180–200 万个,其生产效率几乎未被数字化工具改造。而 OiiOii 的目标是将动画制作效率提升至“一日十更”级别——即便保守估计为“一日两更”,也已是动画领域的颠覆性突破。更重要的是,该工具不仅适用于 ACG,还可广泛赋能历史、财经、情侣、职场、教育、科普等非虚构类垂类内容:这些领域本就缺乏现实拍摄场景,若动画成本低于实拍,自然会成为更优表达形态。

因此,OiiOii 的产品逻辑清晰而务实:以 PUGC 为锚点,释放其被压抑的产能,并通过工具化支持实现内容生态的横向拓展。有趣的是,内测阶段已有漫剧公司主动接洽,但其真实需求并非全流程成片,而是“剧本输入→批量生成高质量分镜→自行下载剪辑”的中间环节支持——这恰恰印证了 OiiOii 对“轻封装、重参与”路径的正确判断。

从 To C 到 To B:定位决定路径

在内容创作工具的定位上,团队曾明确排除了直接为慢剧机构提供重度 To B 服务的路径——并非未来不参与,而是初期不擅长、也不愿投入。他们观察到,许多慢剧公司虽主动接洽,但其核心需求并非“一键生成成片”,而是高效产出大量可用分镜素材,供后续人工剪辑使用。这类需求恰恰契合了团队“提供内容素材与信息量”的产品理念:不追求交付成片,而追求交付高效率、高自由度的中间态内容资产

更深层的差异在于商业逻辑与创作初衷:慢剧公司以“快速变现”为初衷,因此高度依赖已验证的爆款公式;而团队的初心是“做动画”,更关注内容的表达自由与想象力拓展。这导致二者在产品策略上天然分道:前者是垂类工具+爆款导向,后者是平台生态+风格包容。正如团队所言:

‘我们不是奔着做爆款去的,我们的初衷是很想做动画。’

‘它的初衷是为了挣钱……这个初衷会导致你整个动作会完全不一样。’

动画生态的广度:风格、题材与时间的三重丰度

团队对自身内容取向的定义,可概括为三重丰度:风格多样性、题材多样性与时长多样性。他们希望覆盖从乐高、《辛普森一家》到水墨、像素、手绘、水彩等广泛视觉风格;题材上既包含沙雕、二创、穿越等轻快类型,也容纳原创、温情、脑洞等多元表达——关键在于:这些内容虽常被归为‘非漫剧’,却同属动画的广义范畴

这种取向也反映在技术实现上:团队拒绝单一模型依赖,转而构建多模型协同的工作流。例如,Midjourney(尤其是Niji模型)擅长保留用户指定风格,但角色一致性弱;而Sora与Nano在角色保真上表现优异,却难以维持风格发散性。因此,团队采用工程化分流策略:对图片生成环节,基于明确规则预设模型组合路径;对视频生成环节,则引入智能Agent,依据分镜内容语义(如“打架”“哭泣”)动态选择最适模型。

值得注意的是,这种“智能+工程”混合策略并非终极形态——当前视频模型的智能选择功能虽已启用,但团队坦言此路径未来可能调整,暗示其仍在探索更鲁棒的自动化路径

模型即抽卡:在不确定性中寻找惊喜感

面对当前AI模型的局限性,团队提出了一种务实而富有创意的应对哲学:将模型调用类比为‘抽卡游戏’——不追求每次完美,而是通过组合、筛选与保留机制,在可控范围内最大化内容表现力。

具体而言,若某模型在特定条件下生成了超出预期的抽象表达(如非写实动作、反物理规律的动态),即使不符合原始意图,只要具备视听上的“惊喜感”,团队也会选择保留。这种策略源于对动画本质的理解:观众对反常识、非现实的动态包容度远高于视频内容,因此“不完美但有灵性”的输出反而更具动画魅力。

这一理念也延伸至工程实现:团队对模型能力边界有清晰认知,因此优先保障基础稳定性,再在边缘场景中释放创意弹性。例如,在图片生成阶段,因对风格/角色保真度要求极高,采用人工规则分流;而在视频生成阶段,因模型输出天然带概率性,反而引入智能Agent实现动态适配。这种分层策略,既规避了当前技术的不稳定性,又为未来扩展预留了空间。

模型选择与能力边界:智能与人工的分水岭

在内容生成工具的演进中,视频模型与图片模型对“智能”的依赖程度存在本质差异:视频生成天然具有概率性——它不追求确定性结果,而是依赖“大概率合理”的输出,因此更适合由模型驱动;而图片生成若涉及明确规则(如像素级还原、精确构图),则仍需人工干预。这一逻辑也延伸至 Agent 的决策机制:其能力源于训练库与预设策略的组合,而非通用智能。

当前团队已暂时关闭旧有模型路径,将全部资源聚焦于 Sora Two——因其生成原理独特、效果显著优于既有方案。但 Sora Two 并非完美:一致性表现较弱,而自然感、音画同步能力极强,尤其在贴近真实场景方面优势明显。这种“重文轻图”的生成范式(以文本为主导、图像为辅助)与另一派“重图轻文”的模型(如 Tailwind,以首尾帧为基准推演)在技术路线上难以兼容。因此,模型选型不仅是技术问题,更是对内容本质的理解与权衡。

“它是一个概率,它是一个概率决定的东西啊,那它就可以用模型来解决,就是用智能来解决,但前前面是一个百分百概率的。那它一定不能用模型来解决。”

“Sora Two 的生成的整个原理和其他的是不一样的,我们只能另开一条路为 Sora Two 让让路。”

复合型人才:左右脑协同的稀缺资源

构建高效内容生成系统的核心壁垒,不在于模型本身,而在于人——即能否找到并组织一类罕见人才:既懂内容结构、又具技术理解、还保有审美直觉的“三合一”个体。这类人才需将感性认知(如镜头语言、节奏感)拆解为可执行的理性逻辑(如提示词设计、模型参数调优),再通过大量排列组合测试,找到当前场景下的最优解

在实践中,团队常以“技术美术(TA)”为参考模型招募设计师——他们兼具工程思维与艺术感知,但又不拘泥于游戏行业的固定经验。目前核心团队约 4–5 人,由产品与设计师共同构成,前者把控逻辑框架,后者主导效果验证,双方均具备较强的左右脑协同能力。创始人坦言,这类人才“凤毛麟角”,尤其在抖音这类高影响力平台上,即便品牌号召力强,精准匹配仍极难。

“多模它就是要两个半脑要都很发达,对吧?……这类人是呃比较少见的。”

“你熟悉了这一套人力模型之后,你在面试的时候或者是在跟他配合的时候,你已经能 get 到他有没有这方面比较好的潜力。”

从极限运动社区到创作者服务:创业认知的迭代

对比两次创业,创始人指出:第一次创业(2014–2019)更多由热情驱动,虽在极限运动领域积累了丰富内容(如国内首批飞盘赛事、滑板纪录片),却因节奏失衡(过早投入重线下)、认知偏差(误判用户圈层规模)及能力错配(内容强但电商落地难)而受限。当时设备落后、短视频生态未起,导致 App 构想难以落地,最终聚焦内容制作才实现正向运转。

这段经历让他深刻意识到:自己真正擅长的是内容本身,而非运动垂类。因此第二次创业(OiiOii)明确转向“服务于创作者”的通用工具层,依托平台生态,以轻量化、高复用的模型组合赋能内容生产。作为 CEO,他仍深度参与架构设计与最终决策——尤其在模型排列组合的“最优解”判断上,需兼顾技术可行性与内容表现力。

“我退出来的一个很大原因是,我觉得公司它可能能养活自己,但是呢,它长不大……我当时很想去做服务于创作者的事情。”

“我现在回想起来,可能冲动是大于很多能力的储备的吧。”

从热爱出发,却撞上现实的墙

闹闹坦言,自己本质上是一个不惧挑战、乐于尝试新事物的人。从微信产品经理岗位离开后,他并未延续产品路径,而是选择回归内心热爱——动画创作。他学了半年动画,却很快意识到:作为一个习惯于简洁产品逻辑的人,面对Maya、3ds Max这类极其复杂的行业软件,他几乎“抓狂”,工具门槛远超预期。更现实的打击来自行业生态:2014年,他曾在互联网公司拿两万月薪,而动画公司实习却要倒贴钱;一位建模总监工作五年,月薪仅七八千,环境恶劣。这种理想与现实的巨大落差让他清醒——“没办法为热爱牺牲到这个程度”。

“当时我主要是学动画呀,我就真的很喜欢动画……很想从事这种很纯粹的事情,然后又很专注的事情。”

“我好像还是对物质稍微有点需求的啊,在那个时间点。”

尽管如此,他对内容创作的渴望并未消退。他转而选择切入一个当时中国几乎无人涉足的赛道:极限运动视觉内容。他并非深度玩家,只是滑板、滑雪等项目的“泛爱好者”,但正因如此,反而能以 outsider 的视角捕捉圈层精神内核。他受纪录片《半坡山地电影》启发,反问:“老外这么牛的人都可以拍出来纪录片,为什么中国人没人拍呀?”——这种冲动+使命感的混合驱动,让他一头扎进拍摄实践。他从零学摄影、剪辑,靠直觉和热情做出一批高质量内容,在圈内赢得良好口碑,也验证了自己在内容制作上的潜力。

关键转折在于:他意识到,自己真正擅长的不是单点突破,而是‘从负一到零’的系统搭建能力。这段创业经历虽未带来财务回报,却锻造出一种稀缺的底层能力:在不确定性中持续前行的韧性

触底反弹:在焦虑中长出‘精神抗体’

2014–2016年是公司相对高光期,但闹闹却敏锐察觉到“空中楼阁感”:业务看似增长,实则缺乏电商运营、线下活动规模化等关键支撑能力。当行业泡沫破裂时,他的预感“非常准确”,焦虑随之而来。但与其他创业者不同,他并未被击垮——他找到了属于自己的‘着陆与反弹机制’

这个机制并非来自商业策略,而是精神层面的重构:2016年底起,他开始接触佛法、禅修,并找到一位长期导师。他总结道,人之所以焦虑,核心在于对‘无常’的抗拒,以及过度执着于“我”的形象与得失。而禅修让他体验到一种更广阔、更安全的内在状态:“你真正的你是非常宽广的,很广大的,是非常安全的。”

“当你其实就是你会发现,这只是你的一个壳子,就是你你真正的你是非常宽广的,很广大的,是非常安全的。”

“安全感从……甚至它解决了死亡的这种恐惧,那你最本质的死亡的恐惧都已经消散了……创业的这个担忧,它必然在基本上那个大的脚链就已经去掉了。”

这种认知转变带来直接效果:焦虑自然降低,思维从“害怕结果”转向“聚焦动作”——不再反复想象灾难,而是拆解为可执行的小步骤,逐步积累正向反馈。他将此称为“精神抗体”:不是避免问题,而是在问题中保持稳定、理性、行动力的心理系统。这种能力后来成为他重返大厂、主导剪映增长的核心资产——他不再被环境波动裹挟,而是能冷静判断、精准发力

带着‘抗体’重返平台,服务创作者的再出发

离开创业公司后,闹闹选择加入抖音/剪映团队,将此前在内容制作与产品思维上的双重积累,转化为服务创作者的基础设施。他强调,自己作为“产品出身+内容实践者”的复合背景,让他对创作者痛点极为敏感:自己曾运营工作室,深知移动端创作工具的缺失——当时抖音生态已爆发,但缺乏专业、易用的剪辑工具。

他加入剪映时,产品已有500–600万日活,而他主导期间,DAU增长至3600万。这一成绩源于两方面:一是平台红利(抖音与剪映均处高速增长期);二是他系统性补足了团队建设、产品策略与传播落地能力——比如如何筛选人才、如何让产品功能真正契合创作者需求、如何提升工具的传播效率等。他坦言,此时的自己已不再依赖一时冲动,而是带着清晰的方法论与心理韧性,去推动长期价值

他最终确认:创业的终极考验,从来不是‘从零到一’,而是‘从负一到零’的穿越能力。而这段穿越,让他明白——真正的成长,是让精神成为稳定器,而非情绪的奴隶

从剪映到特效:在字节构建技术驱动的内容工具链

在加入剪映时,该产品已拥有500万至600万日活用户(DAU),而作者主导的后半程将其提升至3600万DAU。他自认对剪映的最大贡献并非具体功能开发,而是为组织筛选出最适配的产品人才;另一关键贡献在于打通了抖音投稿、简易模板、特效业务与社区增长之间的逻辑闭环——他亲自负责抖音特效业务,将技术敏感度转化为高频爆款:如全球首款实时变漫画特效、变老/变小/变性别、皮克斯风格滤镜等。他主导建立了一套爆款评估与打爆机制,涵盖从技术调研、上线评估到规模化推广的全流程,显著提升了全球范围内的爆款率。

“它是一个很好的技术,然后变成一个产品让大家用起来,这是我擅长的。”

“大家都在打一个胜仗的那种感觉……组织能力真的很强,部门墙比较弱,目标一致时协同非常迅速。”

作者特别强调字节当时极强的组织协同效率与数据基建能力:平台能基于科学流量策略,精准计算“谁该看到谁用了特效”,从而驱动模仿行为与使用转化。这种以数据为驱动的策略思维让他深度参与算法设计,也意识到此类方法论在创业场景中难以复用。尽管享受这段纯粹的技术产品实践,但后期因组织架构调整,其原有创作者服务方向被拆解——创作者身份日益多元(电商、直播、广告、生活服务等),导致业务分散、人力模型错配,他最终因“责任在撑,而非心流在推”而离开。

转向动画与AI:从B站生态洞察到OiiOii的创业起点

离开字节后,作者短暂调研内容赛道,最终选择加入B站——核心动因是系统性理解中国动画创作者生态与产能瓶颈。他观察到:B站虽拥有高质量创作者与用户,但动画产能严重受限,“被憋着了”的状态在AI时代尤为凸显。他在B站期间已与团队探讨AI动画方向,但受限于技术与资金,未能推进。这段经历让他确认:AI是释放动画产能的关键杠杆,而当前市场亟需一个聚焦动画创作的轻量化工具平台。

“如果我要真的还是很想做动画的话,我对这个大体的市场情况不了解,那肯定是做不了的。”

“产能被憋着了,被阻碍了那个感觉,就是在这个过程里头,其实得到了验证了的。”

基于此,他启动OiiOii项目。当前节奏快于预期:用户反馈倒逼功能上线提前。规划分四阶段推进——① 完善现有音乐类与故事类内容体验(约1个月);② 垂类内容填充(搞笑、MV、科普等,约2–3个月);③ 拓展小B客户(如游戏公司、玩具厂),通过授权IP支持二创与营销传播,实现商业化;④ 海外拓展(暂定1月中下旬启动,需摸索区域内容特质与人群)。他强调,社区建设需以工具为“承接层”,先保障内容可刷、可玩,再通过策划引爆内容实现留存与正向循环——“爆款是新增,留存才是核心”

产品演进:从P端切入,顺势而为拓展B端

OiiOii 闹闹指出,当前产品的核心策略是从P(Professional)人群切入,即专业创作者群体;在此基础上,产品会自然向上延伸,服务于小型漫剧公司等B端客户。她强调,产品开发始终遵循迭代逻辑,而非强行押注某一趋势。例如,尽管今年漫剧赛道异常火热,团队并未盲目将重心转向B端大客户,而是保持观察、顺势而为——只有当市场出现明确的收益信号时,才会考虑组建小团队,针对性开发中大型B端功能。这种策略本质上是生态驱动型决策:先让用户和创作者在生态中自发聚集,再根据真实行为数据判断是否扩大投入。

它其实产品它是一个迭代的过程嘛……我们切的是P这个人群。再往上一点,就是一些小小型漫剧的公司,它就可以用了。

就很多东西,它是在生态里头看到迹象,然后你就顺着这个迹象把它放大就好了。

用户互动:从数据到“活人”,重建产品温度

当前团队的工作重心已显著转向用户反馈的直接处理。闹闹坦言,过去在大厂时,用户常以抽象数据形式存在;而如今,她每天深度参与150个社群(含124个测试群及20+合作群),亲自回复创作者问题——这些社群覆盖微信群、Discord及企业微信渠道。她特别提到,这种高强度互动不仅验证了产品的口碑传播效应(“大家都在口碑宣传,这个本来就是我们的初衷”),更带来了高质量反馈:用户建议多具建设性,而非情绪化攻击。这种“触达真实的人”的体验,被她视为创业早期极具价值的反馈闭环。

用户也质量很好,就是很有建设性的在给我们提建议,而不是……而不是就是谩骂呀或者是什么……我现在在两个群里头在回复创作者的问题……他们跟他们进行互动的感觉还是挺好的,很真实。

裂变机制:平衡增长质量与扩散速度

在邀请码机制上,团队采取了渐进式开放策略:第一阶段仅官方发放;第二阶段允许老用户(需为真实活跃创作者)获得5个邀请名额。为防止因过度裂变导致用户质量稀释,团队设定了明确门槛——用户需完成作品创作并保持活跃(约2–3天),方可解锁邀请资格。这一设计体现了对“真实活跃用户”的重视,而非单纯追求注册量。目前,邀请码仍通过公众号文章等渠道分发,形成“创作者自发传播”的良性循环。