

把创作者经验,做成可交易的AI工作室。
现在做 AI 创作工具出海的团队并不少,但真正同时跑出千万级注册用户和千万级 ARR 的案例,仍然相对有限。
光魔科技算一个。
这家公司 2023 年 9 月在深圳成立,早期那批背后站着 DCM 和百度两家机构。百度那笔是战略融资,直接入了工商股东名单,算是正式押注。
用 AI 做长视频、出海、服务创作者,这个方向,百度看得相当清楚。

网络资料整理,百度2024 AI方向投资
光魔科技旗下目前跑通了两款产品,分别是白日梦 AI 面向国内创作者,MagicLight 瞄准海外市场。两款产品本质上是同一套能力,一个服务国内,一个服务全球。
最近,他们又在做第三件事。叫 Octask,目前在招募第一批超级创作者内测。
定位明确,给创作者一套从文字到视频的完整工作流,把以前要跨多个工具手动串联的步骤,全部压缩进一个平台。

输入标题和故事文案,选择视频风格,平台自动生成分镜草图和图片,再配上 AI 旁白配音,最后输出成片。PC 网页端、小程序、iOS 和安卓 APP 都支持,多端账号同步。
视频风格选项覆盖新国漫国风、赛博朋克、鬼故事、日式可爱等多个方向,网页版文案最高支持 1500 字,生成视频最长可达 6 分钟。
对于做连载故事、小说推文、儿童绘本这类需要跨场景保持人物形象统一的内容,人物和场景的一致性是白日梦 AI 的核心能力之一。

MagicLight 是白日梦AI的海外版本,面向全球内容创作者,长视频能力进一步拉伸。
视频最高支持生成 50 分钟,集成了各最新的大语言模型和视频模型来进行负责故事拆解和脚本生成,支持多种动画生成引擎,不同场景可以调用不同的工具。创作者可以自定义角色,上传面部和服装参考图训练专属形象,全程保持一致性。
创作流程分四条主线:故事转视频、儿童绘本、一键生成、音乐可视化视频。用得最多的是故事转视频,操作路径是输入故事大纲,平台用 AI 自动展开成完整叙事结构,拆成场景和分镜,创作者逐段审核,可以随时增删镜头、修改台词、合并片段。
之后进入角色设计阶段,可以从角色库直接选,也可以自己从头造一个,调整外形和风格;再到分镜生成,AI 实时保持跨镜头的角色和场景一致性,如果某一帧不满意,可以重写提示词重新出图,也可以用生图模型精确改动,比如单独修改某个角色的服装。
镜头配音支持多种男女声选择,或者用声音克隆功能录入自己的声线。静态分镜确认后动画化,推荐逐镜单独处理,质量更可控。最后叠加字幕和背景音乐,导出即成片。

目前产品在持续扩展垂类。儿童故事动画、科普知识视频、儿歌之外,已经上线了宗教类长视频模块,后续还会继续往更多方向走。
背后团队和创始人
CEO 王烨鑫(Yexin Wang),北京大学计算机本硕,职业路径是 Google AI → 腾讯 PCG → 创业,走的是工程与研究结合的路线。
离开 Google 后加入腾讯 PCG,在腾讯视频 AI 技术中心(ARC Lab)做到负责人,这也是他产出最密集的阶段。

研究方向集中在视频理解、多模态内容 grounding、检索系统和模型兼容升级几个方向,论文以工业落地型为主,合作发表于 KDD、ACM MM、IJCAI、ICLR、AAAI 等顶会。
专利方面,腾讯时期积累了多项 AI 视频相关发明,包括已公开的 Deep learning-based video editing method(US20230049135A1),涉及对象属性识别和智能选片,以及视频内容检索、特征提取模型升级、多模态理解等方向的多项合作专利。

2023 年出来创业。今年 5 月初,他受邀作为主旨演讲嘉宾出席了 Stripe 和 Eminence Ventures 在湾区联合主办的 Meetup,主题是"什么让一家全球 AI 公司值得投资",同台的还有 Stripe 的 Ariel Lim 等人。
联合创始人 Lei Zhang,北京大学计算机本硕,本科 2000 年入学,硕士 2007 年毕业,是团队里学术背景最扎实的工程师之一。
毕业后他在互联网和流媒体大厂里走了一条很深的技术路线。先后经历了 迅雷、Yahoo! Inc.、FreeWheel、Hulu,最后在 Disney Streaming 担任 Senior Principal Engineer,前后在 Hulu 和 Disney Streaming 合计深耕超过四年。
技术栈覆盖 Hadoop、C++、Shell 脚本、在线广告系统、敏捷项目管理等方向,是真正在工业级系统里打磨过的架构师。

产品增长方向由 马兴泓(Xinghong Ma) 负责,USC 和 UC Berkeley 背景,他曾在 Insta360 影石科技主导AI 全景剪辑功能的设计,负责大模型视频内容理解升级和 AI 剪辑交互链路优化,是真正做过 AI 产品落地的人。
在高榕资本做 AI 产品投研实习期间,跟过 Leonardo AI、Lovart(Liblib)、Lepton AI 等项目,对 AIGC 赛道的产品逻辑和市场格局有自己的判断。
增长侧,他曾担任「小火车商业进化论」播客的内容增长负责人,从 0 到 1 把账号做到 30 万粉,他的方法论很清晰,播客和内容输出是 AI 产品增长的核心路径,这也是他一直在亲身实践的事。

他对 AI 的理解浓缩成一句话:AI - Context Not Control。底层思考和判断力留给自己,执行交给 Agent。
核心团队还有来自快手的成员,负责增长方向的 Lucas Ming 等。公司愿景是"让每个脑洞都被看见",从白日梦AI到 MagicLight,这条线一直没有偏。
MagicLight 是个高效的视频 Agent,给它一个提示词,它按既定框架跑出视频,质量稳,效率高。
但创作者真正在意的东西,比自己的风格、审美偏好、表达方式和创作方法论,这些东西 MagicLight 装不下。
用它的创作者越来越多,但他们的需求也越来越明确,想要更高的自由度,想要更多正反馈,想要真正意义上的变现机会。
于是他们花了半年做了 Octask,在各个社交媒体的简介中都是定位为"全球首个 AI 内容工作室社区"。

相比之下,逻辑换了个方向。MagicLight 是给你一个工具,Octask 是让你开一家自己的内容公司。
用团队自己描述 Octask 的方式来说,给任务、建团队、搭工作流,然后让这支 AI 团队替你跑。

他们甚至直接用 Octask 制作了产品介绍视频,让产品自己介绍自己,用的是三国人物做意象,张飞通过 Octask 学习了李白的讲故事技能,这个思路贯穿了整个产品设计。
创作者在平台上可以"招募"一支团队:选题研究员负责追踪热点和筛选潜力选题;文案写手模仿用户的写作风格输出长文,能一次起十几个标题;图片生成师自动产出封面和配图;
视频脚本策划根据热点写口播脚本;排版助理和数据复盘员负责格式修订和发布后的数据分析。做的不只是自媒体,广告、短剧、社媒内容都能走这套流程。

每个数字员工的干活能力,来自真实创作者在平台上上传的 Skill。用户也可以自己创建员工,把自己的 Skill 赋予它。
员工是"养成系"的。用得越久,Octask 越了解你的内容偏好、视觉审美和工作习惯,会自动沉淀出可复用的 Skill 模块,比如你惯用的改标题方式会变成"标题优化.Skill",常用的视觉风格会变成"视觉风格生成 Skill",下次直接调用。
Octask 做了一个"实时员工地图",可视化地显示此刻每个数字员工的状态,选题研究员正在研究中、文案写手待命中、图片生成师生图中。整个内容生产过程从黑盒变成了一条看得见的流水线。

Octask 还内置了一个交易市场,两种玩法,一种是把自己搭好的工作室或数字员工上架,让其他创作者或企业付费使用,经验变成持续带来收益的产品。
另一种是带着 AI 团队去任务中心接单,有人发需求,你的团队直接接,完成交付拿报酬。
一个人的经验,变成了可以独立运转的团队,然后对外提供服务。这是 Octask 想让创作者实现的事。

目前开启了第一批超级创作者内测,招募 1000 位 AI Boss。进场方式不是直接申请邀请码,是先做一道"Boss Personality Diagnosis"测试(共有14中人格),问的是真实的管理和创作直觉,答完提交 waitlist 候选。
内测期间可以免费使用 GPT 5.5、Claude Opus 4.7、GPT Image 2、Seedance 2.0 等高级模型,另有其他创作者激励。

带着真实经验搭建的 AI 员工或工作室通过审核后,可以直接获得现金奖励;上架交易市场后被其他用户使用,还能拿到长期持续收益。
申请地址:https://octask.ai
关于 Octask 目前的能力边界,团队表示,现阶段主要覆盖内容创作场景,文案、生图、剪辑这条链路可以全自动化跑通,直接产出可上传的成品。暂时还不支持直接操控网页或本地客户端,但后续会逐步迭代,加入浏览器操作、coding、本地编辑等更多场景。





夜雨聆风