一、国内视频生成模型热点 🔥
即梦AI(字节)|Octo发布 - 协作创作新范式
4月10日重磅更新:即梦发布首个协作型叙事创作工具 Octo(小章鱼),首创 "VibeCreate" 创作模式。
核心突破:不再单向指令,而是同屏共创的创意合伙人,支持对话+多模态混合交互 可直接在屏幕上圈选、涂抹、上传参考图,AI实时感知意图 深度联动即梦底层模型,覆盖故事大纲→角色/场景资产→分镜→短片全流程 内置智能Agent,能"看懂"当前操作状态,自动推荐符合角色的动作/台词建议
即梦Seedance 2.0:正式发布,DiT-MoE混合架构,18B参数,支持9图+3视频+3音频多模态输入,最多12个素材;运镜复刻误差<3°;支持最长15秒/2K视频生成。
可灵AI(快手)|3.0全面开放API
可灵AI 3.0系列现已全面开放API,All-in-One模型体系:
- 可灵视频3.0/3.0 Omni:支持最长15秒连续生成,最多6个镜头分镜,原生音画同出
- 可灵图片3.0/3.0 Omni:叙事感强化,支持分镜组图生成,直出2K/4K超高清
支持多语种(中文/英文/日语/韩语/西班牙语)及方言口音 面部一致性大幅提升,支持3人对话场景
阿里Wan 2.7(通义万象)|全新视频生成模型发布
2026年4月最新发布:
全模态输入视频创作大模型,支持720p/1080p输出 生成时长2-15秒任意选择,数十种运镜+40+种表情 目前可在通义万相官网免费体验
国内视频生成工具全景对比
| 限时免费不限次 | |||
| 免费体验 | |||
| 开源可本地部署 | |||
| 开源轻量、低门槛 |
二、AI行业动态
🚀 大模型迭代加速
GPT-6定档4月14日发布
内部代号"Spud(土豆)",预训练已于3月17日完成 - 性能较GPT-5.4提升40%,上下文窗口从128K→
原生多模态:统一架构支持文本、音频、图像、视频
定价:输入$2/百万Token,输出$12/百万Token OpenAI已更名为"AGI Deployment",全力押注AGI
谷歌Gemma 4全面开源
- 4月2日发布,采用Apache 2.0许可证,彻底放开商用限制
最小模型仅1.5GB,支持安卓离线运行 AIME 2026数学竞赛准确率89.2%,26B MoE模型推理速度达4B级别
阿里通义千问|一周三款模型,调用量登顶全球
- Qwen3.5-Omni(3.30):215项音视频任务SOTA,超越Gemini-3.1 Pro
- Wan2.7-Image(4.1):图像生成统一模型,主打"活人感"
- Qwen3.6-Plus(4.2):日调用量突破1.4万亿Token,登顶OpenRouter日榜榜首
DeepSeek-V4预计4月发布
已完成适配华为昇腾950 Pro,推理速度提升35倍,能耗降低40% 阿里、字节、腾讯等已向华为预订45万颗昇腾芯片
💰 AI行业融资与资本动向
Anthropic年收入首超OpenAI
年化收入突破300亿美元(OpenAI为250亿美元) 获G轮融资300亿美元,投后估值3800亿美元 与CoreWeave达成多年期算力合作
千寻智能|30天融资30亿,雷军+马云联手
30天内完成两轮融资累计30亿元
顺为资本(雷军)、云锋基金(马云)联合领投 Spirit v1.5模型RoboChallenge评测全球第一(超越美国Pi0.5) 已与京东(机器人咖啡制作)、宁德时代(人形具身智能产线)合作落地
中国具身智能Q1融资超200亿
季度披露融资超50起,累计200亿元,同比增长近60% 银河通用:25亿融资,估值超200亿(国家队重仓) 星海图:20亿融资,一个多月估值翻倍 众擎机器人:2亿美元B轮,估值破百亿
🛠️ AI工具与产品动态
AI编程工具三强格局定型
| Claude Code | 80.8% | |
竞争核心已从"代码补全"转向"任务自主规划和执行"。
OpenClaw开源智能体爆火
GitHub星标突破28万(最新数据) 可代替用户执行任务的自主AI虚拟助理 支持直接操作系统文件、进程、应用,通过WhatsApp/Telegram下达指令
英伟达GTC 2026发布
- Nemotron 3系列:全面扩展开源模型家族
- Cosmos 3:统一合成世界生成与动作仿真
- NemoClaw智能体平台:一条命令部署AI代理
📊 市场数据速览
- 全球AI市场规模:Q1达1.2万亿美元,同比增长67%
- 中国大模型周调用量:12.96万亿Token(是美国3.03万亿的4.27倍)
- OpenAI完成1220亿美元融资,估值8520亿美元,刷新人类商业史单笔私募融资纪录
Meta追加CoreWeave订单210亿美元,总额达352亿美元(合作至2032年)
📌 今日要点总结
- 即梦Octo发布:开创"VibeCreate"协作创作模式,AI从"执行者"变"创意合伙人"
- GPT-6倒计时:4月14日发布,200万Token上下文+40%性能提升
- 阿里千问爆发:一周三款模型,调用量登顶全球
- 具身智能融资热:Q1国内融资200亿,雷军+马云联手押注
- 开源生态活跃:Gemma 4全面开源,DeepSeek-V4适配华为昇腾
夜雨聆风