以下信息截至2026‑03‑24,并在文末列入了近期新模型的促销(薅羊毛指南),关注公众号后在对话处回复”报告“,即可下载PDF版。
一、AI 产业新闻与动态
1. 美国及全球
时间/地区 | 主要参与方 | 动态与关键细节 | 影响与意义 |
2026‑03‑24,美国 | OpenAI | 路透社报道,OpenAI 突然取消了其视频生成工具Sora,并终止与迪士尼的10 亿美元合作协议。Sora 运行成本高昂并拖累了其他团队。OpenAI 表示将重点转向盈利性更高的编码工具、企业客户、机器人和通用人工智能(AGI)。Sora 团队在X 平台称,会提供应用和API 关闭细节并保留用户作品[1][2]。 | Sora 下线意味着视频生成业务暂时停滞,但反映了OpenAI 将资源集中在更盈利的编码和企业市场。 |
2026‑03‑24,美国 | Arm Holdings | Arm 在GTC 大会推出了AGI CPU——面向数据中心的AI 芯片,用于"agentic" AI 任务(代用户执行复杂任务)。AGI CPU 采用台积电3 nm 制程,由包括Meta、OpenAI、Cloudflare、SAP 和SK Telecom 在内的客户试用,预计五年内带来约150 亿美元年收入[3]。 | 新芯片瞄准大模型推理和代理型应用,可显著提升大型AI 模型执行效率,预示硬件行业争夺AI 推理市场。 |
2026‑03‑13 – 03‑28,美国 | Anthropic | Claude 团队推出使用量翻倍促销,在3 月 13 日至 28 日的工作日非高峰时段(8 AM–2 PM ET / 5 AM–11 AM PT / 12–6 PM GMT 之外)将5 小时配额翻倍,适用于Free、Pro、Max、Team等计划,企业版除外[4]。无需操作即可自动增加使用量,额外使用量不计入每周限额[5]。 | 短期促销鼓励在非高峰时段使用Claude,提高模型利用率。用户可以在周末或工作日早晚体验更多调用次数。 |
2026‑02‑27,美国 | Perplexity AI | TechCrunch 报道,Perplexity 推出付费订阅工具Computer(月费 200 美元),整合19 个AI 模型并在云端创建子代理来处理复杂任务,如检索统计数据、法律信息、生成网站和可视化。它面对高端企业客户,强调安全性和工作流自动化[6]。 | 代表生成式搜索公司向高端决策市场扩展,突出“多模型集成+代理”的趋势。 |
2026‑03‑05,美国 | Luma AI | Luma AI 推出“Luma Agents”,由新一代Uni‑1模型驱动,可生成文本、图像、视频和音频并协调多个外部模型(Ray 3.14、Veo 3 等),在营销和创意产业中实现端到端工作流程[7]。 | 多模态代理可一次性完成创意方案策划、内容生成与迭代,标志着创意行业向智能代理平台迈进。 |
2026‑03‑11,美国 | NVIDIA | VentureBeat 报道,NVIDIA 发布Nemotron 3 Super,一款120 亿参数的混合模型,采用Hybrid Mamba‑Transformer骨干以及Latent Mixture‑of‑Experts (LatentMoE)设计,可维护100 万词的长上下文,并通过“专家压缩”提高效率[8]。模型使用NVFP4 4 bit量化并针对Blackwell GPU 优化,实现推理速度提升 4 倍[9]。 | Nemotron 3 Super 公布权重,可商业使用,为处理长链路任务或多代理工作流提供高效模型。它的1 M token 上下文适合代码搜索和长文档分析。 |
2026‑03‑16,美国 | NVIDIA | NVIDIA 发新闻稿宣布扩展开源模型家族,推出Nemotron 3 Ultra、Omni、VoiceChat等多模态模型,以及面向物理AI 的Cosmos 3世界模型、用于人形机器人的Isaac GR00T N1.7和自动驾驶模型Alpamayo 1.5[10]。另外宣布生命科学模型Proteina‑Complexa和数百万条人工预测蛋白质复合体数据集[11]。这些开源模型在GitHub、Hugging Face 和 NIM 服务中可用[12]。 | NVIDIA 从硬件供应商逐渐转型为开源模型提供者,覆盖语言、视觉、语音、机器人和生命科学,为开发者提供可自行部署或微服务调用的模型库。 |
2026‑03‑17,美国(法国公司) | Mistral AI | TechCrunch 报道,Mistral 推出企业平台Mistral Forge,允许企业用自有数据从零训练定制模型;同时发布Mistral Small 4。Small 4 是混合型模型,拥有119 B 总参数,6.5 B 活跃参数,采用128 专家MoE 架构,提供256 k上下文,并能在速度与深度推理间调节[13][14]。Small 4 可接受文本与图像输入,允许设置reasoning_effort来控制推理深度[15]。模型基于Apache 2.0 许可开放[16]。 | Mistral Small 4 统一“指令、推理、代码”能力,推动混合模型成为企业通用引擎。Mistral Forge 则意在帮助企业建立“自主专属模型”。 |
2025‑12 (补充) | Mistral AI | 早前报道的Mistral Large 3采用“颗粒度MoE”架构,活跃参数 41 B,总参数 675 B,拥有256 k上下文[17]。同时推出Ministral 3系列14 B/8 B/3 B 小模型(Base/Instruct/Reasoning),支持128 k–256 k 上下文,并可在一张GPU 上运行[18]。 | 虽是2025 年底发布,但其开放权重、小而高效的设计为2026 年的开源浪潮奠定基础。 |
2026‑03‑11,美国学生计划 | “Gemini for Students” 页面显示,注册学生仍可获得1 个月的Google AI Pro 试用,包括访问Gemini 3.1 Pro 模型、无限图片上传、Nano Banana Pro 级别图像生成和2 TB 存储[19]。先前为学生提供的延长优惠已于3 月 11 日结束,但1 个月试用仍可参与[20]。 | 学生可在试用期间体验Gemini 3.1 Pro,与Nano Banana Pro 等模型进行图像生成。 |
2. 中国
时间/地区 | 主要参与方 | 动态与关键细节 | 影响与意义 |
2026‑03‑17,中国 | 阿里巴巴 | 路透评论称阿里巴巴将AI 业务从云部门独立出来,成立阿里Token Hub 业务群。该集团关注“Token 消耗”模式——用户通过类似OpenClaw 的AI 代理消费代币来执行任务。MiniMax 的低成本模型在半年的代币消费增长六倍,营收翻番,显示用户愿意为代币支付[21][22]。 | 阿里将从“提供整体解决方案”转向出售代币与代理服务,形成新的盈利模式。 |
2026‑03‑18,中国 | 百度 | Baidu 发布OpenClaw “龙虾”代理系列,包括桌面版DuMate、移动版RedClaw、云端DuClaw以及接入小度智能音箱的家庭端[23]。这些代理可跨应用、跨设备完成多步任务,如制作PPT、剪辑视频或点咖啡。 | 百度计划将代理作为操作系统级能力,助力个人和企业自动化复杂工作流。 |
2026‑03‑18,中国 | 地方政府/ OpenClaw | 路透社报道,深圳龙岗、无锡、合肥、苏州等地发布政策,提供最高1,000 万元人民币补贴,扶持基于OpenClaw的创业者和初创企业,并设立AI 合规中心;监管部门同时要求云平台限制代理访问敏感目录等[24]。 | 地方政府既积极推广代理技术以刺激经济,又加强数据安全监管,体现机遇与风险并存。 |
2026‑02‑12,中国 | ByteDance | Reuters 报道,字节跳动发布视频生成模型Seedance 2.0,可处理文本、图像、音频和视频,面向影视、电商和广告领域[25]。该模型在微博上因能生成复杂剧情而走红,甚至获得埃隆·马斯克在X 上的称赞[26]。然而因版权纠纷,字节跳动已于3 月 14 日暂停全球发布[27]。 | Seedance 2.0 被视为视频领域的“DeepSeek 时刻”,但版权风险显示生成式视频需要慎重处理。 |
2026‑03‑11,中国 | 小米 | 路透社披露,一款在OpenRouter 平台匿名发布的模型Hunter Alpha实际上是小米的旗舰模型MiMo‑V2‑Pro。该模型具备100 万token上下文,面向AI 代理,向全球开发者提供一周免费体验[28]。 | 小米首次将开源模型定位为AI 代理“大脑”,免费试用吸引开发者快速检验性能。 |
2026‑03‑13,中国 | OpenClaw 社区(第三方社区) | OpenClaw 更新版本 2026.1.30,支持终端自动补全,并提供对Kimi K2.5和Kimi Coding模型的免费访问,方便用户在本地运行AI 代理而无需外部API 费用[29]。更新还改进了Telegram 集成和MiniMax OAuth,推送社区安全补丁。 | 免费开放的Kimi K2.5、Kimi Coding 为编码学习者提供了强大的实践机会;终端补全提升了开发者体验。 |
2026‑02‑12,中国 | Reuters 调研 | 一年后,DeepSeek 冲击仍在持续,Reuters 报道称DeepSeek、阿里巴巴、字节跳动等准备在春节期间推出新模型,延续低成本、开源策略;开放模型使中国公司能降低成本并加快开发[30]。 | 预计中国厂商将陆续推出低价或免费的大模型,与DeepSeek R1 一样吸引全球用户。 |
2026‑02‑12,中国 | DeepSeek | Reuters 报道,DeepSeek R1 引发全球关注后,更多美国初创公司开始使用中国开源模型。美国顾问机构指出,中国开源模型在Hugging Face 和OpenRouter 上占据使用排行榜,80% 的美国初创公司使用这些模型,DeepSeek R1的下载量甚至超过ChatGPT,在App Store 上排名第一,阿里巴巴的Qwen 系列下载量超过Meta Llama 系列[31]。 | 中国模型凭借免费或低价策略快速渗透美国市场,推动开源生态发展并形成竞争压力。 |
二、新模型与促销活动总览
下表列出了最近值得关注的模型及其免费试用或优惠信息(仅列举关键参数,表格中尽量使用短语或数字;详细介绍见正文):
模型/平台 | 重要特点(简要) | 免费/优惠信息 | 接入途径 |
Mistral Small 4 (3/16/2026) | 119 B 总参数、6.5 B 活跃参数;128 专家 MoE 架构;256 k 上下文;文本+图像输入;支持调节推理力度[13][15] | 开源Apache 2.0 许可,可自行托管或通过Mistral API 调用;没有硬性费用,但商业托管需支付API 使用费 | 在Mistral AI Studio 或Hugging Face 获取权重;企业可使用Mistral Forge 定制模型 |
Mistral Large 3 / Ministral 3 (2025‑12) | 大模型:675 B 参数、41 B 活跃、256 k 上下文[17];小模型:14 B/8 B/3 B 版本,支持128 k–256 k 上下文,可在一张GPU 上运行[18] | 全部开源,无许可费用;可在本地或云上部署 | 可从Hugging Face、GitHub 获取权重;Mistral Studio 提供API 服务 |
Nemotron 3 Super (3/11/2026) | 120 B 参数;Hybrid Mamba‑Transformer 骨干;Latent MoE 设计;支持1 M token上下文;多Token 预测加速[8] | NIM API 与Hugging Face 提供免费访问(OpenRouter 页面标示每百万输入/输出token 费用为$0)[32] | 在OpenRouter 或NVIDIA NIM 平台注册,选择Nemotron 3 Super 免费模型;也可通过vLLM/llama.cpp 本地部署 |
StepFun Step 3.5 Flash (2026) | 混合专家结构,256 k 上下文;面向通用对话和长文档;号称在多数基准上优于Llama 2/3 | OpenRouter 标示完全免费[32] | 通过OpenRouter API 调用;需要在平台注册获得API Key |
Arcee Trinity Large Preview / Trinity Mini | Trinity Large: 400 B MoE 模型,512 k 上下文;Trinity Mini: 13 B 模型;支持编码、角色扮演等[33] | OpenRouter 提供免费试用(每百万token 费用为 $0) | 在OpenRouter API 选择相应模型;适合体验超长上下文与多样任务 |
Z.ai GLM 4.5 Air | 91 B 混合模型,256 k 上下文;支持开源协议;定位通用对话、工具调用[33] | OpenRouter 列为免费;无输入输出费用 | 在OpenRouter 注册并调用 |
Kimi K2.5 / Kimi Coding | MiniMax/Ant Ling 系列编码模型;专长代码生成与调试 | OpenClaw 2026.1.30 更新提供免费访问,无需外部API 费用[29];时间限制取决于社区更新 | 使用OpenClaw 命令行工具或Telegram 机器人连接,自行设置本地代理 |
MiMo‑V2‑Pro (Hunter Alpha) | 小米旗舰模型;约1 M token 上下文;设计为AI 代理的大脑[28] | 发布初期(3/11/2026 起)对全球开发者免费试用一周[28] | 在OpenRouter 搜索“MiMo‑V2‑Pro” 或登录Mi AI 开发者平台领取试用码 |
Claude March 2026 促销 | Doubao (Free/Pro/Max/Team) 用户在非高峰时段获得2× 使用配额[4] | 促销期间为2026‑03‑13 至 03‑28,企业版无此优惠,额外使用量不计入周限额[4] | 用户无需任何操作,促销自动生效;在Claude 网页版、桌面版和Claude Code 等均可享受 |
Gemini 3.1 Pro 学生试用 | 谷歌的Gemini Pro 模型,支持图像上传与高级生成;包含2 TB 存储[19] | 学生注册可获得1 个月免费试用(需绑定支付方式)[20] | 在Google Workspace for Education 账号内注册,使用Gemini Pro 服务;试用结束前取消可避免收费 |
Seedance 2.0 (ByteDance) | 文本‑图像‑音频‑视频统一模型,用于视频生成[25] | 2 月发布时在中国社交平台迅速走红,但3 月 14 日因版权争议暂停全球发布[27];未来推广未定 | 若重新上线,可通过字节跳动旗下Doubao 或广告平台申请使用;目前建议关注版权合规 |
Cosmos 3、Isaac GR00T N1.7、Alpamayo 1.5 | NVIDIA 发布的物理AI 模型:Cosmos 3 用于仿真世界模型,GR00T N1.7 面向人形机器人,Alpamayo 1.5 改进自动驾驶感知与导航[34] | 均开放权重并通过NIM 微服务提供测试;企业可申请试用 | 通过GitHub、Hugging Face 或NVIDIA NIM Platform 下载或调用;需具备GPU 环境 |
三、推荐尝试的模型与建议
以下建议基于促销信息和模型特性,为希望提升AI 技能的用户提供一些试用方向。
1.编程与推理能力
2.Mistral Small 4:该模型结合指令、推理与编码功能,可在本地或云端部署,适合编写代码、调试和深入逻辑推理。其开放权重和256 k 上下文能处理大型项目。
3.Kimi Coding / Kimi K2.5:在OpenClaw 平台免费使用,擅长代码生成和解释,适合学习代码代理的工作方式。
- Nemotron 3 Super:长达1 M token 上下文和高吞吐量使其成为探索长链路推理、跨文档分析的理想模型。通过OpenRouter 免费体验。
- 多模态与创意生成
6.Luma Agents:集成Uni‑1 模型及多种外部模型,支持文本、图片、视频、音频的规划与生成,适合广告、营销和创意团队体验代理式创作。
7.Seedance 2.0(待恢复):若视频生成工具重新上线,可测试其将文本转化为视频的能力,同时注意版权风险。
- Gemini 3.1 Pro 试用:学生可利用试用期体验图像上传和高级图像生成,了解Google 大模型的视觉能力。
- 长文本与文档分析
10.MiMo‑V2‑Pro:一百万词上下文窗口非常适合跨文档、跨任务的AI 代理实验,试用期内可评估其稳定性和推理深度。
11.StepFun Step 3.5 Flash / Trinity Large:这些开源模型在OpenRouter 免费提供,拥有较长上下文和混合专家结构,适合对比不同开源模型的表现。
- Mistral Large 3 / Ministral 3:虽然已发布一段时间,但其小型版本能够在单卡上运行,适合个人学习混合模型架构与低成本部署。
- AI 代理与工具调用
14.OpenClaw 平台与Baidu “龙虾”代理:可体验端到端的多步骤任务自动化,如生成PPT、剪辑视频或跨设备下单。通过小度智能音箱、移动端或桌面端使用。
15.Perplexity Computer:付费订阅可尝试19 模型组合执行复杂调研和文档生成,对于需要快速编写报告的专业人士有帮助。
16.Anthropic Claude 促销:在非高峰时段免费翻倍使用配额,适合短时间内集中训练交互技巧和探索Claude 的编程模式。
四、结论
2026年初至3 月中旬,AI 行业呈现以下趋势:
·代理化、长上下文和多模态:无论是Mistral Small 4、Nemotron 3 Super,还是小米 MiMo‑V2‑Pro,都强调混合专家架构、超长上下文和代理执行能力;NVIDIA 在语言、机器人和医疗领域推出的开源模型也体现“理解+行动”一体化。
·开源与低价策略:中国公司通过低成本或免费开放模型(DeepSeek R1、阿里Qwen、MiniMax Kimi 等)迅速抢占市场,U.S. 初创企业80% 使用中国开源模型[31]。这种“免费+开源”模式迫使美国公司调整策略,如OpenAI 降价、Anthropic 提供使用量翻倍促销。
·监管与合规挑战:字节跳动Seedance 2.0 因版权争议暂缓全球发布[27];地方政府在推广代理的同时强调数据安全和敏感目录限制[24]。随着模型能力增强,版权、隐私与伦理问题愈加突出。
对于个人学习者和开发者,利用各类促销活动(例如Claude 使用量翻倍、OpenClaw 免费模型、MiMo‑V2‑Pro 试用)可以在低成本甚至零成本下体验最前沿的模型和代理技术;同时需要关注官方公告和合规要求,合理使用免费资源,避免使用未经授权的数据或侵犯版权。
[1][2]OpenAI drops AI video tool Sora, startling Disney, sources say | Reuters
https://www.reuters.com/technology/openai-set-discontinue-sora-video-platform-app-wsj-reports-2026-03-24/
[3]Arm unveils new AI chip, expects it to add billions in annual revenue | Reuters
https://www.reuters.com/business/media-telecom/arm-unveils-new-ai-chip-expects-it-add-billions-annual-revenue-2026-03-24/
[4][5]Claude March 2026 usage promotion | Claude Help Center
https://support.claude.com/en/articles/14063676-claude-march-2026-usage-promotion
[6]Perplexity's new Computer is another bet that users need many AI models | TechCrunch
https://techcrunch.com/2026/02/27/perplexitys-new-computer-is-another-bet-that-users-need-many-ai-models/
[7]Luma launches creative AI agents powered by its new ‘Unified Intelligence’ models | TechCrunch
https://techcrunch.com/2026/03/05/exclusive-luma-launches-creative-ai-agents-powered-by-its-new-unified-intelligence-models/
[8][9]Nvidia's new open weights Nemotron 3 super combines three different architectures to beat gpt-oss and Qwen in throughput | VentureBeat
https://venturebeat.com/technology/nvidias-new-open-weights-nemotron-3-super-combines-three-different
[10][11][12][34] NVIDIA Corporation - NVIDIA Expands Open Model Families to Power the Next Wave of Agentic, Physical and Healthcare AI
https://investor.nvidia.com/news/press-release-details/2026/NVIDIA-Expands-Open-Model-Families-to-Power-the-Next-Wave-of-Agentic-Physical-and-Healthcare-AI/default.aspx
[13][14][15][16]Introducing Mistral Small 4 | Mistral AI
https://mistral.ai/news/mistral-small-4
[17][18]Mistral closes in on Big AI rivals with new open-weight frontier and small models | TechCrunch
https://techcrunch.com/2025/12/02/mistral-closes-in-on-big-ai-rivals-with-mistral-3-open-weight-frontier-and-small-models/
[19][20]Gemini for Students — your AI study buddy from Google
https://gemini.google/students/
[21][22]Alibaba shakeup hints at an AI business model | Reuters
https://www.reuters.com/commentary/breakingviews/alibaba-shakeup-hints-an-ai-business-model-2026-03-17/
[23]Baidu joins China's OpenClaw frenzy with new AI agents | Reuters
https://www.reuters.com/business/media-telecom/baidu-joins-chinas-openclaw-frenzy-with-new-ai-agents-2026-03-17/
[24]Chinese tech hubs promote OpenClaw AI agent despite security warnings | Reuters
https://www.reuters.com/world/asia-pacific/chinas-shenzhen-backs-openclaw-ai-with-subsidies-despite-beijings-security-2026-03-09/
[25][26]ByteDance's new AI video model goes viral as China looks for second DeepSeek moment | Reuters
https://www.reuters.com/business/media-telecom/bytedances-new-ai-video-model-goes-viral-china-looks-second-deepseek-moment-2026-02-12/
[27]ByteDance suspends launch of video AI model after copyright disputes, The Information reports | Reuters
https://www.reuters.com/technology/bytedance-suspends-launch-video-ai-model-after-copyright-disputes-information-2026-03-14/
[28]Mystery AI model revealed to be Xiaomi's following suspicions it was DeepSeek V4 | Reuters
https://www.reuters.com/business/media-telecom/mystery-ai-model-has-developers-buzzing-is-this-deepseeks-latest-blockbuster-2026-03-18/
[29]OpenClaw 2026.1.30 Adds Free AI Model Access and Shell Completion | OpenClaw | Create With
https://www.createwith.com/tool/openclaw/updates/openclaw-2026130-adds-free-ai-model-access-and-shell-completion
[30]A year on from DeepSeek shock, get set for flurry of low-cost Chinese AI models | Reuters
https://www.reuters.com/world/china/year-deepseek-shock-get-set-flurry-low-cost-chinese-ai-models-2026-02-12/
[31]China's open-source dominance threatens US AI lead, US advisory body warns | Reuters
https://www.reuters.com/business/autos-transportation/chinas-open-source-dominance-threatens-us-ai-lead-us-advisory-body-warns-2026-03-23/
[32][33]Free AI Models on OpenRouter | OpenRouter
https://openrouter.ai/collections/free-models
夜雨聆风