【报告下载】近期中美AI 行业动态与促销活动一览

以下信息截至2026‑03‑24，并在文末列入了近期新模型的促销（薅羊毛指南），关注公众号后在对话处回复”报告“，即可下载PDF版。

一、AI 产业新闻与动态

1. 美国及全球

时间/地区	主要参与方	动态与关键细节	影响与意义
2026‑03‑24，美国	OpenAI	路透社报道，OpenAI 突然取消了其视频生成工具Sora，并终止与迪士尼的10 亿美元合作协议。Sora 运行成本高昂并拖累了其他团队。OpenAI 表示将重点转向盈利性更高的编码工具、企业客户、机器人和通用人工智能（AGI）。Sora 团队在X 平台称，会提供应用和API 关闭细节并保留用户作品[1][2]。	Sora 下线意味着视频生成业务暂时停滞，但反映了OpenAI 将资源集中在更盈利的编码和企业市场。
2026‑03‑24，美国	Arm Holdings	Arm 在GTC 大会推出了AGI CPU——面向数据中心的AI 芯片，用于"agentic" AI 任务（代用户执行复杂任务）。AGI CPU 采用台积电3 nm 制程，由包括Meta、OpenAI、Cloudflare、SAP 和SK Telecom 在内的客户试用，预计五年内带来约150 亿美元年收入[3]。	新芯片瞄准大模型推理和代理型应用，可显著提升大型AI 模型执行效率，预示硬件行业争夺AI 推理市场。
2026‑03‑13 – 03‑28，美国	Anthropic	Claude 团队推出使用量翻倍促销，在3 月 13 日至 28 日的工作日非高峰时段（8 AM–2 PM ET / 5 AM–11 AM PT / 12–6 PM GMT 之外）将5 小时配额翻倍，适用于Free、Pro、Max、Team等计划，企业版除外[4]。无需操作即可自动增加使用量，额外使用量不计入每周限额[5]。	短期促销鼓励在非高峰时段使用Claude，提高模型利用率。用户可以在周末或工作日早晚体验更多调用次数。
2026‑02‑27，美国	Perplexity AI	TechCrunch 报道，Perplexity 推出付费订阅工具Computer（月费 200 美元），整合19 个AI 模型并在云端创建子代理来处理复杂任务，如检索统计数据、法律信息、生成网站和可视化。它面对高端企业客户，强调安全性和工作流自动化[6]。	代表生成式搜索公司向高端决策市场扩展，突出“多模型集成＋代理”的趋势。
2026‑03‑05，美国	Luma AI	Luma AI 推出“Luma Agents”，由新一代Uni‑1模型驱动，可生成文本、图像、视频和音频并协调多个外部模型（Ray 3.14、Veo 3 等），在营销和创意产业中实现端到端工作流程[7]。	多模态代理可一次性完成创意方案策划、内容生成与迭代，标志着创意行业向智能代理平台迈进。
2026‑03‑11，美国	NVIDIA	VentureBeat 报道，NVIDIA 发布Nemotron 3 Super，一款120 亿参数的混合模型，采用Hybrid Mamba‑Transformer骨干以及Latent Mixture‑of‑Experts (LatentMoE)设计，可维护100 万词的长上下文，并通过“专家压缩”提高效率[8]。模型使用NVFP4 4 bit量化并针对Blackwell GPU 优化，实现推理速度提升 4 倍[9]。	Nemotron 3 Super 公布权重，可商业使用，为处理长链路任务或多代理工作流提供高效模型。它的1 M token 上下文适合代码搜索和长文档分析。
2026‑03‑16，美国	NVIDIA	NVIDIA 发新闻稿宣布扩展开源模型家族，推出Nemotron 3 Ultra、Omni、VoiceChat等多模态模型，以及面向物理AI 的Cosmos 3世界模型、用于人形机器人的Isaac GR00T N1.7和自动驾驶模型Alpamayo 1.5[10]。另外宣布生命科学模型Proteina‑Complexa和数百万条人工预测蛋白质复合体数据集[11]。这些开源模型在GitHub、Hugging Face 和 NIM 服务中可用[12]。	NVIDIA 从硬件供应商逐渐转型为开源模型提供者，覆盖语言、视觉、语音、机器人和生命科学，为开发者提供可自行部署或微服务调用的模型库。
2026‑03‑17，美国（法国公司）	Mistral AI	TechCrunch 报道，Mistral 推出企业平台Mistral Forge，允许企业用自有数据从零训练定制模型；同时发布Mistral Small 4。Small 4 是混合型模型，拥有119 B 总参数，6.5 B 活跃参数，采用128 专家MoE 架构，提供256 k上下文，并能在速度与深度推理间调节[13][14]。Small 4 可接受文本与图像输入，允许设置reasoning_effort来控制推理深度[15]。模型基于Apache 2.0 许可开放[16]。	Mistral Small 4 统一“指令、推理、代码”能力，推动混合模型成为企业通用引擎。Mistral Forge 则意在帮助企业建立“自主专属模型”。
2025‑12 (补充)	Mistral AI	早前报道的Mistral Large 3采用“颗粒度MoE”架构，活跃参数 41 B，总参数 675 B，拥有256 k上下文[17]。同时推出Ministral 3系列14 B/8 B/3 B 小模型（Base/Instruct/Reasoning），支持128 k–256 k 上下文，并可在一张GPU 上运行[18]。	虽是2025 年底发布，但其开放权重、小而高效的设计为2026 年的开源浪潮奠定基础。
2026‑03‑11，美国学生计划	Google	“Gemini for Students” 页面显示，注册学生仍可获得1 个月的Google AI Pro 试用，包括访问Gemini 3.1 Pro 模型、无限图片上传、Nano Banana Pro 级别图像生成和2 TB 存储[19]。先前为学生提供的延长优惠已于3 月 11 日结束，但1 个月试用仍可参与[20]。	学生可在试用期间体验Gemini 3.1 Pro，与Nano Banana Pro 等模型进行图像生成。

2. 中国

时间/地区	主要参与方	动态与关键细节	影响与意义
2026‑03‑17，中国	阿里巴巴	路透评论称阿里巴巴将AI 业务从云部门独立出来，成立阿里Token Hub 业务群。该集团关注“Token 消耗”模式——用户通过类似OpenClaw 的AI 代理消费代币来执行任务。MiniMax 的低成本模型在半年的代币消费增长六倍，营收翻番，显示用户愿意为代币支付[21][22]。	阿里将从“提供整体解决方案”转向出售代币与代理服务，形成新的盈利模式。
2026‑03‑18，中国	百度	Baidu 发布OpenClaw “龙虾”代理系列，包括桌面版DuMate、移动版RedClaw、云端DuClaw以及接入小度智能音箱的家庭端[23]。这些代理可跨应用、跨设备完成多步任务，如制作PPT、剪辑视频或点咖啡。	百度计划将代理作为操作系统级能力，助力个人和企业自动化复杂工作流。
2026‑03‑18，中国	地方政府/ OpenClaw	路透社报道，深圳龙岗、无锡、合肥、苏州等地发布政策，提供最高1,000 万元人民币补贴，扶持基于OpenClaw的创业者和初创企业，并设立AI 合规中心；监管部门同时要求云平台限制代理访问敏感目录等[24]。	地方政府既积极推广代理技术以刺激经济，又加强数据安全监管，体现机遇与风险并存。
2026‑02‑12，中国	ByteDance	Reuters 报道，字节跳动发布视频生成模型Seedance 2.0，可处理文本、图像、音频和视频，面向影视、电商和广告领域[25]。该模型在微博上因能生成复杂剧情而走红，甚至获得埃隆·马斯克在X 上的称赞[26]。然而因版权纠纷，字节跳动已于3 月 14 日暂停全球发布[27]。	Seedance 2.0 被视为视频领域的“DeepSeek 时刻”，但版权风险显示生成式视频需要慎重处理。
2026‑03‑11，中国	小米	路透社披露，一款在OpenRouter 平台匿名发布的模型Hunter Alpha实际上是小米的旗舰模型MiMo‑V2‑Pro。该模型具备100 万token上下文，面向AI 代理，向全球开发者提供一周免费体验[28]。	小米首次将开源模型定位为AI 代理“大脑”，免费试用吸引开发者快速检验性能。
2026‑03‑13，中国	OpenClaw 社区（第三方社区）	OpenClaw 更新版本 2026.1.30，支持终端自动补全，并提供对Kimi K2.5和Kimi Coding模型的免费访问，方便用户在本地运行AI 代理而无需外部API 费用[29]。更新还改进了Telegram 集成和MiniMax OAuth，推送社区安全补丁。	免费开放的Kimi K2.5、Kimi Coding 为编码学习者提供了强大的实践机会；终端补全提升了开发者体验。
2026‑02‑12，中国	Reuters 调研	一年后，DeepSeek 冲击仍在持续，Reuters 报道称DeepSeek、阿里巴巴、字节跳动等准备在春节期间推出新模型，延续低成本、开源策略；开放模型使中国公司能降低成本并加快开发[30]。	预计中国厂商将陆续推出低价或免费的大模型，与DeepSeek R1 一样吸引全球用户。
2026‑02‑12，中国	DeepSeek	Reuters 报道，DeepSeek R1 引发全球关注后，更多美国初创公司开始使用中国开源模型。美国顾问机构指出，中国开源模型在Hugging Face 和OpenRouter 上占据使用排行榜，80% 的美国初创公司使用这些模型，DeepSeek R1的下载量甚至超过ChatGPT，在App Store 上排名第一，阿里巴巴的Qwen 系列下载量超过Meta Llama 系列[31]。	中国模型凭借免费或低价策略快速渗透美国市场，推动开源生态发展并形成竞争压力。

二、新模型与促销活动总览

下表列出了最近值得关注的模型及其免费试用或优惠信息（仅列举关键参数，表格中尽量使用短语或数字；详细介绍见正文）：

模型/平台	重要特点(简要)	免费/优惠信息	接入途径
Mistral Small 4 (3/16/2026)	119 B 总参数、6.5 B 活跃参数；128 专家 MoE 架构；256 k 上下文；文本+图像输入；支持调节推理力度[13][15]	开源Apache 2.0 许可，可自行托管或通过Mistral API 调用；没有硬性费用，但商业托管需支付API 使用费	在Mistral AI Studio 或Hugging Face 获取权重；企业可使用Mistral Forge 定制模型
Mistral Large 3 / Ministral 3 (2025‑12)	大模型：675 B 参数、41 B 活跃、256 k 上下文[17]；小模型：14 B/8 B/3 B 版本，支持128 k–256 k 上下文，可在一张GPU 上运行[18]	全部开源，无许可费用；可在本地或云上部署	可从Hugging Face、GitHub 获取权重；Mistral Studio 提供API 服务
Nemotron 3 Super (3/11/2026)	120 B 参数；Hybrid Mamba‑Transformer 骨干；Latent MoE 设计；支持1 M token上下文；多Token 预测加速[8]	NIM API 与Hugging Face 提供免费访问（OpenRouter 页面标示每百万输入/输出token 费用为$0）[32]	在OpenRouter 或NVIDIA NIM 平台注册，选择Nemotron 3 Super 免费模型；也可通过vLLM/llama.cpp 本地部署
StepFun Step 3.5 Flash (2026)	混合专家结构，256 k 上下文；面向通用对话和长文档；号称在多数基准上优于Llama 2/3	OpenRouter 标示完全免费[32]	通过OpenRouter API 调用；需要在平台注册获得API Key
Arcee Trinity Large Preview / Trinity Mini	Trinity Large: 400 B MoE 模型，512 k 上下文；Trinity Mini: 13 B 模型；支持编码、角色扮演等[33]	OpenRouter 提供免费试用（每百万token 费用为 $0）	在OpenRouter API 选择相应模型；适合体验超长上下文与多样任务
Z.ai GLM 4.5 Air	91 B 混合模型，256 k 上下文；支持开源协议；定位通用对话、工具调用[33]	OpenRouter 列为免费；无输入输出费用	在OpenRouter 注册并调用
Kimi K2.5 / Kimi Coding	MiniMax/Ant Ling 系列编码模型；专长代码生成与调试	OpenClaw 2026.1.30 更新提供免费访问，无需外部API 费用[29]；时间限制取决于社区更新	使用OpenClaw 命令行工具或Telegram 机器人连接，自行设置本地代理
MiMo‑V2‑Pro (Hunter Alpha)	小米旗舰模型；约1 M token 上下文；设计为AI 代理的大脑[28]	发布初期（3/11/2026 起）对全球开发者免费试用一周[28]	在OpenRouter 搜索“MiMo‑V2‑Pro” 或登录Mi AI 开发者平台领取试用码
Claude March 2026 促销	Doubao ‎(Free/Pro/Max/Team) 用户在非高峰时段获得2× 使用配额[4]	促销期间为2026‑03‑13 至 03‑28，企业版无此优惠，额外使用量不计入周限额[4]	用户无需任何操作，促销自动生效；在Claude 网页版、桌面版和Claude Code 等均可享受
Gemini 3.1 Pro 学生试用	谷歌的Gemini Pro 模型，支持图像上传与高级生成；包含2 TB 存储[19]	学生注册可获得1 个月免费试用（需绑定支付方式）[20]	在Google Workspace for Education 账号内注册，使用Gemini Pro 服务；试用结束前取消可避免收费
Seedance 2.0 (ByteDance)	文本‑图像‑音频‑视频统一模型，用于视频生成[25]	2 月发布时在中国社交平台迅速走红，但3 月 14 日因版权争议暂停全球发布[27]；未来推广未定	若重新上线，可通过字节跳动旗下Doubao 或广告平台申请使用；目前建议关注版权合规
Cosmos 3、Isaac GR00T N1.7、Alpamayo 1.5	NVIDIA 发布的物理AI 模型：Cosmos 3 用于仿真世界模型，GR00T N1.7 面向人形机器人，Alpamayo 1.5 改进自动驾驶感知与导航[34]	均开放权重并通过NIM 微服务提供测试；企业可申请试用	通过GitHub、Hugging Face 或NVIDIA NIM Platform 下载或调用；需具备GPU 环境

三、推荐尝试的模型与建议

以下建议基于促销信息和模型特性，为希望提升AI 技能的用户提供一些试用方向。

1.编程与推理能力

2.Mistral Small 4：该模型结合指令、推理与编码功能，可在本地或云端部署，适合编写代码、调试和深入逻辑推理。其开放权重和256 k 上下文能处理大型项目。

3.Kimi Coding / Kimi K2.5：在OpenClaw 平台免费使用，擅长代码生成和解释，适合学习代码代理的工作方式。

Nemotron 3 Super：长达1 M token 上下文和高吞吐量使其成为探索长链路推理、跨文档分析的理想模型。通过OpenRouter 免费体验。
多模态与创意生成

6.Luma Agents：集成Uni‑1 模型及多种外部模型，支持文本、图片、视频、音频的规划与生成，适合广告、营销和创意团队体验代理式创作。

7.Seedance 2.0（待恢复）：若视频生成工具重新上线，可测试其将文本转化为视频的能力，同时注意版权风险。

Gemini 3.1 Pro 试用：学生可利用试用期体验图像上传和高级图像生成，了解Google 大模型的视觉能力。
长文本与文档分析

10.MiMo‑V2‑Pro：一百万词上下文窗口非常适合跨文档、跨任务的AI 代理实验，试用期内可评估其稳定性和推理深度。

11.StepFun Step 3.5 Flash / Trinity Large：这些开源模型在OpenRouter 免费提供，拥有较长上下文和混合专家结构，适合对比不同开源模型的表现。

Mistral Large 3 / Ministral 3：虽然已发布一段时间，但其小型版本能够在单卡上运行，适合个人学习混合模型架构与低成本部署。
AI 代理与工具调用

14.OpenClaw 平台与Baidu “龙虾”代理：可体验端到端的多步骤任务自动化，如生成PPT、剪辑视频或跨设备下单。通过小度智能音箱、移动端或桌面端使用。

15.Perplexity Computer：付费订阅可尝试19 模型组合执行复杂调研和文档生成，对于需要快速编写报告的专业人士有帮助。

16.Anthropic Claude 促销：在非高峰时段免费翻倍使用配额，适合短时间内集中训练交互技巧和探索Claude 的编程模式。

四、结论

2026年初至3 月中旬，AI 行业呈现以下趋势：

·代理化、长上下文和多模态：无论是Mistral Small 4、Nemotron 3 Super，还是小米 MiMo‑V2‑Pro，都强调混合专家架构、超长上下文和代理执行能力；NVIDIA 在语言、机器人和医疗领域推出的开源模型也体现“理解＋行动”一体化。

·开源与低价策略：中国公司通过低成本或免费开放模型（DeepSeek R1、阿里Qwen、MiniMax Kimi 等）迅速抢占市场，U.S. 初创企业80% 使用中国开源模型[31]。这种“免费+开源”模式迫使美国公司调整策略，如OpenAI 降价、Anthropic 提供使用量翻倍促销。

·监管与合规挑战：字节跳动Seedance 2.0 因版权争议暂缓全球发布[27]；地方政府在推广代理的同时强调数据安全和敏感目录限制[24]。随着模型能力增强，版权、隐私与伦理问题愈加突出。

对于个人学习者和开发者，利用各类促销活动（例如Claude 使用量翻倍、OpenClaw 免费模型、MiMo‑V2‑Pro 试用）可以在低成本甚至零成本下体验最前沿的模型和代理技术；同时需要关注官方公告和合规要求，合理使用免费资源，避免使用未经授权的数据或侵犯版权。

[1][2]OpenAI drops AI video tool Sora, startling Disney, sources say | Reuters

https://www.reuters.com/technology/openai-set-discontinue-sora-video-platform-app-wsj-reports-2026-03-24/

[3]Arm unveils new AI chip, expects it to add billions in annual revenue | Reuters

https://www.reuters.com/business/media-telecom/arm-unveils-new-ai-chip-expects-it-add-billions-annual-revenue-2026-03-24/

[4][5]Claude March 2026 usage promotion | Claude Help Center

https://support.claude.com/en/articles/14063676-claude-march-2026-usage-promotion

[6]Perplexity's new Computer is another bet that users need many AI models | TechCrunch

https://techcrunch.com/2026/02/27/perplexitys-new-computer-is-another-bet-that-users-need-many-ai-models/

[7]Luma launches creative AI agents powered by its new ‘Unified Intelligence’ models | TechCrunch

https://techcrunch.com/2026/03/05/exclusive-luma-launches-creative-ai-agents-powered-by-its-new-unified-intelligence-models/

[8][9]Nvidia's new open weights Nemotron 3 super combines three different architectures to beat gpt-oss and Qwen in throughput | VentureBeat

https://venturebeat.com/technology/nvidias-new-open-weights-nemotron-3-super-combines-three-different

[10][11][12][34] NVIDIA Corporation - NVIDIA Expands Open Model Families to Power the Next Wave of Agentic, Physical and Healthcare AI

https://investor.nvidia.com/news/press-release-details/2026/NVIDIA-Expands-Open-Model-Families-to-Power-the-Next-Wave-of-Agentic-Physical-and-Healthcare-AI/default.aspx

[13][14][15][16]Introducing Mistral Small 4 | Mistral AI

https://mistral.ai/news/mistral-small-4

[17][18]Mistral closes in on Big AI rivals with new open-weight frontier and small models | TechCrunch

https://techcrunch.com/2025/12/02/mistral-closes-in-on-big-ai-rivals-with-mistral-3-open-weight-frontier-and-small-models/

[19][20]Gemini for Students — your AI study buddy from Google

https://gemini.google/students/

[21][22]Alibaba shakeup hints at an AI business model | Reuters

https://www.reuters.com/commentary/breakingviews/alibaba-shakeup-hints-an-ai-business-model-2026-03-17/

[23]Baidu joins China's OpenClaw frenzy with new AI agents | Reuters

https://www.reuters.com/business/media-telecom/baidu-joins-chinas-openclaw-frenzy-with-new-ai-agents-2026-03-17/

[24]Chinese tech hubs promote OpenClaw AI agent despite security warnings | Reuters

https://www.reuters.com/world/asia-pacific/chinas-shenzhen-backs-openclaw-ai-with-subsidies-despite-beijings-security-2026-03-09/

[25][26]ByteDance's new AI video model goes viral as China looks for second DeepSeek moment | Reuters

https://www.reuters.com/business/media-telecom/bytedances-new-ai-video-model-goes-viral-china-looks-second-deepseek-moment-2026-02-12/

[27]ByteDance suspends launch of video AI model after copyright disputes, The Information reports | Reuters

https://www.reuters.com/technology/bytedance-suspends-launch-video-ai-model-after-copyright-disputes-information-2026-03-14/

[28]Mystery AI model revealed to be Xiaomi's following suspicions it was DeepSeek V4 | Reuters

https://www.reuters.com/business/media-telecom/mystery-ai-model-has-developers-buzzing-is-this-deepseeks-latest-blockbuster-2026-03-18/

[29]OpenClaw 2026.1.30 Adds Free AI Model Access and Shell Completion | OpenClaw | Create With

https://www.createwith.com/tool/openclaw/updates/openclaw-2026130-adds-free-ai-model-access-and-shell-completion

[30]A year on from DeepSeek shock, get set for flurry of low-cost Chinese AI models | Reuters

https://www.reuters.com/world/china/year-deepseek-shock-get-set-flurry-low-cost-chinese-ai-models-2026-02-12/

[31]China's open-source dominance threatens US AI lead, US advisory body warns | Reuters

https://www.reuters.com/business/autos-transportation/chinas-open-source-dominance-threatens-us-ai-lead-us-advisory-body-warns-2026-03-23/

[32][33]Free AI Models on OpenRouter | OpenRouter

https://openrouter.ai/collections/free-models