AI领域法律研究系列之五十九:内参|美国分析师团访华14家AI大厂实录(2026)——算力约束、开源策略、数据合规与政企采购的法律解读

【摘要／导语】2026年5月美国科技分析师访华团（Kevin Xu、Azeem Azhar等）走访DeepSeek、月之暗面、MiniMax、智谱AI、字节跳动Seed、阿里、蚂蚁、小米、零一万物、宇树、魔搭等14家AI与机器人公司，形成多方观感实录。核心信息点：受芯片出口管制影响中国可用算力约为美国2025年底的1/8但计算效率高出4–7倍；开源分歧以1T参数为界；中国企业AI支出倾向云计费和私有化而非SaaS订阅；国内缺乏成熟数据交易市场多自建标注。本文从合规律师角度逐条析出算力进口合规、开源模型知识产权与出口管制、训练数据来源合法性、政企AI采购合同要点供顾问单位参考。

一、算力缺口与出口管制——法律与合规背景

实录要点：受美《出口管制条例》（EAR, 15 CFR §§742.6, 744.23）约束，中国公司无法批量采购英伟达H100/B200/GB300 NVL72系统；现有Ascend 950PR性能≈H100但出货量仅约75万颗/年（英伟达2025年出货Hopper+Blackwell约700万颗）。2025年底美AI行业估测算力约为中国8倍；中国总算力约相当于美2023年规模。

中国公司算力须同时支撑预训练＋面向数亿C端/B端推理服务，美主要算力集中于训练。

律师合规注释：

EAR合规警示（涉外客户）：若顾问单位为美资在华企业或中外合资，采购/使用受控AI芯片（含Ascend 950PR若被BIS列名）须做EAR §744.23 最终用户/最终用途筛查；不得将受控算力再出口至被禁实体。

供应链中断预案：建议AI公司做"算力来源多元化+推理侧压缩(distillation/quantization)"法务说明——采购合同中要求供应商（含国产芯片厂商）保证所供硬件不违反美出口管制且具持续供货或替代方案（Force Majeure除外）。

自建IDC合规：若用国产芯片建私有云→仍须按《网络安全法》第21条做等级保护测评；《数据安全法》第27条重要数据处理者应当开展风险评估（含算力集群处理重要数据情形）。

二、计算效率与模型架构优化——对IP与保密的影响

实录要点：单位算力支持AI智能为简单扩展下4–7倍（因芯片管制倒逼算法/推理优化）；

DeepSeek承担基础架构、效率、推理优化及华为CANN栈适配工作。

律师合规注释：

高效推理常依赖自研蒸馏/MoE架构/量化方案→属核心商业秘密，须签《保密及知识产权归属协议》（模型结构参数受《反不正当竞争法》第2条保护）。

若与华为/其他硬件厂做栈适配联合研发→联合开发协议明确"各自背景IP归各自， foreground IP按约定共有或归一方＋交叉许可"。

三、开源分歧——1T参数为界与许可证合规

实录要点：目前最强开源模型出自中国公司（DeepSeek-R1、Qwen2.5等）；

内部分歧：≥1T参数模型开源"没人跑得动"→倾向仅托管API；＜1T参数倾向权重开源；

部分公司视开源为"信仰"，部分视商业回报。

律师合规注释（重要）：

开源许可证审核（参照案例奥特曼LoRA案精神）：o

Apache 2.0 / MIT：较宽松但须保留NOTICE。

GPL-family（罕见但对LLM权重适用性存争议）：若被法院认定具传染性→须评估是否影响闭源上层应用。

"只发布API不发布权重"≠无知识产权风险——若API背后调用未授权训练数据生成输出，仍可能帮助侵权。

建议动作：建《开源模型引入法务审核单》——型号/参数量/许可证类型/限制条款/是否已做知名IP黑名单过滤/再分发范围。

四、企业文化差异——实习生权限与保密管理

实录要点：核心研发大量为25–26岁博士生实习生，享全职权限自由实验；

部分公司"硅谷风"，部分侧重政府展厅接待。

律师合规注释：

实习生签《实习协议+保密承诺(NDA)》——明确：①所接触模型/训练代码/未公开数据属商业秘密（《反不正当竞争法》第9条）；②离职交还/销毁；③违约赔偿计算公式。

权限最小化原则虽影响创新速度但可降低泄露风险（模型权重泄露案精神）→建议"核心checkpoint读写权限限Core ML Team＋PI；实习生只读推理环境"。

五、AI安全观与政府角色——监管期待与合同条款

实录要点：年轻研究员对AGI少恐惧，认为"安全如何确保应交由政府决定"；

地方政府（京沪杭）通过产业基金/园区推动AI——相当于"硅谷a16z角色。律师合规注释：政府客户采购AI系统时常要求符合《生成式AI服务管理暂行办法》第7–9条（训练数据合法、内容安全、标识功能）及等保/分保——合同承诺条款须写清。接受政府产业基金投资→投资协议含合规承诺（内容安全自审、算法备案配合、数据出境安全评估若涉跨境），投后须配合监管检查。

六、中国企业AI付费模式——SaaS vs 云资源计费

实录要点：传统SaaS订阅在中国企业付费意愿低；AI更多按云资源+API调用计费（类似MaaS – Model as a Service）。

大厂（字节/阿里/腾讯）借自有云消化推理成本。

律师合规注释（为客户签AI采购合同时）：

□ 计费模式明确: 按token/调用次数/并发×云资源单价; 不含隐藏"模型 royalty"

□ 知识产权: 客户用API生成内容权利归属(建议:客户享输出内容;供方享模型及改进之IP)

□ 数据出境: 若调用境外端点须先做PIPL第38条安全评估/标准合同备案(视情形)

□ SLA含: 内容安全过滤证明(符合生成式AI办法第9条)、可用率、故障响应时间

□ 供应商承诺: 训练数据有合法来源、不故意留后门、配合算法备案所需信息提供

七、训练数据产业薄弱——自建标注与来源合法性

实录要点：美Anthropic/OpenAI年购数据＞1000万美元；中国几无成熟数据交易市场；

大厂自建标注团队；研究员花时间构造RL环境。

律师合规注释（高风险点）：自建标注须确保原始数据采集合法（如爬取须符合robots.txt、不破登录墙、不爬PII超必要范围）；

若用众包标注→与标注公司签"数据源合法保证＋标注员知情同意(若涉敏感内容如医疗影像/人脸)";

禁止将未公开第三方版权素材（书籍/论文PDF/未授权剧本）整本喂入预训练→触犯《著作权法》第10条（复制/改编权）。

建议：训练数据源登记册（来源/权利状态/处理方式），知名IP明确排除或单独获授权。

八、从"参访印象"到"合规清单"

这份访华团实录透露出一个法律人该捕捉的信号：

算力受控但效率突围→须在看管好EAR合规前提下做IP保护（模型权重/栈适配）；

开源主力在中国→许可证审核+训练数据合法化是双刃剑；

政府驱动+云计费→采购合同须同时满足商事与监管合规（生成式AI办法、算法备案、等保）。

【参考文献与适用法律法规】

《中华人民共和国反不正当竞争法》第2条、第9条（模型权重商业秘密保护——参照北京知识产权法院(2023)京73民终3802号）

《中华人民共和国著作权法》第10条（复制权、改编权——参照杭州中院(2024)浙01民终10332号奥特曼LoRA案）

《生成式人工智能服务管理暂行办法》（网信办等七部门令〔2023〕第15号）第7、9条

《中华人民共和国个人信息保护法》第13、28、38条（数据出境）

《中华人民共和国网络安全法》第21条（等级保护）

《中华人民共和国数据安全法》第27条（重要数据风险评估）

U.S. Export Administration Regulations (EAR) 15 CFR §§742.6, 744.23 (Entity List / Advanced Computing Controls)