【摘要/导语】2026年5月美国科技分析师访华团(Kevin Xu、Azeem Azhar等)走访DeepSeek、月之暗面、MiniMax、智谱AI、字节跳动Seed、阿里、蚂蚁、小米、零一万物、宇树、魔搭等14家AI与机器人公司,形成多方观感实录。核心信息点:受芯片出口管制影响中国可用算力约为美国2025年底的1/8但计算效率高出4–7倍;开源分歧以1T参数为界;中国企业AI支出倾向云计费和私有化而非SaaS订阅;国内缺乏成熟数据交易市场多自建标注。本文从合规律师角度逐条析出算力进口合规、开源模型知识产权与出口管制、训练数据来源合法性、政企AI采购合同要点供顾问单位参考。

一、算力缺口与出口管制——法律与合规背景
实录要点:受美《出口管制条例》(EAR, 15 CFR §§742.6, 744.23)约束,中国公司无法批量采购英伟达H100/B200/GB300 NVL72系统;现有Ascend 950PR性能≈H100但出货量仅约75万颗/年(英伟达2025年出货Hopper+Blackwell约700万颗)。2025年底美AI行业估测算力约为中国8倍;中国总算力约相当于美2023年规模。
中国公司算力须同时支撑预训练+面向数亿C端/B端推理服务,美主要算力集中于训练。
律师合规注释:
EAR合规警示(涉外客户):若顾问单位为美资在华企业或中外合资,采购/使用受控AI芯片(含Ascend 950PR若被BIS列名)须做EAR §744.23 最终用户/最终用途筛查;不得将受控算力再出口至被禁实体。
供应链中断预案:建议AI公司做"算力来源多元化+推理侧压缩(distillation/quantization)"法务说明——采购合同中要求供应商(含国产芯片厂商)保证所供硬件不违反美出口管制且具持续供货或替代方案(Force Majeure除外)。
自建IDC合规:若用国产芯片建私有云→仍须按《网络安全法》第21条做等级保护测评;《数据安全法》第27条重要数据处理者应当开展风险评估(含算力集群处理重要数据情形)。
二、计算效率与模型架构优化——对IP与保密的影响
实录要点:单位算力支持AI智能为简单扩展下4–7倍(因芯片管制倒逼算法/推理优化);
DeepSeek承担基础架构、效率、推理优化及华为CANN栈适配工作。
律师合规注释:
高效推理常依赖自研蒸馏/MoE架构/量化方案→属核心商业秘密,须签《保密及知识产权归属协议》(模型结构参数受《反不正当竞争法》第2条保护)。
若与华为/其他硬件厂做栈适配联合研发→联合开发协议明确"各自背景IP归各自, foreground IP按约定共有或归一方+交叉许可"。
三、开源分歧——1T参数为界与许可证合规
实录要点:目前最强开源模型出自中国公司(DeepSeek-R1、Qwen2.5等);
内部分歧:≥1T参数模型开源"没人跑得动"→倾向仅托管API;<1T参数倾向权重开源;
部分公司视开源为"信仰",部分视商业回报。
律师合规注释(重要):
开源许可证审核(参照案例奥特曼LoRA案精神):o
Llama 3 Community License:禁止用于≥7B参数再分发未保留版权声明、禁用于某些大型服务托管情形→须审查是否约束贵司产品。
Apache 2.0 / MIT:较宽松但须保留NOTICE。
GPL-family(罕见但对LLM权重适用性存争议):若被法院认定具传染性→须评估是否影响闭源上层应用。
"只发布API不发布权重"≠无知识产权风险——若API背后调用未授权训练数据生成输出,仍可能帮助侵权。
建议动作:建《开源模型引入法务审核单》——型号/参数量/许可证类型/限制条款/是否已做知名IP黑名单过滤/再分发范围。
四、企业文化差异——实习生权限与保密管理
实录要点:核心研发大量为25–26岁博士生实习生,享全职权限自由实验;
部分公司"硅谷风",部分侧重政府展厅接待。
律师合规注释:
实习生签《实习协议+保密承诺(NDA)》——明确:①所接触模型/训练代码/未公开数据属商业秘密(《反不正当竞争法》第9条);②离职交还/销毁;③违约赔偿计算公式。
权限最小化原则虽影响创新速度但可降低泄露风险(模型权重泄露案精神)→建议"核心checkpoint读写权限限Core ML Team+PI;实习生只读推理环境"。
五、AI安全观与政府角色——监管期待与合同条款
实录要点:年轻研究员对AGI少恐惧,认为"安全如何确保应交由政府决定";
地方政府(京沪杭)通过产业基金/园区推动AI——相当于"硅谷a16z角色。律师合规注释:政府客户采购AI系统时常要求符合《生成式AI服务管理暂行办法》第7–9条(训练数据合法、内容安全、标识功能)及等保/分保——合同承诺条款须写清。接受政府产业基金投资→投资协议含合规承诺(内容安全自审、算法备案配合、数据出境安全评估若涉跨境),投后须配合监管检查。
六、中国企业AI付费模式——SaaS vs 云资源计费
实录要点:传统SaaS订阅在中国企业付费意愿低;AI更多按云资源+API调用计费(类似MaaS – Model as a Service)。
大厂(字节/阿里/腾讯)借自有云消化推理成本。
律师合规注释(为客户签AI采购合同时):
□ 计费模式明确: 按token/调用次数/并发×云资源单价; 不含隐藏"模型 royalty"
□ 知识产权: 客户用API生成内容权利归属(建议:客户享输出内容;供方享模型及改进之IP)
□ 数据出境: 若调用境外端点须先做PIPL第38条安全评估/标准合同备案(视情形)
□ SLA含: 内容安全过滤证明(符合生成式AI办法第9条)、可用率、故障响应时间
□ 供应商承诺: 训练数据有合法来源、不故意留后门、配合算法备案所需信息提供
七、训练数据产业薄弱——自建标注与来源合法性
实录要点:美Anthropic/OpenAI年购数据>1000万美元;中国几无成熟数据交易市场;

大厂自建标注团队;研究员花时间构造RL环境。
律师合规注释(高风险点):自建标注须确保原始数据采集合法(如爬取须符合robots.txt、不破登录墙、不爬PII超必要范围);
若用众包标注→与标注公司签"数据源合法保证+标注员知情同意(若涉敏感内容如医疗影像/人脸)";
禁止将未公开第三方版权素材(书籍/论文PDF/未授权剧本)整本喂入预训练→触犯《著作权法》第10条(复制/改编权)。
建议:训练数据源登记册(来源/权利状态/处理方式),知名IP明确排除或单独获授权。
八、从"参访印象"到"合规清单"
这份访华团实录透露出一个法律人该捕捉的信号:
算力受控但效率突围→须在看管好EAR合规前提下做IP保护(模型权重/栈适配);
开源主力在中国→许可证审核+训练数据合法化是双刃剑;
政府驱动+云计费→采购合同须同时满足商事与监管合规(生成式AI办法、算法备案、等保)。
【参考文献与适用法律法规】
《中华人民共和国反不正当竞争法》第2条、第9条(模型权重商业秘密保护——参照北京知识产权法院(2023)京73民终3802号)
《中华人民共和国著作权法》第10条(复制权、改编权——参照杭州中院(2024)浙01民终10332号奥特曼LoRA案)
《生成式人工智能服务管理暂行办法》(网信办等七部门令〔2023〕第15号)第7、9条
《中华人民共和国个人信息保护法》第13、28、38条(数据出境)
《中华人民共和国网络安全法》第21条(等级保护)
《中华人民共和国数据安全法》第27条(重要数据风险评估)
U.S. Export Administration Regulations (EAR) 15 CFR §§742.6, 744.23 (Entity List / Advanced Computing Controls)
夜雨聆风