

前言
在很多国家,AI如果产生严重的伦理灾难、泄露了用户的核心医疗隐私、或者被用于深度伪造进行大规模欺诈,法院在追究责任时,不仅会针对公司实体,还会穿透到公司的实际控制人、首席技术官,甚至未尽到合理注意义务的董事会成员(投资人代表)。所以做好合规,就是在董事会层面设立“防火墙”。
在创投圈,最尴尬的瞬间不是“我不懂”,而是“我假装我很懂,但一开口就露了怯”。
但是没办法,AI的发展速度早已经不是线性的了,而是指数级。
今天,我深刻的感受到AI领域的每一个细分赛道,从基础能力层的大模型、开源生态,到工程效能层的Infra(基础设施)、数据工程,再到落地场景层的具身智能、AI+Science、可穿戴硬件,每一处都是一座专业技术与商业逻辑堆砌成的高山。
所以,现状就是,技术的迭代太快……快到连专门看AI赛道的投资人都开始出现“认知脱节”。你会发现很多投资人拿着两年前看SaaS、看互联网平台、甚至看硬科技的旧地图,试图去寻找AI时代的“新大陆”。他们确实是说着“算力、算法、数据”这老三样,但是一到深水区,就只能靠堆砌空洞的话来掩盖内心的焦虑。而真正的AI创业者,那些每天在硅谷、中关村、新加坡、深圳湾熬夜调参、调硬件、跑测试的硬核团队,一听到那些浮于表面的提问,心里就已经悄悄把这家机构划掉了……
我深刻的感受到,在AI时代,专业性不强的投资人,正在成批量的失去拿到顶级项目入场券的资格。
为了降低这种信息差,也为了让投资人能真正理解创业者在说什么,让为了让创业者能找到真正懂行的“伯乐”,我翻出了之前杂乱无章的工作笔记(太忙了没时间整),尝试梳理出了这篇文章(若有不准确之处/不同的理解,欢迎评论区帮助我和大家调整认知)。

一、 大模型与Infra赛道
过去,大家迷恋“大力出奇迹”。只要参数足够大,算力足够多,模型就能“涌现”出智能。但到了今天,盲目烧钱堆参数的时代已经结束了,投资人和创业者都在寻找更高效、更具性价比的解决方案。
1. 核心黑话扫盲
1)MoE (Mixture of Experts,混合专家模型)2. 投资人必须看清的商业底牌
投资Infra和大模型,不能再赌“谁能干掉OpenAI”这样的问题。你或许得问创业者这几个问题:
你的算力利用效率是多少?
在全网缺卡的情况下,你会用什么方式做训练优化?
你的数据壁垒在哪里?
假设你的训练数据都是从网上爬公开的Common Crawl,你能做出来的东西,大厂花半天时间就能覆盖。你有没有独家、有竞争力的、合规的行业私域数据?
推理成本的下降曲线是否符合你的商业预期?

二、Agentic AI(智能体)与应用层
要知道,再2024年的Agent的核心是规划+工具调用+记忆+执行循环,到了现在的2026年,Agent的核心是“目标驱动的自主闭环能力”,由LLM驱动的规划、记忆与工具调用三者构成可迭代、可反思的执行循环,并逐步向Skill化、长程任务与自进化演进。
1. 核心黑话扫盲
1)Function Calling / Tool Use (函数调用/工具使用能力)
大白话:AI不能光会吹水,还得会干活。Function Calling就是大模型发现自己算不出一道高数题时,它会主动写一段Python代码,自己运行代码把答案算出来;或者发现不知道天气时,自己去调用天气预报的API。2. 投资人必须看清的商业底牌
看应用层项目,最怕看到“薄薄的一层“套壳儿应用”。如果一个AI产品,它的核心功能只是把OpenAI或者国内大厂的API又包装了一个好看的UI,那么大厂一旦升级新版本(比如发布一个免费的新功能),这个初创公司就会在24小时内灰飞烟灭。
判断一个Agent是否有真正价值的黄金法则是,它是在帮客户“提高效率”,还是在直接“交付结果”?
假设它只是帮人类员工把工作从5小时缩短到1小时,它只能卖SaaS的软件年费,价值天花板很低;假设它能直接独立完成海外电商的精准获客、跨国合规初审、自动报税,并且对结果负责,那它就可以按照“结果分成/佣金”来收费,它的商业想象空间就会扩大十倍。

三、 具身智能与机器人
没有躯托的灵魂是不自由的,数据结合大模型如果是AI的“大脑”,具身智能就是给这个大脑装上双眼、双手和双腿,让它进入物理世界去搬砖、去进厂、去照顾老人。
1. 核心黑话扫盲
1)VLM / VLA Models (视觉-语言-动作模型)2. 投资人必须看清的商业底牌
投资具身智能,别光看路演视频里机器人跳舞、翻跟头。那些多半是提前写好了运动轨迹的“皮影戏”,你得问他们:
这是Teleoperation(人工作业遥控)的数据,还是自主(Autonomous)运行的数据?
你们的硬件供应链成本能压到多少? 中国在珠三角、长三角的电机、减速器、丝杠供应链优势,能否无缝嫁接到你们的算法架构上?
你们的第一落地场景到底是哪里?
别总想着做全能的家庭保姆,先看看汽车组装厂、危险化学品仓库或者物流分拣中心愿意为创业者掏多少钱。

四、AI+Science与前沿赛道
这是科学家与天才创业者的舞台,也是技术门槛最高、普通投资人最容易被“忽悠”的重灾区。
1. 核心黑话扫盲
1)Protein Folding (蛋白质结构预测)2. 投资人必须看清的商业底牌
在这个赛道,投资人一定要看团队的“两栖能力”。创始人既得懂深度学习的底层算法,又得是垂直学科(如生物医药、材料学、量子化学)的顶级专家。如果一个团队只有算法工程师,没有实验室落地验证的能力,那他们设计出来的分子结构,多半只能停留在PPT上。

中国AI企业为什么要出海?因为国内市场太内卷,在海外能有更好的商业回吐。
但是,AI出海,绝对不是简单的“产品本地化翻译”,而是一场高难度的“全球法律与政治地缘风险越障赛”。 很多创业团队在海里游得正欢,突然一个合规浪头打过来,企业直接死在沙滩上。作为深谙此道的专业视角,我必须给所有的创业者和投资人普及三个层面的核心合规逻辑:必要性、保护性与增长性。
【全球AI合规的三维防护网】
必要性 (Necessity) 迈出出海第一步的“生存通行证”(如GDPR、欧盟AI法案)
保护性 (Protection) 规避天价罚单、创始人连带责任、防止核心资产流失
增长性(Growth) 解锁高净值市场、大厂B端采购入场券
一、 必要性:不出海,等死;不合规,暴毙
我在以前的文章写过,很多互联网时代的投资人有个坏习惯:“先上车,后补票”。产品先上线,用户先裂变,等做大了再去考虑合规和合规。
在AI时代,这种玩法叫“自杀”。
因为AI天然涉及三样最敏感的东西:算力、数据、意识形态,而这里面又包含了多类隐私和敏感信息,所以AI天然包含的信息资产可以视为高风险信息资产,所以会进一步成为各国重点监督和管理的国家战略级资产。现在,全球各主要经济体针对AI的立法速度,早就远远超过了当年的互联网。
1. 欧盟的“天价罚单陷阱”:《欧盟AI法案》(EU AI Act)与 GDPR
如果你的AI产品/服务要卖到欧洲,或者在欧洲有活跃用户,你必须立刻对齐2024年生效、近年全面步入执行阶段的《欧盟AI法案》。
高风险AI系统的严苛准入: 如果你的AI涉及面部识别、信用评估、招聘筛选、司法审判等(被归类为高风险场景),你必须在上线前做极其复杂的“风险管理体系评估”和“数据治理合规审计”。
2. 北美的“长臂管辖与供应链政治”:FTC审查与版权诉讼
美国是既有国家级的人工智能统一监管立法框架,各州,也有各州的规矩。
FTC(联邦贸易委员会) 正在严厉打击“AI虚假宣传”和利用AI进行不公平竞争。如果你的Agent号称能达到100%准确率,一旦被用户投诉,FTC会查到你倾家荡产。
版权踩坑: 纽约时报状动OpenAI的案件还在诉讼中,尚未判决。所以,利用未经授权的版权数据进行模型训练,或许会面临着巨大的下架和赔偿风险。如果你的出海大模型底层数据清洗不干净,在北美随时面临集体诉讼。3. 中国本土的“红线”:算法备案、生成式AI暂行办法与数据出境
对于中国本土研发、试图辐射全球的团队,国内的合规是第一道关卡。《生成式人工智能服务管理暂行办法》明确规定了服务提供者的责任。如果涉及向境外提供数据、调用境外算力、或者将国内用户数据传输境外,必须通过网信部门的数据出境安全评估。
二、 保护性:合规不是枷锁,是创业者与投资人的“防弹衣”
我在很多文章中都说到很多创业者觉得合规很烦,是在拖慢研发速度。但我依然会不厌其烦地想尝试唤醒你们的心智,因为在深水区,合规是在保护你辛辛苦苦积累的核心资产。
1. 保护知识产权(IP protection)与商业机密
你做了一个非常牛的垂直行业大模型,你在微调过程中喂进了大量行业专家的KNOW-HOW数据。如果你没有做好数据隔离、多租户加密以及开源协议合规审计,你的模型参数和核心 prompt 可能会在交互过程中被逆向工程破解,或者被底层云厂商“白嫖”作为其原生模型的训练数据。合规架构,就是把你的技术壁垒用法律锁死。
2. 规避创始团队与投资人的“连带法律责任”
在很多国家,AI如果产生严重的伦理灾难、泄露了用户的核心医疗隐私、或者被用于深度伪造进行大规模欺诈,法院在追究责任时,不仅会针对公司实体,还会穿透到公司的实际控制人、首席技术官,甚至未尽到合理注意义务的董事会成员(投资人代表)。所以做好合规,就是在董事会层面设立“防火墙”。
三、 增长性:合规是最高级的商业壁垒,是高客单价的敲门砖
我给你说一个认知逆转:合规不仅不花钱,它还能帮你挣钱。
如果你去做海外B端大客户(比如跨国银行、顶尖制药厂、大型零售集团),他们采购你的AI Agent或者企业级LLM时,合规部门基本都会有一张长达几十页的合规清单。
你的模型有没有通过 ISO/IEC 42001(全球首个AI管理体系国际标准) 认证? 你的数据存储是否符合 SOC 2 Type II 的安全审计? 你的AI输出如何保证没有偏见(Bias)和歧视? ……
如果一个初创团队能够骄傲地把这些合规认证甩在海外大客户的桌上,你就可以直接报出比竞品高出3-5倍的客单价。因为大客户愿意为“零地缘政治风险、零数据泄露风险”支付溢价。
相反,那些没有做合规体系构建的团队,连对方的供应商准入系统都进不去。这时候,合规就是你击败大厂、撬动数百万美金海外大单的硬实力。

工具附录:AI投资与创业日常防身术(速查指南)
为了方便大家在日常高强度的创投交流中快速翻阅,这里列出五个在技术和商业化落地中极具代表性的高频问题。不管是投资人去抽查项目,还是创业者做团队自测,都可以直接拿来对照。
问题 1:如何识别项目是“真AI创新”还是“套壳Wrapper”?
1)看数据流向问题 2:出海企业如何界定和预防“数据跨境流动”的法律红线?
原则: “数据本地化、计算分布式、合规属地化”,实操做法:
问题 3:大模型训练和生成内容的“版权归属”目前全球怎么判?
输入端(训练阶段):美欧目前面临大量诉讼。目前的行业共识是,尽量使用开源且允许商用的数据集(如带有 MIT/Apache 2.0 协议的开源项目),或者通过合成数据避开版权纠纷。对商业爬虫数据,必须严格遵守目标网站的 robots.txt 协议。问题 4:具身智能赛道,投资人怎么挤掉视频里“人工遥控”的水分?
看“延时与泛化”: 真正的具身智能,其算法应该能处理从未见过的场景。在路演现场,投资人可以随意改变桌上物体的摆放位置、光照条件,或者放一个模型没见过的全新物体。如果机器人依然能准确抓取,说明其泛化能力强。如果它瞬间卡死或动作变形,说明之前的视频多半是人工在后台戴着VR眼镜进行实时遥控喂捕的数据。问题 5:B端客户对AI Agent最核心的顾虑是什么?如何突破?
两大顾虑: 数据隐私泄露与确定性(幻觉控制)。企业最怕自己的核心商业机密(如财务报表、未发布的产品设计图)被Agent作为训练数据上传到公共云端,也怕Agent在面对客户时“胡言乱语”造成公关灾难。
突破手段:*免责声明:作者文章仅为作者个人观点与行业交流参考,不应被视为针对某事件或情形发表的法律意见或建议。作者文章也并不一定代表作者所工作单位的观点。具体合规与风控问题请咨询专业法律服务机构。文章旨在为读者提供一般信息,未经作者书面同意,任何人不得在其它出版物或诉讼中引用或引述作者文章的内容。



律所Base(深圳)
致力于向AI领域与出海企业提供全球主要国家/地区(中国、欧洲、美国、日韩、中东、东南亚等)全生命周期合规、风控与业务出海等需求的咨询与服务
欢迎交流与咨询
往期推荐

5.27

5.26

5.24
夜雨聆风