

各位AI圈的兄弟姐妹们,投资人朋友们,我是你们的老伙计 —— 在律所泡茶,天天跟AI创业者和投资人“混”在一起想吃鱼的老莫。
最近见了不少北京和深圳AI初创团队,有个现象特扎心:一个技术牛逼到能让投资人拍大腿的初创公司,因为没搞懂“数据合规”,融资尽调时被卡了三个月;还有个做AI医疗的团队,产品都快落地了,才发现算法模型用了“未授权的临床数据”,直接被监管喊停。
比如某位我拉着我喝了4瓶洋酒还能“夜闯”公司跟我唠项目的创始人(自动驾驶算法领域),大哥指着 demo 跟我拍胸脯:“兄弟,你看这识别精度,特斯拉都得叫我大哥!明年融B轮,估值保底5个亿!”
我问他:“大哥,数据哪来的?标注团队有没有签保密协议?算法模型训练用的开源框架授权条款看了吗?”
他眼神一飘:“哎呀!兄弟,你就是想太多,先把技术跑通再说,合规那都是融到钱之后的事!”
结果1个月后,大哥跟我说他公司被竞争对手举报“非法采集地理数据”,服务器被端了;又过了俩月,核心标注团队集体跳槽,带着数据投靠了竞品,5个亿的估值,还没来得及画饼,先成了“负资产”。
我想说,这不是个案。
过去一年,我和我们所的律师们见过太多AI初创公司死在“合规”这个隐形炸弹上:做医疗AI的,因为训练数据没有患者授权,FDA认证卡了三年;做金融风控的,算法模型被查出“隐性歧视”,被银保监会罚到现金流断裂;甚至有个做AI可穿戴设备的,因为没做数据跨境合规,海外市场刚打开就被迫退出还承担了千万的罚款。
这真不是我危言耸听。
AI创业,技术是引擎,合规是刹车,没引擎跑不动,没刹车会翻车。 所以,我今天咱就掰开揉碎了聊一个话题:AI初创公司从0到1,到底要踩哪些合规坑?怎么让合规从“成本项”变成“加分项”?
咱不搞法条堆砌,我还在法考的路上呢,也堆不了多少。
我只说人话、讲案例、给方法,让你看完就能用。

一、数据合规:AI公司的“命根子”,90%的创业者倒在了这条起跑线上
AI的底层是数据,数据不合规,相当于给公司装了个定时炸弹,轻则罚款,重则刑事立案,投资人见了直接绕道走,还吃啥鱼,老莫我也给不了你。
1. 数据“来源”:别以为“爬来的”就不是偷
前阵子上海有个做AI影像诊断的团队,为了训练模型,从网上爬了20万份患者CT影像,结果被卫健委盯上了。
你们猜怎么着?
不仅数据全被销毁,创始人还因“非法获取公民个人信息罪”进去了。这可不是闹着玩的,《刑法》第253条之一,最高能判7年。
买数据,最基本的一定要看“三证”:数据提供方的《数据来源合法性证明》、《数据脱敏报告》《授权使用协议》,缺一不可。
别贪便宜买“黑市数据”,那都是带血的,早晚弄脏自己。
自己采集数据要“双同意”:用户授权+明确告知用途。比如你做AI医生助手,让患者上传病历,必须在协议里写清楚“数据仅用于模型训练,不会共享给第三方”,还要留痕,不然用户反手一个举报,你就等着吃官司吧。
开源数据别“裸用”:如果你用ImageNet、COCO这些开源数据做集训,先仔细看授权协议!有些协议要求“商用必须付费”,有些要求“修改后必须开源”,别以为免费下载就万事大吉,侵权了照样赔得你“嘶哈”的。
给投资人点建议吧,看AI项目,我建议第一句话必问“数据来源”。如果创始人支支吾吾说“我们有特殊渠道”,直接Pass吧,这种项目估值再高,也是空中楼阁里还放着定时炸弹,随时可能灰飞烟灭,你对LP咋交代?
2. 数据“处理”:脱敏不是“打马赛克”那么简单
某个做智能投资顾问的团队,为了合规,把用户身份证号中间几位换成了“*”,就觉得万事大吉了。
结果,被黑客攻击,泄露了50万条“脱敏数据”。
你猜怎么着?黑客通过“生日+手机号前三位+地域”这些“非敏感信息”,照样把用户身份扒得底朝天。
都是血淋淋的教训,数据脱敏不能“自欺欺人”,得做到“不可逆转”。比如,医疗数据,不仅要隐去姓名、身份证号,连病历里的“某医院某科室某年某月就诊”都可能成为“再识别”的线索。建议找专业机构做“差分隐私处理”,或者用“联邦学习”,数据不出本地,只共享模型参数,从源头降低风险。
再给投资人的提醒,别光看模型准确率,问问团队“数据安全怎么做的”。去年有家AI公司融了2个亿,结果因为数据泄露,估值直接砍了一半,当时牵头投资人欲哭无泪。

二、算法合规:别让你的AI“聪明反被聪明误”
算法是AI的“大脑”,但这个“大脑”要是没规矩,就可能变成“脱缰的野马”。歧视、偏见、操纵用户,轻则罚款,重则被要求下架产品。
1. 算法“透明度”:别把用户当傻子
某公司做的AI招聘工具,因为算法偷偷给“30+女性求职者”打分偏低,被曝光后股价暴跌。这就是典型的“算法歧视”,你以为藏在代码里没人知道?现在《算法推荐管理规定》明确要求“算法模型要可解释”,用户有权知道“为什么我没被推荐”,“为什么我的贷款被拒”……为什么我吃不到鱼。
所以,创业者最好还是给算法搞个“说明书”吧:比如AI风控模型,要能说清楚“哪些因素影响了评分”(收入、征信、还款记录),而不是一句“系统综合评估”就完事。
要定期做“算法审计”,找第三方机构检测有没有隐性偏见(比如对某地区、某职业、年龄段的歧视),别等用户告了才想起来整改,舆论+法律,你们扛不住。
对投资人来说,算法透明不仅是合规要求,更是产品的持续性竞争力(毕竟有时候,你还在桌上,没出事儿,你就是赢家)。而且用户会愿意为一个“可解释的AI”买单,而不是被一个“黑箱”支配,这一点,未来会越来越凸显和重要。
2. 生成式AI:“内容审核”是生死线
现在做生成式AI的团队多如牛毛,但我敢说起码还是有30%的猛人没重视《生成式AI服务管理暂行办法》。2023年8月15日起,所有生成式AI产品必须“先备案后上线”,不然就是违法。
举个例子:有家做AI写作的初创公司,为了抢市场,没备案就上线了产品,结果被用户用它生成了“虚假新闻”,结果就是直接被约谈,服务器关停。更惨的是,投资人本来要签Term Sheet,一看这情况,直接撤了,理由是“有合规风险,不可控”。
所以,各位创业者们,备案前先“自查”:训练数据有没有侵权?生成内容会不会涉及色情、暴力、虚假信息?最好建个“人工审核+AI过滤”的双重机制,别指望纯AI能搞定一切。
另外,千万别碰“敏感领域”,比如医疗、法律、金融这些行业,生成式AI的监管更严。比如你做AI医生助手,生成的诊断建议必须注明“仅供参考,不构成医疗决策”,不然出了医疗事故,你吃不了兜着走。
要是家属给我打电话说想吃鱼了,我可不手软。

三、知识产权:AI时代的“地盘战”,别让别人把你家底儿抄了
AI公司的核心资产是“模型+代码+数据”,但是但很多创始人连“专利怎么申请”、“商业秘密怎么保护”都搞不懂,等到被侵权了才发现自己忙活半天,桃儿被别人摘了,你说气不气。
1. 专利:别让你的“黑科技”变成“公共资源”
另外还有个做自动驾驶算法的团队,技术明明领先同行半年,结果因为没及时申请专利,被竞争对手抄了核心代码,反过来告他们“侵权”。最后官司打了两年,钱烧光了,公司也黄了,这就是典型的“专利意识淡薄”。
所以,各位创业者们,AI模型一定要申请“发明专利”。比如你的算法在“目标检测准确率”上有突破,就麻溜的申请专利,别等技术公开了再后悔。代码,也要做“著作权登记”:虽然著作权自创作完成时自动产生,但登记了才能在维权时拿出“铁证”,不然你说代码是你的,谁信?
所以看AI项目的投资人们,一定要知道专利的数量和质量是重要指标。一个连核心技术都不知道保护的团队,要么是不懂行,要么是对自己的技术没信心,这种项目,投了就是打水漂。
2. 商业秘密:核心人才“跳槽”,别让技术跟着跑了
这是我最近碰到的真实案例:某AI医疗公司的核心算法工程师跳槽到竞品,带走了训练好的模型参数和客户名单。公司想维权,结果发现没跟工程师签《竞业限制协议》,也没明确哪些信息是“商业秘密”。最后只能眼睁睁看着竞品用自己的技术抢市场。
事已至此,我只能给创业者们提供一个“留人秘籍”了。那就是竞业限制是要“给钱”的,别光让员工签协议,不支付竞业补偿,这种协议在法律上是无效的。补偿标准一般是员工离职前工资的20%-50%,按月支付,不然员工凭什么“两年内不能去竞品公司”?
此外,商业秘密要“上锁”。核心代码、数据、客户5620资料,要有严格的访问权限控制,比如“只有CTO能看完整模型,普通工程师只能接触部分模块”。定期给员工做“保密培训”,让他们知道“泄密是要坐牢的”(《刑法》第219条,侵犯商业秘密罪了解一下)。
再说说投资的角度,团队稳定性肯定要比技术更重要。如果一个AI公司的核心人才随时可能带着技术跑路,那它的估值再高也是“别人家的桃儿”,毕竟,AI行业,人才就是核心生产力。
四、融资合规:别让“钱”变成“催命符”
融资是AI公司的“生命线”,但很多创始人只想着“拿钱”,却忽略了融资过程中的合规风险。比如“股权代持”、“对赌协议”、“信息披露”,任何一个环节出问题,都可能让公司万劫不复。
1. 对赌协议:别为了“估值”赌上全部
“老莫,投资人给我估值3个亿,但要求签对赌,明年营收必须到6000万,不然我就得赔他钱,还要稀释股权!”
这是很多AI创始人的“甜蜜烦恼”。
我的建议是能不签对赌就不签,非要签,一定要“留余地”。AI项目的商业化周期本来就长,你为了一个虚高的估值,赌上“个人连带担保”,一旦完不成业绩,不仅公司没了,自己还得背上巨额债务,不值当。
比如去年就有个AI教育公司创始人,就是因为对赌失败,房子车子全被法院拍卖了。

五、刑事责任:AI创业者的“红线”,踩了就可能“进去”
很多创始人觉得“不合规就是罚罚款”,但在AI领域,有些合规问题可是会“坐牢”的。比如数据犯罪、算法滥用、商业贿赂,每一个都可能让你“从老板变阶下囚”。
1. “数据犯罪”:AI行业最高发的刑事风险
前面说的“非法获取公民个人信息罪”只是冰山一角。比如,去年杭州有个做AI催收的公司,为了催债,非法获取了债务人的“通话记录”“定位信息”,结果老板和技术负责人都因“侵犯公民个人信息罪”被判了3年。记住,数据越敏感,刑期越重(医疗数据、金融数据比普通信息量刑更严)。
老莫的避坑建议是建立“数据合规审查岗”:任何数据采集、使用,先让法务或外部律师审一遍,别凭感觉来。
别碰“灰色地带”:比如“爬虫”,即使网站没禁止,爬多了也可能构成“非法侵入计算机信息系统罪”;再比如“数据买卖”,哪怕你买的时候不知道数据是偷来的,只要“明知或应知”,照样要担责。
2. “算法滥用”:小心“帮信罪”找上门
现在有些AI公司为了赚钱,给“非法平台”提供技术支持。比如帮诈骗团伙开发“AI话术机器人”,帮赌博网站做“风控系统”。
你以为只是“技术服务”?大错特错!这可能构成“帮助信息网络犯罪活动罪”(简称“帮信罪”),最高可判3年。
案例:去年深圳有个做AI语音识别的团队,给一个“虚拟货币诈骗平台”提供技术支持,赚了200万服务费,结果平台被查,团队负责人直接被抓,200万再扣扣税,换了3年牢饭,值吗?
给各位一个忠告吧,接业务前,先查清楚客户是干嘛的。如果客户要求“绕过监管”、“隐藏数据来源”,赶紧拉黑,这种钱,宁可不赚,赎你出来都不够。

六、给投资人的“排雷指南”:这3类AI项目,再火也别投
我总结了3类绝对不能碰的AI项目,供各位投资人参考:
1. “数据来源说不清”的项目
创始人要么说“数据是合作伙伴给的,具体怎么来的不清楚”,要么说“我们有独家渠道,不方便透露”。这种项目,十有八九是数据不合规,投进去就是给自己埋雷。
2. “只谈技术,不谈合规”的团队
你问他“数据安全怎么做”,他说“技术领先就行,合规以后再说”;你问他“算法有没有偏见”,他说“AI就是要效率,管那么多干嘛”。这种团队缺乏“敬畏心”和“责任心”,迟早会栽在合规上。
3. “核心技术依赖外部”的项目
比如模型是基于开源框架改的,数据是买的第三方的,核心人才还没签竞业协议,这种项目没有“护城河”,随时可能被替代,估值再高也是“空中楼阁”。

合规不是“紧箍咒”,而是AI公司的“护身符”
老莫我最后说句掏心窝子的话,这几年AI行业太火了,很多人都想着“先上车后补票”,但合规这张“车票”,你要是不提前买,迟早会被“撵下车”。
我见过不少AI公司,因为合规综合问题:产品被被网信办责令下架、罚款100万起,产品直接停运;用户投诉内容违法、造谣、侵权,平台要承担连带责任,甚至刑事责任;违反《数据出境安全评估办法》,最高罚营业额5%,负责人可能被禁业;产品进不了美国/欧盟/中国医院,签1000万订单也等于零;估值从10亿砍到1亿。
但是我也见过不少团队,认知到了企业合规和风控全过程的重要性,不仅顺利拿到融资,还成了投资人眼中的“常青树”。毕竟,在监管越来越严的今天,“合规”已经成了AI公司的“核心竞争力”。
所以,别再闭门造车了!找个靠谱且垂直且性价比高且机动性强且能定制化服务的AI赛道律所合作(比如老莫我所在的律所就是专注于给AI企业提供全生命周期合规、风控和出海全过程陪跑服务),帮你把数据、算法、股权等等这些“坑”提前填上,你才能安心搞技术、做产品、抢市场、拿融资。(一句话:想吃鱼,找老莫!)
记住,真正的AI巨匠,不是在无边界中野蛮生长,而是在规则里游刃有余。这,才是AI创业的长久之道。
(觉得有用?转发给你身边的AI创业者,让他们少走点弯路。想具体聊聊你的项目合规问题?私信“合规初诊”)


往期推荐

日期
《待更新》
内容提要

日期
《待更新》
内容提要

日期
《待更新》
内容提要
夜雨聆风