我们在尽调现场反复听到一句话:"不是不想做尽调,是不知道从哪下手。"
对方说手上有五十项核心专利,是真的吗?对方自称行业前三,有依据吗?对方公司股权穿透到底,实际控制人到底有没有风险?
你打开企查查,翻两页股权结构,脑子已经晕了。再去欧洲专利局搜专利,Google Scholar查论文,各大网站刷舆情——三天过去了,你还在第一家公司上打转。
今天给大家介绍一套全新的工作方法——人工智能体全面尽职调查系统。它不是帮你"搜索",而是帮你"串联"。从企查查拿一张"身份证",然后带着这张身份证去全球专利池、学术数据库、新闻网站自动跑一遍,回来给你一张问题清单。
三天的工作,现在三小时完成。剩下的时间,你用来问那些真正重要的问题。
工具包里有什么
先认识一下我们要用到的几样东西。它们都不是什么神秘武器,大多数有免费接口,部分第三方工具花几十块钱一个月就能用:
1.企查查(或同类工商数据平台)
提供工商信息、股权穿透、司法诉讼、经营异常、社保人数等。核心输出:企业名称 + 统一社会信用代码——整个尽调的"身份证号",后面所有检索都靠它们锁定目标。
www.qcc.com
2.欧洲专利局 Espacenet Open API(OPS)
覆盖全球1.4亿份专利文献,免费开放调用,管"全"。用企查查拿到的企业名称去搜,返回专利标题、法律状态、同族信息、引用关系。
www.epo.org/ops
3.Google Patents
更新速度快,管"新"。谷歌专利没有开放API直接调用,需借助第三方工具自动化抓取和格式化。
patents.google.com
4.SerpApi
通用搜索API,可调用Google Scholar检索学术论文,也可做舆情扫描和新闻检索。评估企业研发实力和市场声誉。
serpapi.com
5.Firecrawl
大规模网页抓取工具,搜索并抓取企业官网、产品页面、新闻中心,提取最新动态。处理JavaScript渲染,绕过反爬虫限制。
www.firecrawl.dev
6.ScraperAPI
反爬虫突破工具,代理轮换、验证码处理、浏览器渲染、地理定位。据评测显示,成功率76%以上。
www.scraperapi.com
7.Apify
自动化编排引擎,38000+预构建Actors,将多个数据源串联成自动化处理流水线。云端执行,自动扩展。
apify.com
1 打地基——企查查是唯一的数据起点
怎么用
拿到一个公司名,不要百度,不要乱搜。直接打开企查查,把能拉的数据全拉出来。盯住三个关键指标:
实控人穿透。股权往上追到自然人。如果实控人同时在七家公司任职,其中一家两年前被吊销营业执照——标红。
硬伤扫描。司法诉讼里有没有当了被告还没了结的案子?有没有股权冻结记录?有没有行政处罚堆了好几页?不是所有诉讼都叫风险,但当了被告且金额大的,一定要追问到底。
社保人数趋势。企查查上的社保人数是企业向工商报的年报数据。把近三年数字拉成一条线看趋势。三年没变过不一定是稳定,可能是填报的人懒得改。如果从200降到150再降到80,你不需要等财务数据就知道发生了什么——这个数据比财务数据更难造假,因为它跟税务挂钩。
为什么必须从企查查开始
这里有一个关键认知——
企查查提供的企业名称和统一社会信用代码,是整个尽调过程的"唯一标识"。后续所有API——欧专局、Google Patents、SerpAPI——都需要先知道"查哪家企业",才能去检索专利、论文、新闻。
没有这个唯一标识,你搜一个模糊的公司名,欧专局可能返回几十个重名或缩写的申请人,谷歌专利可能混进完全不相关的文献,新闻检索可能把同名不同行的企业信息全搅在一起。你花半天筛出来的结果,可能一半是别人的。
企查查报告不是数据源之一,它是所有其他数据源的索引和钥匙。它告诉你这家公司确切叫什么、信用代码是多少、旗下有哪些子公司和曾用名。这些信息输入到每一个后续API里,才能保证你搜到的每一条专利、每一条新闻、每一个风险信号,都是属于你要查的那家公司的。
2 验证技术——两条线交叉检索专利
怎么用
如果考察的是技术型公司,对方PPT里写着"核心专利87项",必须做专利交叉检索。人工智能体拿着企查查报告里的企业名称和统一社会信用代码,同时接两个数据源:
欧洲专利局Espacenet Open API。覆盖全球1.4亿份专利文献,管"全"。用企查查提供的企业名称及曾用名、关联公司名作为申请人关键词检索,返回结构化数据:专利标题、法律状态、IPC分类号、同族专利信息、引用关系。
Google Patents + 第三方自动化工具。更新速度快,管"新"。通过Firecrawl或ScraperAPI做自动化抓取和格式化,同样用企查查提供的企业名称作为检索入口,确保搜到的每一件专利都属于目标公司。
两条线跑完之后做一件事:把企查查的知识产权列表、欧专局结果、谷歌专利结果三份数据放在一起对。87项对出72项,差的15项在哪?三种可能:申请中未公开、已失效被重复统计、外观设计和实用新型被统称为"专利"。不管是哪一种,都是你接下来必须追问的问题。
为什么要两条线同时查
欧专局搜得全,但更新有延迟。谷歌专利更新快,但覆盖不如欧专局系统。两个数据库的信息天然有差异——这个差异本身就是最有价值的信号。只用一个数据源,你会得到一个"完整"的数字,但不知道它是不是真的完整。两个同时查,矛盾自然暴露。尽调的核心不是"找到答案",是"发现问题"。
3 按风险方向,开对应的数据源
怎么用
不是每一家公司都需要把全部数据源开一遍。注册资本一百万的小公司不需要去全球专利池里捞。纯做外贸的贸易商没必要看学术论文。根据前两步看到的东西,决定接下来开哪个方向:
看舆情——消费品牌或面向C端的企业,用SerpAPI扫描新闻、投诉平台、社交媒体。检索时用企查查提供的企业名称加上负面关键词组合搜索。不要看正面,盯住负面信号。
看学术——技术型企业,用SerpAPI的Google Scholar功能检索论文发表情况。评估研发实力,看企业有没有真正的技术沉淀。
看招聘——对方声称正在快速扩张的,去招聘平台看公开数据。发布了什么岗位、薪资区间、招聘量变化。招聘量暴增可能是真扩张也可能是补流失。结合社保人数一起看,矛盾立刻浮现。
看动态——用Firecrawl抓取企业官网、产品页面、新闻中心,获取最新的产品发布、融资动态、团队变化等信息。
为什么要跟着风险走而不是跟着数据源走
尽调最容易被忽略的原则——成本收益比。你把一家注册资金一百万的小公司翻个底朝天,尽调费用比标的还高,这事本身就说明决策模型出了问题。好的尽调是"够用",不是"穷举"。够用的标准是:你把最可能出问题的那几个维度查透了。人工智能体能开七层数据,你只开跟风险对得上那几层。这是尽调者的判断力,也是AI替代不了的东西。
4 读报告,只看矛盾信号
怎么用
人工智能体把报告生成之后,页数可能很多。跳过所有"公司简介""行业概述""发展前景"——这些是水文。水文的特征:没有可验证的事实、看完你对这家公司的认知没有变化、找不到可追溯的原始出处。
直接翻到矛盾信号那一栏。它大概长这样:
▍矛盾信号 1
企查查显示目标公司(统一社会信用代码:XXXXXX)专利数量87项。欧洲专利局Espacenet以该企业名称及曾用名检索,返回72项。谷歌专利通过Firecrawl以同一标识检索,返回69项。三方数据不一致,差额15至18项。建议核实:差额专利是否处于申请未公开状态?是否存在已失效专利被重复统计?
▍矛盾信号 2
公司宣传材料称"研发团队百人规模"。以企业名称通过SerpAPI的Google Scholar检索学术论文,近三年仅发表5篇,且第一作者多来自合作机构。建议核实:核心研发团队是否实际到位?技术成果归属是否存在争议?
▍矛盾信号 3
企查查显示无重大诉讼记录。以统一社会信用代码通过Firecrawl抓取企业官网,发现"法律声明"页面注明"与XX公司的专利纠纷正在审理中"。建议核实:诉讼未在工商系统更新?企业刻意隐瞒?
注意每条矛盾信号的结构:都包含数据A是什么、数据B是什么、它们哪里对不上、检索时用的统一标识是什么。可追溯,可复现,不靠猜。
为什么要只看矛盾
因为公开数据天生是失真的。企查查的社保人数来自企业自己申报的年报,很多公司填的时候根本没人去数人头。专利数量跟技术实力是两码事,中国一年几百万件专利授权,真正有技术含量的发明占比不到两成。舆情可能被操纵,正面新闻是通稿,负面新闻可能是竞品在搞事。
更危险的是:当你把这些本来就失真的数据交叉验证的时候,可能不是在逼近真相,而是在用多个失真的信号互相印证一个假象。企查查说社保稳定,招聘网站在大量招人——你觉得经营正常。实际上社保稳定是因为年报没更新,招聘岗位是常年僵尸岗,公司已经三个月没发工资。
数据失真的问题,AI解决不了,谁也解决不了。但AI能做一件事:把矛盾标出来。它的输出不是一份漂亮完整的报告,是一张问题清单。这张清单的价值不在"帮你做判断",在"帮你发现哪里值得追问"。
5 追问、追问、追问
怎么用
人工智能体把矛盾信号标出来之后,轮到你了。拿着这张问题清单去跟对方做访谈。不要问"你们有什么优势",直接问:
"你们说有87项专利,但我们以你们的统一社会信用代码和公司全名,在欧洲专利局和谷歌专利只查到72项和69项。差的十几项在哪?"
"你们说研发团队百人,但学术论文检索显示近三年只发表了5篇,而且第一作者都不是你们的人。核心技术是不是你们的?"
"企查查没有诉讼记录,但你们官网写着跟XX公司的专利纠纷正在审理。这个纠纷为什么不披露?"
问完之后,看着对方的眼睛,听他怎么回答。回答的速度、细节、逻辑是不是自洽——这些AI永远判断不了,只有你能。
为什么要追问
好的尽调,百分之八十的时间花在问问题上。不好的尽调,百分之八十的时间花在百度搜资料上。人工智能体帮你省掉的,就是搜资料那百分之八十。但它不能、也不应该替你省掉追问那百分之二十。
因为尽调的本质从来不是"拿到数据",而是"降低信息不对称"。数据是对称的——你能查到,对方也知道你能查到。真正的不对称,藏在对方回答问题的语速、犹豫和微表情里。这些东西,至少到目前为止,还没有AI能抓取。也最好不要有。
工具链串联逻辑
最后帮大家梳理一下整套工具链的串联逻辑:
企查查提供企业名称和统一社会信用代码,这是所有后续检索的唯一标识和数据起点。欧洲专利局Espacenet Open API和Google Patents(通过Firecrawl/ScraperAPI)用这个唯一标识去全球专利池里交叉比对技术资产。SerpAPI用同一个标识去扫描学术论文、舆情、新闻。Firecrawl用企业官网URL抓取最新动态和公开声明。所有数据回到统一标识下交叉验证,矛盾自然暴露。你拿着矛盾信号去追问,完成尽调的最后一步。
工具是现成的,方法是清晰的,串联的逻辑就这么简单。人工智能体帮你做的,是搜资料那百分之八十——自动化采集、交叉验证、矛盾标注。
剩下的百分之二十——追问、判断、决策——永远在你的手里。
大浪街道知识产权工作站为您提供全链条质量提升,涵盖:
知识产权|品牌 | 商业秘密| 质量 | 体系| 标准|企业交流|人才培养等

如有需求,扫码联系(添加请注明来意)
喜报工作站荣获第七届“圳治一-对话AI”暨高质量发展“改革创新”类优秀案例
【南方日报专题报道】大浪街道:聚力“百千万工程”,五位一体陪伴企业成长【南方日报专题报道】大浪街道:聚力“百千万工程”,五位一体陪伴企业成长
夜雨聆风