几十秒筛完千亿分子,AI新药拿下FDA临床批件—

几十秒筛完千亿分子,AI新药拿下FDA临床批件——医疗AI的底座,这周立起来了

5月30日，天津。清华和天河超算的团队发布了GalaxyVS平台，千亿级分子库，几十秒筛完。全球第一次。

同一天，深圳。京东健康和广医一院（钟南山院士所在的医院）发布了国内首个4级认证的呼吸医学AI数据集。

5月31日，香港。晶泰控股发公告：旗下AI发现的实体瘤新药SIGX2649，提前拿到了FDA的临床试验批件。

三天，三件事。看起来不相关，但放在一起看——算力、数据、临床，医疗AI的三块基石，同时有了突破。

本期核心——清华+天河超算发布GalaxyVS平台，全球首次实现千亿级分子库秒级AI筛选，日吞吐量16万亿次分子对接，比国际纪录高6个数量级；京东健康联合广医一院（钟南山团队）发布呼吸医学AI数据集，国内首个通过信通院四级评估的高质量医疗AI数据资源；晶泰控股AI发现的泛TEAD抑制剂SIGX2649获FDA临床试验批件，成为AI制药从算法走向临床的最新案例。

千亿分子，几十秒筛完：这个速度意味着什么？

先解释一下GalaxyVS做了什么。

新药研发的第一步，是从海量分子中找出可能有效的候选分子。这个过程叫"虚拟筛选"（Virtual Screening）。

传统做法是：用计算机模拟每个分子和靶点蛋白的对接，计算亲和力，然后挑出排名靠前的做实验验证。

问题是分子太多了。

目前全球可合成、可商用的化合物空间，已经达到近千亿级别（10¹¹）。如果用传统分子对接方法，把这些分子挨个"对接"一遍，即使动用超级计算机，也需要数月甚至数年。

GalaxyVS把这个过程缩短到了几十秒。

来源：http://news.youth.cn/jsxw/202605/t20260530_16689223.htm（中国青年网，验证通过，2026-05-30发布）

不是简单的"加速"，是方法的"重构"

GalaxyVS的核心突破，不在于"算得更快"，而在于"算得不同"。

国家超级计算天津中心李培顺博士解释，GalaxyVS不是把旧方法搬到更大机器上——而是围绕近千亿级化学空间，**重构了一套"AI模型+超级计算+高性能检索+药物化学约束"的全流程平台**。

具体怎么做？

先解释DrugCLIP模型。这是清华大学智能产业研究院团队前期发在《科学》（Science）杂志上的模型。它的思路很巧妙：把蛋白口袋和小分子映射到同一个向量空间。原本的"逐一对接"问题，变成了"高维向量快速检索"问题。

形象地说：传统方法是你拿着钥匙（小分子），挨个去试每把锁（靶点蛋白）。DrugCLIP的方法是把钥匙和锁的特征都编码成向量，在向量空间里直接找"距离最近"的配对——不需要逐一尝试。

在算力端，团队基于YH-Torch智能计算框架，对DrugCLIP做了国产异构算力适配，替换了传统CUDA/GPU依赖。这意味着**不依赖英伟达也能跑**。

实测数据：

千级DSP节点**完成约400万个靶点口袋的高效编码

2万多个计算节点**并行检索

单次检索千亿分子库：**几十秒**

单个靶点口袋平均检索时间：**不到1秒**

日吞吐量：约16万亿次分子对接，比国际最先进纪录高出6个数量级

来源：https://finance.sina.com.cn/wm/2026-05-29/doc-inhzqccn7980786.shtml（新浪财经，验证通过，2026-05-29发布）

"分子库规模与银河系恒星数量相当"

国家超算天津中心首席科学家孟祥飞打了一个比喻：

"这个规模与银河系恒星数量相当。我们和清华团队合作，打造了全球最大的药物分子数据集——拥有1000亿级的分子。"

"这也意味着，未来想找一个分子是否可能成为药物，已经不需要去碰运气了。系统有可能直接计算出你需要的分子结构，直接去做实验。"

来源：http://news.youth.cn/jsxw/202605/t20260530_16689223.htm（中国青年网）

多家药企已经接入

多家药物研发机构和企业已在基于GalaxyVS平台开展工作。

据李培顺博士介绍，平台将为肿瘤、神经退行性疾病、新发传染病、罕见病等领域的先导分子发现提供全新路径。

更重要的是——在突发公共卫生事件中，GalaxyVS可以大幅提升药物研发响应速度。

这一点在新冠疫情期间已有教训：从病毒出现到找到有效药物，中间的时间窗口，直接决定了死亡人数。

来源：https://finance.sina.com.cn/wm/2026-05-29/doc-inhzqccn7980786.shtml（新浪财经，验证通过）

AI药物拿到FDA临床批件：AI不只是"设计"分子，还能让它"过审"

再说第二件事。

5月31日，港股上市公司晶泰控股（02228.HK）发布自愿性公告，宣布两项进展。

其中最重要的是：公司孵化企业希格生科研发的**泛TEAD抑制剂SIGX2649**，提前获得FDA新药临床试验（IND）批件。

SIGX2649是一种实体瘤靶向药，通过阻断Hippo-YAP/TAZ信号通路来抑制肿瘤增殖、转移和耐药。

临床前研究显示，它在多种肿瘤模型中表现出优异抗增殖活性，且肾靶向毒性低于同类在研药物。

这是晶泰体系内**第二条进入临床的创新药管线**。

来源：https://hk.stockstar.com/IG2026053100009825.shtml（证券之星，引用晶泰控股HKEX自愿性公告，2026-05-31发布）

为什么FDA的IND批件，是AI制药的"硬通货"？

AI制药行业有一个老问题：**实验室里再牛的分子，拿不到临床批件，就只是PPT上的数字**。

过去几年，AI制药公司讲了很多故事——"AI设计了XX万亿的分子库"、"AI发现了XX个新靶点"、"AI把药物发现时间从5年缩到18个月"。

但FDA的IND批件，是真正的考验。

IND是FDA对临床前数据包的全面审核——安全药理、毒理、CMC（化学、制造和控制），每一项都必须达到标准。

拿到IND，意味着可以在人身上做临床试验了。

不是AI生成的结果"看起来很美"，而是**经过了FDA全部审评流程的验证**。

晶泰正在用实际的临床批件证明：**AI不只能"设计"分子，还能让分子"过审"**。

来源：https://hk.stockstar.com/IG2026053100009825.shtml

晶泰的另一条线：AI多肽从"外用"到"食用"

除了临床批件，晶泰同一天还宣布了另一项进展。

公司依托AI多肽发现与优化平台PepiX，自主开发了创新多肽食品原料**Tensotide**，成功取得美国Self-GRAS认证。

这是晶泰在口服食品领域获得的首个国际安全认证。

Tensotide靶向能量代谢通路，抑制碳水化合物降解和吸收，已获中国发明专利并完成PCT国际申请。

取得Self-GRAS认证后，该原料可以合法进入美国食品市场和膳食补充剂领域。

这展示了AI+多肽赛道的另一种商业化可能——**不只是做药，还可以做健康消费品**。

来源：https://hk.stockstar.com/IG2026053100009825.shtml（验证通过）

第一个4级认证呼吸AI数据集：医疗大模型的"燃料"来了

最后说第三件事。

5月30日，在2026南山呼吸健康论坛上，京东健康联合广医一院（钟南山院士所在的国家呼吸医学中心）等单位，正式发布了**"呼吸医学人工智能数据集v1.0"**。

经中国信息通信研究院依据国家标准《高质量数据集质量评测规范》及行业标准评估，该数据集成为**国内首个通过权威4级评估的呼吸医学高质量数据资源**。

发布现场，钟南山院士、广医一院国家呼吸医学中心主任何建行教授等均出席站台。

来源：https://finance.jrj.com.cn/2026/05/30202757276635.shtml（金融界，验证通过，2026-05-30发布）

不是"信息罗列"，是训练AI的"临床思维"

跟常规数据集的"信息罗列"不同，这个数据集的目标很明确：**训练AI的临床思维，而不是病历录入**。

它覆盖常见、疑难呼吸系统疾病及高危人群，融合了电子病历、影像、肺功能、呼吸介入、病理等专科数据，贯穿入院评估、动态决策、出院随访等关键诊疗环节。

核心设计思路是：将复杂的临床决策点——比如证据整合、诊疗路径取舍、优先级排序——纳入评测体系，重点考查大模型在信息压力下的**下一步决策能力**。

说白了，这不是在考AI"能不能识别肺结节"，而是在考"看到这个病人的全部信息后，你下一步该做什么"。

这是临床医生每天都在面对的问题，也是目前医疗大模型最薄弱的环节。

来源：https://finance.jrj.com.cn/2026/05/30202757276635.shtml

已在真实门诊跑通：AI数字人预问诊+病历同步

数据集不是放在那里让人下载的。它已经在真实临床场景中跑起来了。

京东健康和广医一院在呼吸专科门诊探索了一条智能化闭环：

1. 患者挂号后，**AI数字人自动发起预问诊**，围绕主诉、现病史、过敏史等六类核心信息进行结构化采集，并分析院内外报告

2. 患者进入诊室前，一份**整理好的结构化病历已同步至医生工作站**

3. 形成"挂号触达→数字人问诊→健康史确认→报告上传分析→病历同步"的标准化流程

效果？医生从繁琐的录入工作中解放出来，把更多精力投入到核心诊疗判断。

来源：https://finance.jrj.com.cn/2026/05/30202757276635.shtml（验证通过）

安全闭环："虚拟患者训练—可信推理—专家评测"

医疗AI绕不开安全红线。

京东健康和广医一院的做法是构建了三层安全闭环：

第一层，虚拟患者训练：用合成数据训练AI应对各种临床场景。

第二层，可信推理：建立"症状→体征→检查→诊断→治疗"的证据逻辑，设有禁忌证识别与危急症状预警机制，确保所有输出可复核、可追溯。

第三层，全专家评测：由呼吸医学专家主导多维评测体系，AI在"发现问题→专家复核→策略修正"中持续进化。

这三个环节，对应了医疗AI的三个核心风险：幻觉、不可解释、无法纠错。

来源：https://finance.jrj.com.cn/2026/05/30202757276635.shtml

跟两年前比，最大的变化是：医疗AI的新闻，正在从"跑分"转向"跑临床"。

两年前，医疗AI的标题是"XX公司发布了XX大模型，在XX测试集上达到XX分"。

今天的标题是"XX平台把分子筛选时间从数月缩到几十秒""XX数据集拿到了国家级认证""XX药物拿到了FDA的临床批件"。

这个变化比任何单个技术突破都重要。

但，别急着开香槟

三个突破都很硬，但冷静下来看：

第一，GalaxyVS筛选出来的分子，还需要实验验证。虚拟筛选的命中率有多高？平台发布的分子有多少最终成为药物？这些问题目前没有答案。几十秒筛千亿分子很重要，但如果命中率不够，就是从"大海捞针"变成了"大海捞针快一点"。

第二，SIGX2649拿到IND只是开始。从IND到NDA（新药上市申请），临床成功率大约在10-15%。I期看安全，II期看有效，III期看优效——每一关都可能失败。

第三，呼吸AI数据集需要更多医院接入。单一医院的数据，再高质量，也存在选择偏倚。数据集要真正有价值，需要多中心、多地区的数据融合——而数据共享在医疗行业一直是个难题。

如果你在医疗AI行业，这三个信号值得关注

对做AI制药的团队：GalaxyVS的发布意味着分子筛选的"算力门槛"正在快速降低。如果你的差异化优势只是"我们筛得比别人快"，这个优势可能很快消失。真正的壁垒在靶点验证和临床开发能力。

对做医疗大模型的团队：京东健康的数据集案例说明，决定医疗大模型质量的，不是参数量大小，而是训练数据的质量。拿到高质量医疗数据集的能力，可能比模型架构本身更重要。

对投资人：晶泰的IND批件是一个信号——AI制药公司正在从"讲技术故事"进入"拿监管批件"的阶段。未来12-24个月，能拿到IND、能推进临床的AI制药公司，和只有平台没有管线的公司，估值差距会越拉越大。

最后聊一句

银河系有约1000亿颗恒星。

GalaxyVS里的分子库，规模与银河系恒星数量相当。

孟祥飞说，在这个平台上，"找分子不需要碰运气了"。

但药物发现从来不只是找分子。

找到了分子，还要在动物身上验证，在人身上验证，在几千人的III期临床试验中验证。

千亿分子里，能走到最后的，可能只有一个。

你觉得，医疗AI最大的瓶颈，是"找不到分子"，还是"验证不过来"？