5月30日,天津。清华和天河超算的团队发布了GalaxyVS平台,千亿级分子库,几十秒筛完。全球第一次。
同一天,深圳。京东健康和广医一院(钟南山院士所在的医院)发布了国内首个4级认证的呼吸医学AI数据集。
5月31日,香港。晶泰控股发公告:旗下AI发现的实体瘤新药SIGX2649,提前拿到了FDA的临床试验批件。
三天,三件事。看起来不相关,但放在一起看——算力、数据、临床,医疗AI的三块基石,同时有了突破。
本期核心——清华+天河超算发布GalaxyVS平台,全球首次实现千亿级分子库秒级AI筛选,日吞吐量16万亿次分子对接,比国际纪录高6个数量级;京东健康联合广医一院(钟南山团队)发布呼吸医学AI数据集,国内首个通过信通院四级评估的高质量医疗AI数据资源;晶泰控股AI发现的泛TEAD抑制剂SIGX2649获FDA临床试验批件,成为AI制药从算法走向临床的最新案例。
千亿分子,几十秒筛完:这个速度意味着什么?
先解释一下GalaxyVS做了什么。
新药研发的第一步,是从海量分子中找出可能有效的候选分子。这个过程叫"虚拟筛选"(Virtual Screening)。
传统做法是:用计算机模拟每个分子和靶点蛋白的对接,计算亲和力,然后挑出排名靠前的做实验验证。
问题是分子太多了。
目前全球可合成、可商用的化合物空间,已经达到近千亿级别(10¹¹)。如果用传统分子对接方法,把这些分子挨个"对接"一遍,即使动用超级计算机,也需要数月甚至数年。
GalaxyVS把这个过程缩短到了几十秒。
来源:http://news.youth.cn/jsxw/202605/t20260530_16689223.htm(中国青年网,验证通过,2026-05-30发布)
不是简单的"加速",是方法的"重构"
GalaxyVS的核心突破,不在于"算得更快",而在于"算得不同"。
国家超级计算天津中心李培顺博士解释,GalaxyVS不是把旧方法搬到更大机器上——而是围绕近千亿级化学空间,**重构了一套"AI模型+超级计算+高性能检索+药物化学约束"的全流程平台**。
具体怎么做?
先解释DrugCLIP模型。这是清华大学智能产业研究院团队前期发在《科学》(Science)杂志上的模型。它的思路很巧妙:把蛋白口袋和小分子映射到同一个向量空间。原本的"逐一对接"问题,变成了"高维向量快速检索"问题。
形象地说:传统方法是你拿着钥匙(小分子),挨个去试每把锁(靶点蛋白)。DrugCLIP的方法是把钥匙和锁的特征都编码成向量,在向量空间里直接找"距离最近"的配对——不需要逐一尝试。
在算力端,团队基于YH-Torch智能计算框架,对DrugCLIP做了国产异构算力适配,替换了传统CUDA/GPU依赖。这意味着**不依赖英伟达也能跑**。
实测数据:
千级DSP节点**完成约400万个靶点口袋的高效编码
2万多个计算节点**并行检索
单次检索千亿分子库:**几十秒**
单个靶点口袋平均检索时间:**不到1秒**
日吞吐量:约16万亿次分子对接,比国际最先进纪录高出6个数量级
来源:https://finance.sina.com.cn/wm/2026-05-29/doc-inhzqccn7980786.shtml(新浪财经,验证通过,2026-05-29发布)
"分子库规模与银河系恒星数量相当"
国家超算天津中心首席科学家孟祥飞打了一个比喻:
"这个规模与银河系恒星数量相当。我们和清华团队合作,打造了全球最大的药物分子数据集——拥有1000亿级的分子。"
"这也意味着,未来想找一个分子是否可能成为药物,已经不需要去碰运气了。系统有可能直接计算出你需要的分子结构,直接去做实验。"
来源:http://news.youth.cn/jsxw/202605/t20260530_16689223.htm(中国青年网)
多家药企已经接入
多家药物研发机构和企业已在基于GalaxyVS平台开展工作。
据李培顺博士介绍,平台将为肿瘤、神经退行性疾病、新发传染病、罕见病等领域的先导分子发现提供全新路径。
更重要的是——在突发公共卫生事件中,GalaxyVS可以大幅提升药物研发响应速度。
这一点在新冠疫情期间已有教训:从病毒出现到找到有效药物,中间的时间窗口,直接决定了死亡人数。
来源:https://finance.sina.com.cn/wm/2026-05-29/doc-inhzqccn7980786.shtml(新浪财经,验证通过)
AI药物拿到FDA临床批件:AI不只是"设计"分子,还能让它"过审"
再说第二件事。
5月31日,港股上市公司晶泰控股(02228.HK)发布自愿性公告,宣布两项进展。
其中最重要的是:公司孵化企业希格生科研发的**泛TEAD抑制剂SIGX2649**,提前获得FDA新药临床试验(IND)批件。
SIGX2649是一种实体瘤靶向药,通过阻断Hippo-YAP/TAZ信号通路来抑制肿瘤增殖、转移和耐药。
临床前研究显示,它在多种肿瘤模型中表现出优异抗增殖活性,且肾靶向毒性低于同类在研药物。
这是晶泰体系内**第二条进入临床的创新药管线**。
来源:https://hk.stockstar.com/IG2026053100009825.shtml(证券之星,引用晶泰控股HKEX自愿性公告,2026-05-31发布)
为什么FDA的IND批件,是AI制药的"硬通货"?
AI制药行业有一个老问题:**实验室里再牛的分子,拿不到临床批件,就只是PPT上的数字**。
过去几年,AI制药公司讲了很多故事——"AI设计了XX万亿的分子库"、"AI发现了XX个新靶点"、"AI把药物发现时间从5年缩到18个月"。
但FDA的IND批件,是真正的考验。
IND是FDA对临床前数据包的全面审核——安全药理、毒理、CMC(化学、制造和控制),每一项都必须达到标准。
拿到IND,意味着可以在人身上做临床试验了。
不是AI生成的结果"看起来很美",而是**经过了FDA全部审评流程的验证**。
晶泰正在用实际的临床批件证明:**AI不只能"设计"分子,还能让分子"过审"**。
来源:https://hk.stockstar.com/IG2026053100009825.shtml
晶泰的另一条线:AI多肽从"外用"到"食用"
除了临床批件,晶泰同一天还宣布了另一项进展。
公司依托AI多肽发现与优化平台PepiX,自主开发了创新多肽食品原料**Tensotide**,成功取得美国Self-GRAS认证。
这是晶泰在口服食品领域获得的首个国际安全认证。
Tensotide靶向能量代谢通路,抑制碳水化合物降解和吸收,已获中国发明专利并完成PCT国际申请。
取得Self-GRAS认证后,该原料可以合法进入美国食品市场和膳食补充剂领域。
这展示了AI+多肽赛道的另一种商业化可能——**不只是做药,还可以做健康消费品**。
来源:https://hk.stockstar.com/IG2026053100009825.shtml(验证通过)
第一个4级认证呼吸AI数据集:医疗大模型的"燃料"来了
最后说第三件事。
5月30日,在2026南山呼吸健康论坛上,京东健康联合广医一院(钟南山院士所在的国家呼吸医学中心)等单位,正式发布了**"呼吸医学人工智能数据集v1.0"**。
经中国信息通信研究院依据国家标准《高质量数据集质量评测规范》及行业标准评估,该数据集成为**国内首个通过权威4级评估的呼吸医学高质量数据资源**。
发布现场,钟南山院士、广医一院国家呼吸医学中心主任何建行教授等均出席站台。
来源:https://finance.jrj.com.cn/2026/05/30202757276635.shtml(金融界,验证通过,2026-05-30发布)
不是"信息罗列",是训练AI的"临床思维"
跟常规数据集的"信息罗列"不同,这个数据集的目标很明确:**训练AI的临床思维,而不是病历录入**。
它覆盖常见、疑难呼吸系统疾病及高危人群,融合了电子病历、影像、肺功能、呼吸介入、病理等专科数据,贯穿入院评估、动态决策、出院随访等关键诊疗环节。
核心设计思路是:将复杂的临床决策点——比如证据整合、诊疗路径取舍、优先级排序——纳入评测体系,重点考查大模型在信息压力下的**下一步决策能力**。
说白了,这不是在考AI"能不能识别肺结节",而是在考"看到这个病人的全部信息后,你下一步该做什么"。
这是临床医生每天都在面对的问题,也是目前医疗大模型最薄弱的环节。
来源:https://finance.jrj.com.cn/2026/05/30202757276635.shtml
已在真实门诊跑通:AI数字人预问诊+病历同步
数据集不是放在那里让人下载的。它已经在真实临床场景中跑起来了。
京东健康和广医一院在呼吸专科门诊探索了一条智能化闭环:
1. 患者挂号后,**AI数字人自动发起预问诊**,围绕主诉、现病史、过敏史等六类核心信息进行结构化采集,并分析院内外报告
2. 患者进入诊室前,一份**整理好的结构化病历已同步至医生工作站**
3. 形成"挂号触达→数字人问诊→健康史确认→报告上传分析→病历同步"的标准化流程
效果?医生从繁琐的录入工作中解放出来,把更多精力投入到核心诊疗判断。
来源:https://finance.jrj.com.cn/2026/05/30202757276635.shtml(验证通过)
安全闭环:"虚拟患者训练—可信推理—专家评测"
医疗AI绕不开安全红线。
京东健康和广医一院的做法是构建了三层安全闭环:
第一层,虚拟患者训练:用合成数据训练AI应对各种临床场景。
第二层,可信推理:建立"症状→体征→检查→诊断→治疗"的证据逻辑,设有禁忌证识别与危急症状预警机制,确保所有输出可复核、可追溯。
第三层,全专家评测:由呼吸医学专家主导多维评测体系,AI在"发现问题→专家复核→策略修正"中持续进化。
这三个环节,对应了医疗AI的三个核心风险:幻觉、不可解释、无法纠错。
来源:https://finance.jrj.com.cn/2026/05/30202757276635.shtml
跟两年前比,最大的变化是:医疗AI的新闻,正在从"跑分"转向"跑临床"。
两年前,医疗AI的标题是"XX公司发布了XX大模型,在XX测试集上达到XX分"。
今天的标题是"XX平台把分子筛选时间从数月缩到几十秒""XX数据集拿到了国家级认证""XX药物拿到了FDA的临床批件"。
这个变化比任何单个技术突破都重要。
但,别急着开香槟
三个突破都很硬,但冷静下来看:
第一,GalaxyVS筛选出来的分子,还需要实验验证。虚拟筛选的命中率有多高?平台发布的分子有多少最终成为药物?这些问题目前没有答案。几十秒筛千亿分子很重要,但如果命中率不够,就是从"大海捞针"变成了"大海捞针快一点"。
第二,SIGX2649拿到IND只是开始。 从IND到NDA(新药上市申请),临床成功率大约在10-15%。I期看安全,II期看有效,III期看优效——每一关都可能失败。
第三,呼吸AI数据集需要更多医院接入。单一医院的数据,再高质量,也存在选择偏倚。数据集要真正有价值,需要多中心、多地区的数据融合——而数据共享在医疗行业一直是个难题。
如果你在医疗AI行业,这三个信号值得关注
对做AI制药的团队:GalaxyVS的发布意味着分子筛选的"算力门槛"正在快速降低。如果你的差异化优势只是"我们筛得比别人快",这个优势可能很快消失。真正的壁垒在靶点验证和临床开发能力。
对做医疗大模型的团队: 京东健康的数据集案例说明,决定医疗大模型质量的,不是参数量大小,而是训练数据的质量。拿到高质量医疗数据集的能力,可能比模型架构本身更重要。
对投资人:晶泰的IND批件是一个信号——AI制药公司正在从"讲技术故事"进入"拿监管批件"的阶段。未来12-24个月,能拿到IND、能推进临床的AI制药公司,和只有平台没有管线的公司,估值差距会越拉越大。
最后聊一句
银河系有约1000亿颗恒星。
GalaxyVS里的分子库,规模与银河系恒星数量相当。
孟祥飞说,在这个平台上,"找分子不需要碰运气了"。
但药物发现从来不只是找分子。
找到了分子,还要在动物身上验证,在人身上验证,在几千人的III期临床试验中验证。
千亿分子里,能走到最后的,可能只有一个。
你觉得,医疗AI最大的瓶颈,是"找不到分子",还是"验证不过来"?
夜雨聆风