色谱质谱,物性表征测试(可合作),实验耗材,技术培训
🤖 APP-ID技术指南
机器学习增强分子网络鉴定未知PFAS
基于Science Advances 2024突破性研究的实验技术完全解析
全氟和多氟烷基物质(PFAS)被称为"永久化学品",因其极强的碳-氟键而在环境中持久存在。全球已注册的PFAS化合物超过700万种,但绝大多数因商业机密保护而未公开结构,加之环境转化产生的未知衍生物,传统靶向分析方法已难以应对这一挑战。南京大学团队开发的APP-ID平台(Automatic Per- and Polyfluoroalkyl Identification)通过分子网络+机器学习的双重引擎,实现了对未知PFAS的高通量自动鉴定,为环境暴露组学研究提供了革命性工具。

▲ PFAS全球污染分布:野生动物与人类均面临暴露风险
1为什么传统平台无法胜任PFAS鉴定?
现有的非靶向筛选平台(如GNPS、CFM-ID、MetFrag、SIRIUS)主要针对代谢物和天然产物设计,其训练数据来源于GNPS、NIST 17、MassBank等数据库。然而,这些数据库中PFAS的质谱数据极为稀缺,导致三大致命缺陷:
❌ 结构覆盖不足:现有平台无法识别不在结构数据库中的"未知-未知"PFAS
❌ 谱图相似度算法偏差:传统算法(如点积、熵相似度)对PFAS特征碎片不敏感,假阳性率高达2.4%-46%
❌ 人工依赖过重:结构注释高度依赖专家经验,手动鉴定耗时且难以规模化
因此,亟需一种专为PFAS定制、能够自动发现未知类别、且具备低假阳性率的鉴定平台。
2APP-ID平台架构:双引擎驱动
APP-ID由两大核心模块构成:PFAS_Link(分子网络构建)和PFAS_ID(结构鉴定)。整个流程采用迭代循环设计:从已知PFAS种子出发,逐轮发现邻居节点并鉴定结构,新鉴定的PFAS又成为下一轮种子,直至无新化合物发现。
🔗 PFAS_Link:专为PFAS设计的分子网络
传统分子网络(如GNPS)使用通用谱图相似度算法,但PFAS的碎片强度即使结构相似也差异巨大,且常见中性丢失(如CO₂、SO₃)和非PFAS化合物共享,导致大量假阳性连接。
团队开发的Flink算法引入三项关键改进:
Flink算法三大核心改进:
① 碎片峰匹配比率:弱化峰强度影响,关注匹配碎片数量占比
② 中性丢失匹配:引入PFAS特征中性丢失(如CO₂+HF、CF₂丢失)
③ 排除通用碎片/中性丢失:剔除m/z<100的通用碎片(保留SO₃F⁻、SO₂F⁻等PFAS特征离子),将假阳性率从35%降至0.7%
在相似度阈值0.5条件下,Flink的假阳性率(0.7%)远低于DP(3.9%)、Entropy(2.4%)、HSS、Bonanza、GNPS等算法(均>25%),同时保持90%的真阳性连接率。

▲ 双层同系物网络策略: suspect分析与非靶向分析协同鉴定PFAS
🧠 PFAS_ID:机器学习驱动的结构鉴定
PFAS_ID模块解决"已知-未知"和"未知-未知"PFAS的结构注释难题。其核心创新在于精确搜索+转化搜索的双轨候选检索策略:
精确搜索(Exact Search):基于MS1精确质量和同位素分布(IsoSpecPy计算,质量误差5 ppm,同位素阈值0.8),从PubChem(695万结构,排除<3个F的化合物)和自建数据库(6484种常见PFAS)检索候选结构。
转化搜索(Transformation Search):假设未知PFAS由已知PFAS经环境/工业过程转化而来。基于母结构质量+质量偏移(mass shift)生成候选,支持F₂加成/丢失、CF₂丢失、H/F/Cl取代等20种高频转化模式,其中12种为KEGG数据库未收录的新型PFAS转化路径。
候选结构排名依赖支持向量机(SVM)预测的分子指纹相似度。团队使用194种PFAS的MS2谱训练了254个独立的SVM模型(每个指纹位点一个模型),以谱图与训练集的Flink相似度作为输入特征。SVM在测试集上达到90.0%的中位准确率和81.8%的F1分数,显著优于逻辑回归、贝叶斯、决策树、随机森林、KNN和人工神经网络。

▲ 机器学习PFAS管理应用框架:从数据采集到模型部署的全流程
3实战应用:从氟化工废水到全球暴露图谱
研究团队将APP-ID应用于江苏常熟某氟化工园区的废水样品(进水+出水),采用LC-HRMS(Thermo Q Exactive Focus,C18色谱柱,2 mM乙酸铵水/甲醇梯度,ESI负离子模式)采集数据。
📊 惊人发现:APP-ID在进水中鉴定出431种PFAS(14轮迭代),出水中442种(9轮迭代),远超传统谱库匹配(仅18-16种)。分子网络使鉴定数量提升24-28倍。
在总计733种PFAS特征中,130种获得高置信度结构(Level 1-3),涵盖31个类别:
• Class 1:受限制的传统PFAS(如PFOA、PFOS)
• Class 2-14:已报道的新兴PFAS
• Class 15-31:本研究首次发现的17类未知PFAS,包括ω-H,Cl-PFCA(氯代氢代全氟羧酸)等
以ω-H,Cl-PFCA为例:通过转化搜索从Cl-PFCA母结构经+H、-F转化推导,其MS2显示诊断性碎片[M-CO₂-HF]⁻,同系物从C₇延伸至C₁₆,保留时间随碳链增长线性递增,被赋予Confidence Level 2b(诊断证据支持)。该类化合物此前从未在环境介质中报道。

▲ PFAS串联质谱结构解析:特征中性丢失(如CO₂+HF)是结构推导的关键线索
4回溯筛查:未知PFAS的全球流行
为验证APP-ID发现的PFAS是否具有全球普遍性,团队利用MASST(Mass Spectrometry Search Tool)对MassIVE公共数据库中20个国家的样品进行回溯筛查。
在126个回溯匹配的PFAS特征中:8种为传统PFAS,37种为新兴PFAS,而81种(64%)为此前未报道的未知PFAS。这些化合物广泛分布于美国(113个特征)、英国(22个)、德国(8个)、中国(8个)、印度(3个)、巴西(10个)等国家的环境样品和人体样品中。
这一结果触目惊心:未知PFAS的污染程度与传统PFAS相当,但其环境行为与毒性数据几乎空白。APP-ID的问世,使得这些"隐形威胁"首次被系统性地纳入监测视野。

▲ PFAS分子网络实例:节点大小代表连接度,边粗细代表谱图相似度
5实验操作要点与最佳实践
🧪 样品前处理
水样经0.22 μm滤膜过滤后,加入内标,通过固相萃取(SPE)浓缩至1 mL甲醇。建议采用三种不同填料的小柱组合,以覆盖不同极性的PFAS。样品于-20°C保存,避免反复冻融。
📊 仪器分析参数
LC-HRMS推荐参数:
• 色谱柱:ACQUITY UPLC BEH C18 (2.1×150 mm, 1.7 μm)
• 流动相:A=2 mM乙酸铵水,B=甲醇;梯度:0-1 min 10%B → 1-36 min 10-100%B → 36-50 min 100%B
• 流速:0.3 mL/min;柱温:40°C;进样量:10 μL
• 质谱:ESI负离子模式;Full Scan分辨率70,000;ddMS2分辨率17,500
• 喷雾电压:-2.5 kV;毛细管温度:320°C;辅助气温度:413°C
• 碰撞能量:NCE -35±15;隔离窗口:1.0 Da
💻 数据处理流程
1. 峰提取:使用MS-DIAL 4.18,质量误差0.01 Da,保留时间容差0.5 min
2. PFAS预筛选:保留CF₂归一化质量缺陷>0.85或<0.15的峰,剔除空白对照峰面积3倍以下的干扰峰
3. 加合物注释:识别[2M-H]⁻、[M-CO₂-H]⁻等加合物,排除冗余种子
4. 共流出峰注释:在0.5 min RT容差和DP≥0.7条件下标记共流出峰,排除源内碎片干扰
5. 迭代网络构建:Flink相似度阈值≥0.5,至少1个匹配峰方可连接
🔍 结构注释置信度分级
Level 1:标准品匹配确认(15种)
Level 2a:谱库匹配确认(18种)
Level 2b:诊断证据支持(同系物规律、特征碎片、同位素分布等,90种)
Level 3:推测结构(7种)

▲ 机器学习在PFAS研究中的应用领域:从毒性预测到治理优化
🎯 展望:从发现到治理的闭环
APP-ID平台的诞生标志着PFAS研究从"靶向清单监测"迈入"全谱暴露组学"时代。其技术价值不仅在于发现了17类全新PFAS,更在于建立了一套可复用的数据驱动鉴定范式——Flink算法可推广至其他化合物类别,转化搜索策略为环境转化产物的发现提供了通用框架。
对于实验室研究者,建议关注以下要点:① 建立实验室专属的PFAS谱库;② 定期更新转化规则库;③ 结合合成标准品验证Level 2b结构;④ 利用MASST等公共工具开展回溯流行病学研究。唯有将技术发现转化为监管行动,才能真正遏制"永久化学品"对人类与生态的持续侵蚀。
加入仪器分析前沿资料信息库,
送质谱学堂代谢组学分析手册

最近建的可以薅羊毛的有关色谱质谱科研内容的小圈子

···························································································································
仪器分析学苑是,致力于为广大科研工作者、技术人员和学生提供丰富的仪器分析知识、实验技巧和行业动态,可以获取您想要的技术文档,测试优惠,实验耗材,尤其对照品和塑料制品,目前开发了免费质谱工具和质谱解谱软件,低价加入小圈子可获取持续更新仪器学习科研资料http://s.a0j.top/C8dcMnC/CBETB
2.包年咨询,仪器分析学苑知识星球
https://t.zsxq.com/0fi0l3WGy

加入仪器分析知识星球包年服务福利:

加入星球福利二:质谱辅助与解谱软件 ms assistant

随着资料逐渐增加,会员人数逐渐增多,每隔半年,星球价格会依据情况相应上浮,早加入,早享受,等待就是成本!
星球价格,不过一顿饭,但是星球却可以持续的给你提供价值,助力市场开拓,销售增长,职场提升。还能扩大行业链接,增加创富可能!
此外仪器分析学苑 可以提供VIP贵宾服务:
专家社群咨询【送知识星球】
2. 个人咨询(单次和一对一):液相质谱方法开发,empower软件,masslynx软件,unifi软件 qsight simplicity, waters,安捷伦,ab,pe液质联用技术,分子网络GNPS

相关的群聊:
盖独学难成, 唯友为益也,我们给大家建立了一个学习,交流,资源的专业分享平台,群里除了日常可以提问,大神会帮助解答以外,群中还有很多老师分享的文档、资料、书籍,绝对让你受益匪浅!为了防止机器人和无关人员加入:现有两种进群方式
行业动态,职业发展【科学家雄鹰计划】目前分为分析,制剂,生物三个板块【行业大佬背书】
加入一: 分析科学家雄鹰计划群聊a与b,已经超过200人,有大量资源,现转为收费群(19.9),
加入二:9.9元红包,直接入分析科学家雄鹰计划群C,生物科学家雄鹰计划A与制剂科学家雄鹰计划A,关注加星标公众号,在看点赞,转发公众号任意文章在朋友圈3h不删除,邀请入群

测试平台:

实验室生化环材耗材一站实服务,日常耗材,通用仪器
兰杰柯商城https://mall.labgic-ljk.com/,私聊下单,会员可有折扣或福利,优势代理,比克曼,白鲨等,代谢蛋白前处理耗材,其他材料
2. 对照品
20w种有证生化环标准物质bepure(特色同位素液标)https://www.bepurecrm.com/
有证杂质质控:https://www.cato-chem.com/
甄准https://www.zzsrm.cn/ 其他:中药 低聚糖 农残兽药脂质优势代理
3.化学中间体与材料供应
4 复杂中药定性定量测试分析,质谱解谱,代谢组【非靶广靶靶向空间代谢组】,蛋白组,分子网络培训,物性检测SEM ,冷冻SEM,XRD,DSC,TG,ITC,BET等
支持代购分子物质与生化试剂代理品牌:麦克林,阿拉丁,targetmol,sigma, 科进 洁特 耐思 碧云天 索莱宝 凯基 麦迪康 施睿康 源叶 三鹰 江莱 亚科因 陶术 Absea Apexbio,酶免,艾迪生欢迎咨询等

基于公众号的国内首个科研问答智能体上线了。
大家关注公众号这么久,有些知识搜不到,或者需要找色谱质谱科研资料,我们训练了几十本色谱质谱书籍及包括上千篇公众号文章,而且不断更新,现在关注公众号,后台发送需要提问问题,或者使用公众号中仪器分析学苑智能体小程序,就可以问答知识,快速找资料了 ,更多咨询问题和资料请关注仪器分析学苑知识星球
部分来源于互联网,B站,公众号等
END
声明:本公众号所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。所有文章仅代表作者观点,不代表本站立场。
夜雨聆风