乐于分享
好东西不私藏

小分子批处理、结构识别与可视化工具

本文最后更新于2026-03-13,某些文章具有时效性,若有错误或已失效,请在下方留言或联系老夜

小分子批处理、结构识别与可视化工具

工具介绍1:SMILES批处理、结构识别

我之前做模拟的时候,分子结构总是各个平台倒来倒去,有时候只有SMILES,有时候希望xyz文件转化为SMILES,起码好几个软件。

虽然ChemOrchestra平台本身是设计来做分子设计与模拟的,但提供的分子输入模块也能作为分子结构处理工具。访问地址:

https://www.quantabricks.xyz

如果结构转换或者可视化不需要走后端服务器,则无需登录,直接就可以操作。如果遇到需要提交到服务器的情况,需要点击右侧控制面板的run按钮。我把功能与费用做成表格供大家参考:

功能
批量处理
需要登录 / 运行
费用
SMILES → .xyz
0.1 Tokens(转化200个)
.xyz(.sdf)→ SMILES
0.0 Token
PDB → 序列
获取 PDB
SMILES → 图片(及 xlsx)
图片 → SMILES
0.3 Tokens
可视化 .xyz(.sdf)
可视化 SMILES
PDB 精修
0.1–0.2 Tokens
手绘分子 → SMILES

由于每个新注册用户有5个token,所以可以转化很多个结构,分享平台或者提出bug,也可也获得额外token。

课堂使用、开源工作者可以免费获得几百个Token,基本能覆盖日常科研、教学需求。

分子图片识别

之前有老师课堂使用时候,说把教材里的结构拿出来很麻烦,有机化学课一堂习题课就有几十个分子。我直接安排一个分子图片识别节点。Build Structures-> From Picture 拍照之后上传分子图片,或者Control+V (CMD+V)贴上去。点run 就识别了,识别成SMILES。

我当时尝试几个分子识别软件,都不太灵,后续就买API了。所以一次识别是0.3 token,这个识别极个别情况会把手性键弄错,用户点Draw可以直接修改。识别之后,SMILES也顺便转成xyz格式3D可视化。

xyz或sdf文件读取,转化为SMILES

有左侧Menu第一个Build Structures找到Load,把这个节点拖到画布上,这个是大家用的最多的Module。它负责读入外部文件,目前支持xyz,sdf,pdb和SMILES列表。

Visualization -> Mol. Preview 提供了一个可视化的窗口。这一步无需登录就可以直接用。如果要把你的3D结构转化为SMILES结构则需要点击run,您的文件传到后端解析为SMILES。Visualization -> SMILES Preview模块可以把你的SMILES显示出来。

单个SMILES转化为xyz 3D结构

把Build Structures -> SMILES Input模块拖到画布上,你可以直接在上面贴SMILES字符串,下面2D分子结构会实时更新。连上Mol. Preview module之后,需要点击Run,才能把SMILES转化为3D结构。

这部分必须送回服务器处理,因为我发现一些工具例如OpenBabel有些时候会把一些分子弄成平面,导致用户后续计算出现错误。

SMILES 批处理

Load可以载入有SMILES字符串的文件,一个SMILES放单独一行,例如:

  COc1ccc(C(=O)NC(C)(CNC(=O)OC(C)(C)C)c2ccccc2)cc1
  Cc1conc1C(=O)NC[C@@H](C)CNC(=O)CCC1CCCC1
  Cc1ccccc1C(=O)N1CCC[C@H](CNC(=O)CC(C)(C)C)C1
  CCc1[nH]ccc1C(=O)NCC1(O)CC[NH+](Cc2ccc(C)cc2)CC1
  O=C(CCC1CC1)NC1CCC1
  CCc1ccc(C[NH2+]C[C@@H]2CC[NH+](Cc3ccccc3)C2)o1
  Cc1ccc(OC2CCN(C(=O)[C@@H]3CCCN(C(=O)OC(C)(C)C)C3)CC2)cc1C
  Cc1[nH]ccc1C(=O)N1CC(CNC(=O)c2ccc(F)cc2)C1

载入之后连接一个Visualization -> SMILES Preview,可以看到你的SMILES转化的分子结构式。点击Export All可以把SMILES和转化的分子结构式图片做成excel表格(这一步无需登录/点Run):

接入一个Visualization -> Mol. Preview ,识别出来的xyz文件都可以显示为3D结构,点击Download All就可以全部结构打包为zip文件。

手绘分子

ChemOrchestra也能让用户直接化结构式,类似ChemDraw。这里通过的是一个开源包叫ketcher,用户拖动Build Structures -> Molecular Draw模块,点击Draw就能画分子,画完了点Save&close这个分子就在节点里面显示出来了。

如果要转3D结构,一样需要登录,挂上一个Mol. Preview节点,点Run.


ChemOrchestra核心设计是把这些结构单元(节点)串联成一个整体进行复杂模拟,因此还能进行结构优化、分子对接,虚拟筛选等常规方法,也有AI分子生成,binder设计、Folding等,欢迎大家体验。更多的节点是个别用户提出的(比如大环化合物和PROTAC的AI生成、BoltzGen/Boltz2等等、RNA二级结构预测),测试完整后向大家交付。您有什么需求可以随时提出。

后续也会提供越南草药天然产物库、海洋生物天然产物库,如果您有感兴趣的数据库,我们也可也收集。

接下来会介绍蛋白质文件处理和清理的工具,然后会有材料建模。感兴趣的可以联系我们:

(请注明:ChemOrchestra平台感兴趣 )

计算化学进入中学课堂

英伟达GenMol的几个问题及解决方案

用英伟达GenMol模型生成类药分子

本站文章均为手工撰写未经允许谢绝转载:夜雨聆风 » 小分子批处理、结构识别与可视化工具

猜你喜欢

  • 暂无文章