最强AI生物平台测评!从生物信息、蛋白设计到药物发现,Biomni Lab接管整个生物学!

从生物信息、蛋白设计到药物发现

一个AI智能体，正在接管整个生物学

BioTender | AI4Bio

生物学研究的碎片化是一个长期未被正视的效率黑洞。结构预测用一套工具，序列设计用另一套，转录组分析又是另一套，数据在工具之间搬来搬去，大量时间消耗在环境配置和格式转换上，而不是真正的科学问题。Biomni Lab 想做的事情很简单——把这些全部装进一个工作台，让 AI 负责工具调度，科学家只需要描述目标。这个想法不新鲜，但他们是第一个把它做成能跑的东西的团队。

CRISPR 奠基人张锋背书！生物人自己的科研 AI 来了——斯坦福团队成立 Phylo！

Biomni Lab 是 Stanford spin-out 公司 Phylo 于 2026 年 2 月正式推出的商业产品，前身是 2025 年 6 月开源的 Biomni 项目，目前已被超过 7000 个实验室和药企采用。平台融资 1350 万美元，a16z 和 Menlo Ventures/Anthropic Anthology Fund 联合领投，科学顾问阵容包括 Carolyn Bertozzi（诺贝尔奖）、张锋（CRISPR）和 Fabian Theis（计算生物学）。

平台链接👉https://biomni.phylo.bio/

核心定位是"集成生物学环境"（Integrated Biology Environment，IBE）——把 AI Agent、数百种生物信息学工具、59 个生物数据库、105 个生物软件工具整合进一个统一工作台，让科学家用自然语言驱动复杂分析流程。

Biomni Lab往期推荐👇

独家访谈｜对话Biomni Lab——重新定义生物学家与AI智能体的交互方式！

AI打通计算与实验最后一公里！PyLabRobot×Biomni重磅！干湿实验不再割裂！！

科研智能体Biomni进化6步：设计蛋白、查数据、跑scRNA、读文献、做假设、超越专家！

Biomni-R0 来了！斯坦福放大招，生物科研专属 AI 直接碾压 GPT-5！

Biomni 0.0.5 重磅更新：开源科研助手迈入“真智能”时代！

AI蛋白质设计零门槛！Biomni与Tamarind Bio强强联手，傻瓜式预测实现！

Biomni 正式开源：通用生物医药 AI 智能体登场，支持自然语言科研执行

Biomni-Lab用户群现已上线！!欢迎加入！！

测评方法

本次测评基于五个真实 notebook 执行样本，覆盖计算生物学的主要任务类型，逐一拆解 Biomni Lab 在各场景下的实际表现。

https://phylo.bio/use-cases

蛋白质结构预测（B2M AlphaFold）

平台调用 HPC 后端提交 AlphaFold2 作业，自动轮询结果，下载输出文件后解析 ranking_debug.json 和各模型的 pLDDT 打分，

最终生成包含置信度色带标注和多模型均值对比的发表级双图（PNG + SVG）。

亮点在于全流程自动化——从作业提交到结果可视化，代码无需人工干预。五个预测模型的平均 pLDDT 集中在 92-94 区间，置信度分解逻辑（Very high / Confident / Low / Very low）完全遵循 AlphaFold 官方标准。HPC 结果检索 API 的设计也相当干净，hpc_api_get_results(job_id, output_dir) 一行调用即可。

蛋白结合剂设计（PCSK9 Binder）

调用双工具链：先用 hpc.hpc_search_tools() 检索 RFDiffusion 和 ProteinMPNN 的参数规格，再下载 PDB 2P4E，提取 Chain A，验证 PCSK9 的五个热点残基（D238、R357、E366、D374、S381），排查 HETATM 记录和链间隙，最后生成适配 RFDiffusion 的 contig 配置。

整个 PDB 预处理逻辑写得相当严谨——用 Biopython 精确过滤备用构象（altloc != A），并对热点残基逐一做 B-factor 检查以评估表面暴露程度。

工具检索接口抽象合理，科研人员可以通过语义查询发现平台支持的分析能力，而不必记忆固定 API 名称。

引物与克隆设计（Prime 编辑器）

任务难度较高——给定一段 3.7 kb 的 CDS 序列，找到内部 EcoRI 位点，穷举六个位置上所有可能的单碱基同义突变，筛选出不改变蛋白序列同时彻底消除酶切位点的方案，再设计带 BamHI / Kozak / FLAG tag 悬挂端的克隆引物。

Biomni Lab 的处理过程体现了良好的分子生物学知识深度：框内偏移量计算准确，同义突变遍历逻辑完整，最终选取 GGA→GGC（Gly，密码子偏好中性）作为最保守的修改策略。

molecular_biology.design_pcr_primers_with_overhangs()工具接口将实验设计意图直接映射为函数参数，对湿实验科学家友好。

小分子活性数据

挖掘与模型训练（PCSK9 ChEMBL）

这是五个任务里流程最完整、技术深度最高的一个。Agent 从零搭建了一条端到端的 AI 药物发现 pipeline：从 ChEMBL 批量获取 PCSK9 的 IC50、Ki、Kd 数据，经过单位标准化、关系过滤（只保留精确测量值）、数据质量标记清洗、RDKit SMILES 验证、按 pIC50 四分位数分层划分训练/验证/测试集，再将每个分子转换为带 21 维原子特征和 6 维键特征的分子图，训练一个带边特征的 MPNN 模型，加入 BatchNorm、Dropout、梯度裁剪和早停机制，最终在测试集上输出 RMSE、MAE、R² 指标及预测散点图。

模型训练完成后，Agent 并未停在评估环节，而是继续提取训练集 Murcko scaffold，构建一批药物样小分子虚拟库，过滤掉与训练集重叠的骨架，用训练好的 GNN 对新骨架候选分子打分排序，最后计算 Morgan 指纹并用 UMAP 将已知 PCSK9 抑制剂和新骨架候选分子投影到同一化学空间，高亮 Top 5 候选。

整个流程覆盖了从数据获取、模型训练到虚拟筛选的完整药物发现闭环，且每个环节的工程细节处理得相当规范，输出图表达到直接写入论文的质量。

差异表达分析

（MASH DEG，DESeq2）

这个任务的完成度在五个 demo 里最高，最终输出不是一个 notebook，而是一份完整的 PDF 科研报告。

流程从 GEO 下载 GSE162694 数据集（143 例人类 MASH 肝活检 + 31 例正常肝组织的 RNA-seq 原始计数）开始，解析 SOFT 格式元数据提取纤维化分期（F0-F4 及 Normal），验证样本 ID 完全匹配后进入 R 环境。DESeq2 全流程走完——低表达基因过滤、构建 DESeqDataSet、负二项分布 Wald 检验、apeglm LFC 收缩，最终在 padj ≤ 0.05 且 |log2FC| ≥ 1 的阈值下识别出 1017 个显著 DEG（974 个上调、43 个下调）。

图表输出覆盖 VST-PCA图、离散度估计图、MA 图、火山图、Top50 DEG 热图（带纤维化分期列注释）、GO BP 富集点图和 KEGG 通路点图，全部以 300 dpi PNG 保存。

最后一步尤其值得注意：Agent 用 ReportLab 从零构建了一份结构完整的 A4 PDF 报告，包含封面、引言、方法、结果、结论、局限性、未来方向和参考文献八个章节。

正文引用了 DESeq2、apeglm、clusterProfiler 的原始文献，样本构成以格式化表格呈现，所有图表以图注嵌入对应章节。这份报告的格式和内容完整度，已接近可以直接投稿的补充材料水准。

综合评估

五个任务覆盖了结构预测、蛋白设计、分子克隆、AI 药物发现和转录组分析五个方向，共同呈现出几个一致的特点。

工具调用的抽象层次做得比通用 coding agent 更贴合科研习惯，无论是 HPC 作业调度、语义工具检索还是专有生物信息学接口，调用方式对科学家友好。图表输出质量统一达到发表标准，省去大量后处理工作。任务完成度普遍较高，尤其 GNN 虚拟筛选和 DESeq2 报告两个任务，端到端的完整性明显超出同类工具的常规水平。

需要说明的是，示例 notebook 是经过筛选的成功案例，无法通过这些材料评估平台在陌生任务、错误输入或边界条件下的表现。对于想真正评估平台能力的用户，建议用自己实际遇到的问题做测试。

如果你想跟进这类“AI × 生物资讯”的最新进展，欢迎关注