链霉菌作为天然产物的重要“基因工厂”,长期以来在抗生素与活性小分子发现领域占据核心地位。然而,其合成生物学工具的发展却长期受限,尤其是在启动子元件层面,普遍存在强度分布窄、可用元件稀缺以及跨菌株适配性差等问题,严重限制了代谢工程的精细调控能力。
近日,天津大学罗云孜团队与清华大学汪小我团队在Metabolic Engineering期刊上发表文章“Deep learning unlocks sequence-divergent synthetic promoters to empower Streptomyces natural product engineering”,借助深度生成模型系统性重构了链霉菌启动子设计范式,首次构建了AI驱动的人工启动子库。研究者通过机器学习模型在计算层面设计了高达10亿条启动子序列,并从中筛选100个候选进行实验验证,结果显示其中92%具有真实表达活性,动态范围达到0.08到17.10倍,标志着链霉菌启动子工程从经验改造迈向可编程设计的新阶段。这些人工启动子不仅“强度多样”,还具备跨物种稳定性,在四种系统发育差异显著的链霉菌宿主中均保持稳定表达功能。同时人工启动子与宿主基因组无同源性,从源头降低了基因重组干扰风险,体现出AI设计在“正交调控元件构建”上的独特优势。使用这些AI设计启动子成功激活了靛蓝的生产,并将多环四甲酸大内酰胺产量提升28.6倍、达托霉素提升25.7倍、雷帕霉素提升6.1倍,验证了其在不同类型次级代谢通路中的普适性。

该工作的整体工作流程如下:作者针对链霉菌启动子资源有限且缺乏标准化数据的问题,整合7种链霉菌的dRNA-seq与RNA-seq数据,构建了包含3493个功能启动子的高质量数据库。研究团队以转录起始位点上游80 nt序列定义启动子,并利用启动子预测工具对不同来源数据进行筛选与TSS校准,以提高数据一致性。在此基础上,作者建立了“生成模型—预测模型—进化优化”相结合的AI设计流程,通过WGAN-GP模型进行启动子从头生成,结合CNN模型筛选高活性候选,并利用遗传算法进行多轮迭代优化。随后,通过链霉菌荧光报告系统对设计序列进行实验验证,并利用实验数据进一步优化模型性能。最终,研究团队将计算设计规模扩展至10亿条候选启动子序列,从中筛选高性能人工启动子并成功应用于天然产物代谢工程(图1)。

图1 人工启动子设计流程
作者首先采用两种策略分别设计2000条AI启动子序列,一种为“生成器生成—直接筛选”模式,另一种引入遗传算法进行7轮迭代优化。生成序列整体保留了链霉菌启动子的典型特征,包括较高GC含量以及−10/−35保守区域。作者从中筛选40个候选启动子,通过EGFP报告系统进行体内活性测试。结果显示,遗传算法优化组的功能启动子比例更高,表明算法优化能够有效提升AI设计性能。进一步地,研究团队引入绝缘元件RiboJ以增强调控模块化特性。加入RiboJ后,多数人工启动子的稳定性与表达强度均得到提升,且直接筛选组对RiboJ表现出更高响应性和稳定性。因此,作者在后续的大规模启动子设计与筛选中采用了直接筛选策略,以进一步挖掘具有可调控潜力的人工启动子(图2)。

图2 优化人工启动子
在完成初始AI启动子库的实验反馈优化后,作者将设计规模扩展至10亿条序列,并从中筛选100个直接筛选候选进行验证。结果显示,92个启动子具有活性,表达强度范围为ermE*p的0.08–17.10倍,其中59个强于ermE*p,7个甚至超过kasO*p,整体命中率显著提升,反映出模型在实验反馈驱动下对功能序列空间的有效富集。
进一步跨宿主测试表明,在4种链霉菌底盘中,这些AI启动子整体表现出良好的强度与稳定性(图4)。在非模式菌株S. T2-4中,DFSp8在整个生长周期中表现最稳定,达到kasO*p的3.9倍;而在S. albus中部分启动子出现活性下降,但DFSp60表现出持续增强趋势。结合qPCR结果,AI启动子在转录水平整体优于对照,说明其具备较好的跨宿主适配能力,但不同宿主仍存在显著表达差异,提示未来仍需针对宿主背景优化调控设计。

图4 人工启动子在不同链霉菌底盘的功能评价
为评估生成模型在启动子设计中的优势,作者构建了一个与AI设计库同规模(10亿条序列)的随机DNA序列库,并利用相同预测模型进行筛选比较。实验结果显示,随机序列筛选得到的启动子活性整体较低,而AI设计启动子不仅功能命中率更高,且覆盖更广的表达强度范围。这表明,生成模型能够有效学习天然启动子的深层序列规律,从功能相关的序列空间中定向生成高性能候选,而传统随机采样难以捕捉复杂的调控特征。此外,作者还比较了单物种与多物种训练策略,结果发现整合7种链霉菌转录组数据训练的模型显著优于单菌株模型,产生的高性能启动子比例大幅提升,说明跨物种保守调控特征的引入有助于提高AI设计的稳健性与预测能力。
为解析AI设计启动子的序列特征,作者首先将其与天然链霉菌启动子进行比对分析,结果显示无明显高同源匹配,BLASTn未检测到显著相似序列,表明人工启动子与天然基因组序列高度正交。同时,功能性启动子整体呈现链霉菌典型高GC特征,但仍保持一定序列重构空间(图S8a)。Motif分析揭示AI启动子保留了经典启动子核心架构:−10区富集A/T偏好的TANNNT样结构,−35区呈现TTG/GTG偏好,并保持16–18 bp的最佳间距,符合RNA聚合酶识别规律。此外,在−16区附近稳定出现TGTG等特征序列,表明模型可能学习到了非经典调控信号(图S8b)。对高表达启动子进一步分析发现,其A/T富集k-mer明显增加,而GC富集序列被选择性削弱,整体呈现“低复杂度调控核心+结构约束优化”的设计模式。进一步基于MEME分析,高表达启动子中富集多个非经典motif,其中“TAATGT”等序列在强启动子中重复出现,并在空间位置上与典型−10区高度一致(图S8c)。此外,对高表达与低表达启动子进行差异motif分析,发现“TGCTVAYRT”“ACMWCAY”等潜在调控序列在高性能启动子中显著富集,但其功能机制仍有待实验验证(图S8d)。总体而言,AI设计启动子在保持保守调控架构的同时,实现了显著的序列多样性与调控可塑性。

图S8 AI设计启动子的序列特征
为验证AI设计启动子的功能性,作者将其应用于“即插即用(plug-and-play)”天然产物激活平台,通过CRISPR–Cas9在目标生物合成基因簇(BGC)关键基因上游精准插入启动子盒,从而解除沉默并驱动代谢产物表达。研究首先选择了模式性色素合成通路,包括链霉菌中已知的靛蓝(indigoidine)合成基因簇以及A-14菌株中的多环四甲酸大内酰胺(PTM)基因簇。在靛蓝的激活应用中,所有工程菌株均由白色转为明显蓝色,产量最高为kasO*p的2.92倍。在PTM通路中,AI启动子被用于激活A-14菌株PTM基因簇的首个基因,该簇与S. griseus中已知PTM合成路径高度同源但在宿主中处于沉默状态。启动子插入后,所有工程菌株均检测到明显代谢产物峰,而野生型几乎无对应信号。进一步的LC-HRMS分析确认主要产物与S. griseus来源PTM一致。整体结果表明,单一人工启动子即可有效解除沉默BGC并驱动复杂天然产物合成,验证了AI设计元件在天然产物挖掘中的直接应用价值。

图5 利用人工启动子激活天然产物基因簇
为进一步提升复杂天然产物产量,作者利用AI设计启动子对达托霉素与雷帕霉素两条BGC进行多基因重构,所有基因表达均由48 h实测强度较高的人工启动子驱动,并整合至ΦC31 attB位点实现稳定表达。在达托霉素生产菌中,作者对调控基因dptR2及8个核心NRPS相关基因进行逐步与串联过表达,每个基因分别匹配不同强度AI启动子。单基因过表达即可带来产量提升,而在九基因(dptR2MNEFGHIJ)全组装后,实现协同放大效应,达托霉素产量提升25.7倍,并通过LC-MS(m/z 1620.67)确认产物。在雷帕霉素生产菌中,rapK、rapG、rapH、rapX及rapTH五个关键调控与前体供给基因在不同AI启动子驱动下协同表达(rapKGHX(TH))。工程菌HPLC显示明显峰增强,最终整体产量提升6.1倍,并经LC-HRMS(m/z 914.17)验证。结果表明,AI启动子不仅可用于单基因优化,还能在多基因网络层面实现系统性代谢放大。

图6 利用人工启动子强化达托霉素和雷帕霉素的生产
链霉菌作为天然产物的重要生产底盘,具有极其丰富的次级代谢潜力,但其启动子资源长期受限于天然元件,难以支撑复杂代谢工程改造。本研究显著扩展了链霉菌启动子工具库,为代谢通路工程提供了高质量调控元件。尽管AI设计启动子的预测强度与实测结果仅呈中等相关性,但其高功能命中率表明模型能够有效覆盖“功能化序列空间”。结合多物种dRNA-seq数据训练显著提升了设计质量,说明跨物种保守调控特征对模型泛化能力具有重要作用。序列分析显示,AI启动子仍保留σhrdB识别的核心结构特征(−10区TANNNT及17 bp间距),同时引入更多非天然组合,从而实现功能与多样性的统一。除此之外,这些人工启动子在多种链霉菌宿主中均表现出良好的强度与稳定性,满足合成生物学中“时间与宿主正交性”需求。通过CRISPR介导的启动子替换策略,成功激活靛蓝与PTM等沉默BGC,但产量与启动子强度并非完全线性相关,提示宿主代谢网络仍对表达输出具有显著调控作用。在进一步的多基因工程中,AI启动子驱动的达托霉素与雷帕霉素通路重构分别实现25.7倍与6.1倍产量提升,验证了其在复杂天然产物合成体系中的放大效应。
总体而言,该研究将启动子工程从“经验筛选”推进至“生成式设计”,通过AI捕捉非天然序列规律,弥补了传统元件库在正交性与可扩展性上的不足,并为将链霉菌从发酵菌株升级为可编程生物制造平台提供了关键工具基础。
招聘信息
天津大学化工学院罗云孜教授课题组拥有优良先进的仪器设备和实验条件,长期从事合成生物学技术相关研究,包括基因编辑工具的优化改造及其在微生物天然药物开发中的应用。课题组常年招收合成生物学、微生物天然产物、化学及人工智能等相关专业的博士后、博士研究生、硕士研究生及科研助理。招聘方向如下:
1. 分子生物学方向:微生物改造技术开发
2. 天然产物方向:活性天然产物分子的挖掘和高效合成,天然产物分子的分离提纯,非天然活性分子的生物合成
3. 酶工程方向:AI设计相关,蛋白质工程,化学合成
欢迎各位有意者将个人简历及相关材料发送至yunzi.luo@tju.edu.cn,简历内容包括但不限于个人基本信息(需注明出生日期)、学习经历、工作经历、科研成果(列举5-10项代表性成果)和个人职业规划等,并在邮件标题中注明姓名和申请职位,具体信息详见课题组网站:https://www.x-mol.com/groups/luo_lab。如对本课题组具体科研方向或博士后待遇方面有所疑问,也欢迎在邮件中进行咨询。期待您的加入!
夜雨聆风