微信聊几句就出GSEA曲线图!OpenClaw让单细胞分析变这么简单


最近全网都在刷一只小龙虾
本系列持续更新中,尝试用Openclaw做单细胞分析,上一篇我写了怎么让“小龙虾”(Openclaw) 帮忙快速跑单细胞富集分析。
一般我们刚拿到 marker gene、想先快速判断 cluster 在干什么的时候,富集分析是一种很好的分析方式,今天尝试另一种分析-单细胞的高级分析中的GSEA。
另外本次我们有的是微信的ClawBot 和 Openclaw 聊天哦!
往期回顾:
Openclaw尝试做单细胞分析-基础分析 (1小时跑完PBMC3K)
Openclaw尝试做单细胞分析-细胞通讯分析 (SKILLS 试点)
Openclaw尝试做单细胞分析-拟时序分析(Slingshot)
专栏:


0
前言
在前面差异的分析跑完以后,有两条路可以走:
1: 筛显著基因 → GO / KEGG(大家最常走)
2:直接 GSEA(稍微少一点人用)
以前我大多数时候会走第一条。(上期内容)
原因很简单:快、直观、结果好讲但问题也很明显:你必须先“切一刀”
比如:
-
logFC > 多少
-
p值卡多少
-
取前多少基因
而 GSEA(Gene Set Enrichment Analysis)简单说就是:不再先挑“显著基因”,而是把所有基因排个序,再看某一类基因是不是整体往前挤。通过评估整组基因的整体趋势来揭示生物学功能的变化。本期我们来做这个GSEA方法


1
开工:数据加载和分析
1.原来已经用小龙虾做了很多分析,这次分析是接着前面的差异分析结果继续做的, 我们请它加载之前的结果且询问了是用R语言还是用python, 和需不需要帮它指定数据集
然后这些担忧都是多余的,它完全可以自己搞定。

2.再一次确认,且要求它复制出一个项目目录防止干扰到其它的项目。

3.分析完成, 后面我们再补充一些细节分析和做一些检查吧!
用微信和 OpenClaw 聊着把分析跑完,这种感觉其实还挺奇怪的——有点像在跟一个会干活的同事对话。


2
分析的结果
1. 综合的GSEA评分气泡图: 阐述了几个关注通路的GSEA评分,可以快速全定位是哪些通路比较显著的提升和下降。这里做了CD14+ Monocytes的一些显著KEGG通路的GSEA评分。

同样也给到了一些GO显著通路的GSEA评分。

2. 同时时也出了典型的 GSEA 曲线图
上面绿色曲线是这个图的关键
横轴:所有基因按差异排序纵轴:
纵轴:Running Enrichment Score(运行富集分数)
以下给到的是GO中2条比较显著的 GSEA图。
曲线整体: 曲线整体往下走,说明这条通路的基因集中在排序的后半段,也就是在当前条件下相对被压制。即这些基因整体在下调方向为通路下调,反之亦然。




3
优化到接近论文使用级别的图
1.Openclaw同时也对图进行的整理美化,通路GSEA把GO/KEGG作了合并。

2. 同时也给出了相应的关联基因的列表和评分。

3.基因热图,另一种可视化方式更明显直观。


3
总结
总结一下,这次 OpenClaw(小龙虾)帮我完成的不只是“跑一轮 GSEA”,而是把差异结果、基因排序、GO/KEGG 富集、曲线图和汇总图全部串起来了。整个过程我几乎没写代码,只是用自然语言告诉它要做什么。
更重要的是,这一步让我从“哪些基因显著”,走到了“细胞状态怎么变化”。IFN-β 刺激后,CD14+ 单核细胞明显从基础翻译、能量代谢状态,转向抗病毒和细胞因子应答状态。
对我来说,这才是这类分析最有意思的地方:不是跑出结果,而是开始能解释它。
工欲善其事,必先利其器。
到SCI级的分析,需要完整流程和相关代码或者交流的都可以与我联系,欢迎!

接下来,我将在这个公众号持续更新:
「OpenClaw小龙虾生信0代码交流营」
从0安装 → 第一步分析 → 最后一句指令出 SCI 级报告, 手把手教你养这只小龙虾。
关注本公众号(不关注明天就找不到了😂)
直接回复关键词:小龙虾 进「生信+AI交流群」
扫码二维码
获取更多精彩
生信泡泡屋

夜雨聆风