「温故知新」CompBio智能体自主分析生物数据

张开发
2026/5/6 12:51:26 15 分钟阅读

分享文章

「温故知新」CompBio智能体自主分析生物数据
摘要现代生物学日益依赖单细胞RNA测序scRNA-seq等复杂的高维数据集这些数据集蕴含大量潜在假设。由于scRNA-seq分析耗时且需要深厚的计算和领域专业知识系统探索这些假设往往不切实际。为解决这一挑战推出基于大语言模型构建的人工智能AI智能体CellVoyager可在Jupyter笔记本环境中自主生成并执行scRNA-seq分析。在CellBench包含76项已发表scRNA-seq研究的基准测试集上对CellVoyager进行评估结果显示仅提供论文背景部分时其预测作者最终开展的分析的准确率比GPT-4o和o3-mini最高高出23%。在项深度案例研究中CellVoyager在COVID-19、细胞间通讯和衰老领域生成了新发现这些发现经专家评估均具有创新性和科学合理性。上述结果表明CellVoyager有望加速计算生物学研究进程并通过大规模自主分析生物数据挖掘潜在见解。jameszstanford.edu#单细胞RNA测序 #人工智能智能体 #计算生物学 #自主数据分析 #大语言模型结果CellVoyager方法学图1CellVoyager智能体框架示意图a. CellVoyager整体示意图1输入包括论文文本、相关scRNA-seq数据和Python环境说明提取论文中的生物背景和既往分析并初始化Jupyter笔记本2生成包含假设和分步计划的「探索蓝图」智能体对该蓝图进行自我批判并整合改进建议3每个假设进行T步探索每步包括生成并执行代码最多F次错误修复、基于代码执行输出重新规划以及对新计划进行自我批判该过程可针对N个不同假设重复进行同时向智能体提供已测试的既往假设以避免重复分析最终生成总结关键发现的报告。b. CellVoyager分析与解读模块概述经自我批判的计划包含下一步分析的Python代码代码执行后输出结果与既往代码单元格内容一同输入视觉语言模型VLM进行解读VLM输出结果摘要并基于有潜力的结果提出未来研究方向和分析改进建议为智能体选择下一步分析方向提供依据CellVoyager据此更新分析计划。c. Jupyter笔记本中CellVoyager的基础分析模块包括分析步骤描述、执行代码、输出结果与图表以及对输出结果和图表的解读。NK自然杀伤细胞DEG差异表达基因。d. CellVoyager的分析模块示例。FDR错误发现率。基于CellBench评估CellVoyager的分析生成能力图2CellBench评估结果a. 基准测试构建流程CellBench基于76篇聚焦scRNA-seq数据分析的论文构建利用大语言模型提取生物背景信息并列举论文中开展的独立分析仅提供论文背景部分时要求智能体预测应开展的分析并通过与论文中未公开的实际分析对比进行评估。b. 基础模型与CellVoyager在3次独立运行中的性能表现2种大语言模型对应的CellVoyager均优于基础大语言模型且CellVoyagerGPT-4o准确率最高。柱状图数值表示预测正确未公开分析的平均准确率误差线表示3次独立基准测试运行的标准差采用双侧Welch t检验结合Holm-Bonferroni多重比较校正评估方法间的统计显著性显著性水平标注如下*P0.05**P0.01***P0.001NS无统计学意义。c. CellBench查询与智能体响应示例此处LLM裁判将其判定为匹配。左侧为肾单位发育的拟时序轨迹推断原研究分析右侧为CellVoyager的预测响应提及「扩散拟时序分析可能结合PAGA可模拟肾单位祖细胞向成熟肾单位上皮细胞的间充质-上皮转化相关通路的基因集评分可进一步揭示潜在的信号传导机制」。案例研究图3人类专家评估结果基于3篇已发表论文对CellVoyager进行3项真实世界案例研究评估智能体为每个案例研究生成5项分析每项案例研究均由2名独立的PhD级研究者其中1人为原论文共同作者按照标准化评分细则进行评估汇总所有评估者的评分结果。从4个标准对CellVoyager的分析进行评估图表外侧标注评估者给出的分数或等级创造性按1-4分评分。图4COVID-19 PBMCs案例研究的智能体生成分析结果所有面板均由CellVoyager智能体生成为提高可读性对部分图表文本进行了修改。a. CD14单核细胞的凋亡和焦亡评分左侧为COVID-19患者与健康对照者CD14单核细胞的凋亡评分对比右侧为焦亡评分对比。b. 凋亡和焦亡评分与模块评分的相关性左侧为CD14单核细胞的凋亡评分与IFN1评分的相关性右侧为焦亡评分与HLA1评分的相关性数据点按供体来源COVID-19患者或健康对照者着色。c. COVID-19与健康人群高焦亡评分CD14单核细胞的差异表达基因热图。d. 按供体伪批量分析的CD14单核细胞凋亡和焦亡评分对比双侧Mann-Whitney U检验。e. 按供体伪批量分析的CD8 T细胞焦亡评分对比P0.001双侧Mann-Whitney U检验。f. 2个验证数据集的分析结果左侧为验证数据集1中间为验证数据集2右侧为COVID-19与健康人群各细胞类型焦亡评分汇总对比双侧Mann-Whitney U检验。图5人类子宫内膜案例研究的智能体生成分析结果所有面板均由CellVoyager智能体生成为提高可读性对部分文本进行了微调。a. 内皮细胞和间质成纤维细胞的月经周期天数分布每个数据点代表1个细胞2,060个内皮细胞和23,063个间质成纤维细胞中心线表示中位数箱体代表4分位距IQR须延伸至1.5×IQR超出该范围的数据点显示为异常值。b. 数据集的UMAP投影左侧按Leiden聚类着色右侧按月经周期天数着色。c. 按PAEP表达量着色的UMAP图。d. 内皮细胞受体与间质成纤维细胞配体的配体-受体相关性分析每个数据点代表1名供体表达值为指定细胞类型的平均表达量上图为早期左和晚期右细胞中VEGFA与KDR的相关性下图为早期左和晚期右细胞中PDGFB与PDGFRB的相关性阴影区域表示拟合线性回归的95%置信区间基于供体水平平均表达量通过自助法估算P值通过双侧Pearson相关性检验计算NAN无数据。e. 扩展的配体-受体相关性分析为便于解读展示智能体从40对配体-受体中筛选出的最具潜力的相关性结果包括FGF2-FGFR1和TGFβ1-TGFβR1前者包含2种表达受体的细胞类型平滑肌细胞和无纤毛上皮细胞置信区间和P值的计算方式与d一致。avg平均值。图6脑衰老研究论文的智能体生成分析结果所有面板均由CellVoyager智能体生成为提高可读性对部分图表文本进行了修改所有箱线图中中心线表示中位数箱体代表4分位距IQR须延伸至1.5×IQR超出该范围的数据点显示为异常值。a. 星形胶质细胞-静息神经干细胞qNSC集群中转录噪声与年龄的相关性数据点按Leiden聚类着色。b. 星形胶质细胞-静息神经干细胞qNSC细胞内各Leiden聚类的转录噪声分布。c. 数据集中所有细胞类型的年轻与年老细胞转录噪声对比采用双侧t检验评估统计显著性*P0.05**P0.01***P0.001OPC少突胶质细胞祖细胞。d. 验证数据集的转录噪声对比采用与案例研究相同的流程分析Dulken等人的数据集验证数据集中不存在的细胞类型留空统计显著性标注同c。数据CellBench评估数据集https://github.com/zou-group/CellVoyager代码GitHubhttps://github.com/zou-group/CellVoyagerZenodohttps://doi.org/10.5281/zenodo.17945696详细总结思维导图mindmapCellVoyager的技术设计与工作流程核心数据共涵盖659项独立分析CellVoyagero3-mini的微平均和宏平均准确率均优于主流LLM选取3篇已发表高水平研究CellVoyager生成5项核心分析筛选代码执行成功率最高的5项由2名PhD级专家含原论文作者按 「创造性1-4分、生物学洞察、方法正确性、假设吸引力」评分结果如下参考Nat Methods. 2026 Mar 17. doi: 10.1038/s41592-026-03029-6. CellVoyager: AI CompBio agent generates new insights by autonomously analyzing biological data260317CellVoyager.pdf注AI辅助创作如有错误欢迎指出。内容仅供参考不构成任何建议。

更多文章