科学家实现多项单细胞多组学分析算法的系统性评估
创始人
2024-10-15 02:21:25
0

来源:媒体滚动

近日,中国科学技术大学生命科学与医学部教授瞿昆课题组、数学科学学院教授陈发来课题组以及北京生命科学研究所研究员黎斌课题组合作完成了一项成果。该团队分析了百万量级单细胞多组学数据,系统评估了14种单细胞模态预测算法和18种单细胞多组学整合算法的性能。相关研究成果以Benchmarking algorithms for single-cell multi-omics prediction and integration为题,在线发表在《自然-方法》(Nature Methods)上。

单细胞多组学技术的发展,为探索细胞功能和复杂的基因调控机制提供了机遇。然而,湿实验方法通常面临着高成本、数据质量有限及批次效应等挑战。为克服这些局限,生物信息学家基于统计模型和人工智能技术,开发了多种算法。这些算法能够利用单细胞转录组数据推断同一细胞内的蛋白质丰度和染色质可及性信息,并通过将不同模态的数据映射到统一的特征空间实现数据整合以去除批次效应。这些工具提升了现有单细胞数据的解析能力。然而,面对海量数据和众多算法,科研人员往往难以判断哪些工具最适合他们的研究工作。因此,对这些算法进行基准测试尤为重要。

该研究收集了47个数据集的上百万个单细胞多组学数据,涵盖多个生物样本和实验平台。研究设计了一套全面的评估流程,结合算法的准确性、鲁棒性和计算资源消耗等多维度指标,评估了领域内的常用算法。结果显示,在蛋白质丰度预测方面,totalVI和scArches表现最优异;在染色质可及性预测中,LS_Lab算法排名领先;在多组学整合分析中,Seurat、MOJITOO和scAI在垂直整合上表现突出,而totalVI和UINMF在水平整合和马赛克整合任务中展现出优异性能。该工作为算法设计提供了新思路,并为未来多组学数据的分析和应用奠定了基础。同时,为帮助科研人员选择合适的分析工具,该团队在GitHub上发布了完整的分析流程、代码和测试数据集,以供同行使用和改进。

进一步,科研人员探讨了这些算法的数学原理,发现了降噪处理是提高单细胞数据预测精度的关键。在性能评估中,机器学习算法以及基于概率模型的深度学习算法表现出优势。同时,研究提出,现有模态预测算法在某些关键蛋白的预测性能上有待提升,染色质可及性预测的准确性需要进一步优化。

研究工作得到国家重点研发计划和国家自然科学基金等的资助,并获得中国科大超级计算中心与生命科学学院生物信息学中心的计算资源支持。

相关内容

热门资讯

原创 苹... 有不少朋友疑惑苹果iPhone 16 Pro和16 Pro Max有什么区别?该选择哪一款更好?各自...
2024年OPPO手机全攻略:... 手机已不仅仅是通讯工具,它更是我们记录生活、享受娱乐、提升工作效率的重要伙伴。随着科技的飞速发展,O...
2025年值得入手的2款智能手... 在科技飞速发展的今天,智能手表已成为我们生活中不可或缺的伙伴。无论是健康监测、信息提醒,还是时尚搭配...
原创 2... 从去年华为用上了麒麟芯片开始,华为的市场份额就蹭蹭的往上涨,当时抢购的人特别多,一时间还买不到现货,...
第五轮学科评估对比:西安交大突... 在之前的文章中,我们已经提及西安交通大学第五轮学科评估的表现可圈可点,新晋的3个A+学科:机械工程、...
vivo手机5g开关在哪里打开 vivo手机5G开关的打开方式可能因手机型号、系统版本及运营商网络支持情况的不同而有所差异。但总体来...
解决FaceTime无法使用的... FaceTime是苹果公司推出的一款视频通话应用,广泛应用于iPhone、iPad和Mac等设备上。...
steam官网无法访问?这个办... 对于广大游戏爱好者而言,Steam平台无疑是获取最新游戏资讯、购买游戏、与全球玩家互动的重要阵地。然...
原创 直... #热点周际赛# 随着科技的进步,儿童智能穿戴设备逐渐成为了家庭中的新宠。华为作为智能穿戴领域的领军者...
原创 麒... 为了普及原生鸿蒙(鸿蒙5.0),抢占更多的中端手机市场份额,华为nova系列今年开始计划一年两更,n...