行业动态 Industry News

科学家利用迁移学习建立计算大模型预测基因调控研究

发布时间:2023-06-19 16:04:54 | 来源:【《中国生物技术发展中心》 2023-6-19】
分享至:0

本文转自《中国生物技术发展中心》,转发仅为学习交流,若侵犯版权请联系小编删除。


基因网络绘制需要大量转录组数据用于建立基因之间的联系,这也阻碍了一些数据有限场景(如罕见病)等研究。最近,利用迁移学习的机器学习技术在自然语言和计算机视觉等领域带来了变革性进展,其通过在大规模通用数据集上进行大模型预训练,而后迁移到数据量有限的特定任务进行微调。美国博德研究所等研究团队提出了一个深度学习模型Geneformer可实现特定生物学任务与背景中的预测。该研究成果于近日发表在《Nature》杂志上,题为:Transfer learning enables predictions in network biology。

研究人员开发的深度学习模型Geneformer,在大约3000万个单细胞转录组的大规模数据集上进行了预训练,以便在网络生物学有限数据的情况下进行特异性预测。在预训练期间,Geneformer获得了对网络动态的基本理解,以完全自我监督的方式在模型的注意力权重中编码网络层次。研究人员利用Geneformer基于下游有限数据进行了预测任务,包括“疾病候选靶点预测”“解释拷贝数变异”“关键基因网络调控因子”“基因网络层次编码”“染色质动力学预测”等,并通过实验支持了其预测的结果。

综上,Geneformer代表了一种预训练的深度学习模型,可以对其进行微调,以实现广泛的下游应用,加速发现网络调节关键环节和候选治疗目标。

 

注:此研究成果摘自《Nature》杂志,文章内容不代表本网站观点和立场,仅供参考。

版权所有© 南昌弘益科技有限公司 网站技术支持:云端科技

赣ICP备15005709号-1 互联网药品信息服务资格证书编号:赣A202207910060

友情链接:国家食品药品监督管理局国家科技部网站 国家食品药品监督管理局药品审评中心 江西省食品药品监督管理局中国生物技术发展中心


赣公网安备 36010902000143号