-
公开(公告)号:CN115810392A
公开(公告)日:2023-03-17
申请号:CN202211615708.9
申请日:2022-12-15
Applicant: 浙江大学
IPC: G16B20/30 , G06F16/36 , G06F18/214
Abstract: 本发明公开了一种融合知识图谱的基因序列预训练方法和装置,通过考虑基因之间调控关系构建基因调控图谱,并在基因调控图谱中增加motif和bin来构建基于基因调控网络的知识图谱,进而学习基因在知识图谱中的基因表示,并将知识图谱中的基因表示作为特殊token引入基因的基因序列中,提升了MLM模型对mask的预测准确性,并得到准确性的基因表示,将序列中学到的基因表示作为扩充基因调控图谱中基因的初始向量,再次经过可插拔表示模型提取基因表示,这样交替过程实现了知识图谱信息和基因序列信息的交互,利用交互训练的MLM模型提取基因表示,能够提升进而提升基因相关性质预测的准确性。