-
公开(公告)号:CN114420221A
公开(公告)日:2022-04-29
申请号:CN202210003782.9
申请日:2022-01-04
Applicant: 湖南大学
Abstract: 本发明公开了一种基于知识图谱的多任务药物筛选方法,包括:获取所有药物和所有化合物映射到知识图谱数据集后的实体映射表、所有药物的候选药物集合、以及预训练好的多任务预测模型,获取用户输入的问题,使用获取到的多任务预测模型对问题中的靶点x和候选药物集合进行预测,以获得药物概率分数表和化合物概率分数表,使用结果集成算法对获取的药物概率分数表和化合物概率分数表进行计算合并,并将合并后的概率分数表中的概率分数按照由大到小的方式进行排序,并从排序结果中选择排名前20个药物对应的实体作为筛选结果返回给用户。本发明能够解决现有基于知识图谱的预测模型无法考虑药物分子和蛋白质本身的特征的问题。
-
公开(公告)号:CN107908502B
公开(公告)日:2021-11-05
申请号:CN201711114201.4
申请日:2017-11-11
Applicant: 湖南大学
IPC: G06F11/14
Abstract: 本发明公开一种基于大型系统拓扑结构的容错节点分配方法,包括如下步骤:步骤一、定义系统拓扑结构中节点位置分布,确定节点的位置;步骤二、建模任意两个节点同时失效的概率模型,从而得到任意两个节点同时失效函数;步骤三、计算任意两点同时失效的概率,得到任意两点同时失效的概率为固定值;步骤四、构建节点分配模型,将计算节点集合抽象成对应的无向加权图G(V,E,W);步骤五、运行覆盖算法,求解最优节点组合,使得集合权值最小,并且将结果保存并返回。本发明相对于传统的节点分配技术,能够使得全系统内存检查点失效概率降低3倍。这也意味着我们能把多级检查点系统中的检查点恢复开销相对于传统做法降低67%。
-
公开(公告)号:CN109101584B
公开(公告)日:2020-11-03
申请号:CN201810812774.2
申请日:2018-07-23
Applicant: 湖南大学
Abstract: 本发明提供了一种将深度学习与数学分析相结合的句子分类改进方法,该方法结合了深度学习和数学分析在处理句子问题中的优势,即长短时记忆网络(LSTM)能将句子中词的词序信息和上下文信息都考虑进去,反词频权重(AWF)能突出词在语料库中的统计特征,通过数学方法将原始向量表示S0减去S0在第一主成成分V1上的投影,得到改进后的句子特征向量表示S1,将S1作为softmax层的输入得到句子分类结果。将这些优势结合在一起,取长补短,有助于句子建模的可靠性得到更好的句子语义特征表示,从而提高句子分类的精度。同样也可用于文本(多个句子)建模的基础,有助于获得更好的文本(多个句子)分类方法。
-
公开(公告)号:CN107844608B
公开(公告)日:2021-11-30
申请号:CN201711273188.7
申请日:2017-12-06
Applicant: 湖南大学
IPC: G06F16/35 , G06F40/289 , G06F40/30 , G06F40/242 , G06F40/211 , G06K9/62
Abstract: 本发明公开了一种基于词向量的句子相似度比较方法。本发明基于大型语料库训练得到词向量模型,并且通过斯坦福句法分析器将句子表示成句法成分树结构,然后在词向量模型中搜索句子成分树叶子节点所对应的词向量,这此基础上,我们提出了一种基于词向量的句子相似度比较方法,这种方法首先构建句子成分向量树,然后通过我们提出的soft partial tree kernel函数计算最终的句子相似度得分。实验结果表示,这种方法相对于目前性能表现很强的众多神经网络方法,在超过一半数据集上都取得了最好的效果,并且在平均性能上取得了最先进的效果。这说明了这种方法是一种很有效的句子相似度度量方式。
-
公开(公告)号:CN107844608A
公开(公告)日:2018-03-27
申请号:CN201711273188.7
申请日:2017-12-06
Applicant: 湖南大学
CPC classification number: G06F17/30705 , G06F17/271 , G06F17/2735 , G06F17/2775 , G06F17/2785 , G06K9/6215
Abstract: 本发明公开了一种基于词向量的句子相似度比较方法。本发明基于大型语料库训练得到词向量模型,并且通过斯坦福句法分析器将句子表示成句法成分树结构,然后在词向量模型中搜索句子成分树叶子节点所对应的词向量,这此基础上,我们提出了一种基于词向量的句子相似度比较方法,这种方法首先构建句子成分向量树,然后通过我们提出的soft partial tree kernel函数计算最终的句子相似度得分。实验结果表示,这种方法相对于目前性能表现很强的众多神经网络方法,在超过一半数据集上都取得了最好的效果,并且在平均性能上取得了最先进的效果。这说明了这种方法是一种很有效的句子相似度度量方式。
-
公开(公告)号:CN110289050A
公开(公告)日:2019-09-27
申请号:CN201910460463.9
申请日:2019-05-30
Applicant: 湖南大学
Abstract: 本发明提供了一种基于图卷积和词向量的药物-靶标相互作用预测方法,从药物中提取分子指纹特征和邻接矩阵特征,然后利用图卷积训练这些特征,将一个蛋白质分子表达式3个一组切割,并用一个100维的向量表示这一组,利用CNN训练靶标的词向量特征,最后把训练好的药物和靶标结合在一起,进行最后的结果预测。本发明的有益效果如下:可以提供关于药物的更多特征,从而达到更高的准确性;利用词向量构建蛋白质特征,大大减少了构建特征的时间;可以完整保存药物分子图的有关信息,而不会损失特征;可以大大加快训练时间。
-
公开(公告)号:CN114420221B
公开(公告)日:2024-06-25
申请号:CN202210003782.9
申请日:2022-01-04
Applicant: 湖南大学
Abstract: 本发明公开了一种基于知识图谱的多任务药物筛选方法,包括:获取所有药物和所有化合物映射到知识图谱数据集后的实体映射表、所有药物的候选药物集合、以及预训练好的多任务预测模型,获取用户输入的问题,使用获取到的多任务预测模型对问题中的靶点x和候选药物集合进行预测,以获得药物概率分数表和化合物概率分数表,使用结果集成算法对获取的药物概率分数表和化合物概率分数表进行计算合并,并将合并后的概率分数表中的概率分数按照由大到小的方式进行排序,并从排序结果中选择排名前20个药物对应的实体作为筛选结果返回给用户。本发明能够解决现有基于知识图谱的预测模型无法考虑药物分子和蛋白质本身的特征的问题。
-
公开(公告)号:CN115934948A
公开(公告)日:2023-04-07
申请号:CN202211692436.2
申请日:2022-12-28
Applicant: 湖南大学
Abstract: 本发明公开了一种基于知识增强的药物实体关系联合抽取方法,包括:获取药物实体相互作用关系数据集,对该药物实体相互作用关系数据集进行预处理,以得到预处理后的药物实体相互作用关系数据集,针对预处理后的药物实体相互作用关系数据集中的每个药物实体而言,获取该药物实体对应的实体描述信息和相互作用关系子图信息,对实体描述信息和相互作用关系子图信息进行预处理,以得到实体描述特征和相互作用关系子图特征,将预处理后的药物实体相互作用关系数据集及其外部知识信息,输入预训练好的实体关系联合抽取模型中,以得到最终的药物实体关系抽取结果。本发明能够解决现有使用传统深度学习模型的方法不适用于生物医学这一特殊领域的技术问题。
-
公开(公告)号:CN111564186A
公开(公告)日:2020-08-21
申请号:CN202010216234.5
申请日:2020-03-25
Applicant: 湖南大学
Abstract: 本发明提供一种基于知识图谱的图卷积药物对相互作用预测方法,包括:提取药物对数据样本,生成含训练集、验证集和测试集的数据集;构建数据集对应的知识图谱;建立GCN药物对相互作用预测模型,学习药物对中所含药物及其邻域的特征信息;将训练集的药物对数据样本输入到GCN药物对相互作用预测模型,训练GCN药物对相互作用预测模型;将训练结果优化损失函数后送入GCN药物对相互作用预测模型训练;经过迭代计算,完成GCN药物对相互作用预测模型的训练;将测试集中的药物对数据样本输入到GCN药物对相互作用预测模型得到测试结果;对所述测试结果进行分析得到预测结果。本发明提供的基于知识图谱的图卷积药物对相互作用预测方法及系统准确性高、训练耗时短。
-
公开(公告)号:CN109101584A
公开(公告)日:2018-12-28
申请号:CN201810812774.2
申请日:2018-07-23
Applicant: 湖南大学
IPC: G06F17/30
Abstract: 本发明提供了一种将深度学习与数学分析相结合的句子分类改进方法,该方法结合了深度学习和数学分析在处理句子问题中的优势,即长短时记忆网络(LSTM)能将句子中词的词序信息和上下文信息都考虑进去,反词频权重(AWF)能突出词在语料库中的统计特征,通过数学方法将原始向量表示S0减去S0在第一主成成分V1上的投影,得到改进后的句子特征向量表示S1,将S1作为softmax层的输入得到句子分类结果。将这些优势结合在一起,取长补短,有助于句子建模的可靠性得到更好的句子语义特征表示,从而提高句子分类的精度。同样也可用于文本(多个句子)建模的基础,有助于获得更好的文本(多个句子)分类方法。
-
-
-
-
-
-
-
-
-