-
公开(公告)号:CN113505227B
公开(公告)日:2022-06-10
申请号:CN202110823177.1
申请日:2021-07-21
Applicant: 兰州大学
Abstract: 本申请提供一种文本分类方法、装置、电子设备及可读存储介质,涉及自然语言处理技术领域。该方法包括:将待处理文本以及待处理文本的至少一个子文本均输入预先训练得到的分类模型,得到所述待处理文本属于各类别的概率以及各所述子文本属于各类别的概率,根据各所述子文本属于各类别的概率,得到所述待处理文本的子文本特征,将所述子文本特征以及所述待处理文本属于各类别的概率输入修正模型进行概率修正,得到修正后的所述待处理文本属于各类别的概率;根据所述修正后的所述待处理文本属于各类别的概率,确定所述待处理文本的目标类别。本申请不仅提高了文本分类的准确率,而且还节省了训练模型所需的时间和存储空间。
-
公开(公告)号:CN113505227A
公开(公告)日:2021-10-15
申请号:CN202110823177.1
申请日:2021-07-21
Applicant: 兰州大学
Abstract: 本申请提供一种文本分类方法、装置、电子设备及可读存储介质,涉及自然语言处理技术领域。该方法包括:将待处理文本以及待处理文本的至少一个子文本均输入预先训练得到的分类模型,得到所述待处理文本属于各类别的概率以及各所述子文本属于各类别的概率,根据各所述子文本属于各类别的概率,得到所述待处理文本的子文本特征,将所述子文本特征以及所述待处理文本属于各类别的概率输入修正模型进行概率修正,得到修正后的所述待处理文本属于各类别的概率;根据所述修正后的所述待处理文本属于各类别的概率,确定所述待处理文本的目标类别。本申请不仅提高了文本分类的准确率,而且还节省了训练模型所需的时间和存储空间。
-
-
公开(公告)号:CN112599186A
公开(公告)日:2021-04-02
申请号:CN202011619677.5
申请日:2020-12-30
Applicant: 兰州大学
Abstract: 本发明公开了基于多深度学习模型共识的化合物靶蛋白绑定预测方法,包括以下步骤:获取化合物靶蛋白绑定/非绑定数据;抽取多个不同的用于训练、测试及验证的化合物靶蛋白绑定/非绑定数据集;分别构建并训练多个化合物靶蛋白绑定/非绑定深度学习模型,提取化合物靶蛋白绑定/非绑定的特征,获得多个最终化合物靶蛋白绑定/非绑定深度学习模型;通过上一步的多个化合物靶蛋白绑定/非绑定深度学习模型预测得到多组化合物靶蛋白绑定/非绑定关系;将得到的多组绑定关系结果集成得到共识的绑定关系,将得到的多组非绑定关系结果集成得到共识的非绑定关系。本发明具有假阳性率低、正确率高的特点,适合推广应用。
-
-
公开(公告)号:CN112599186B
公开(公告)日:2022-09-27
申请号:CN202011619677.5
申请日:2020-12-30
Applicant: 兰州大学
Abstract: 本发明公开了基于多深度学习模型共识的化合物靶蛋白绑定预测方法,包括以下步骤:获取化合物靶蛋白绑定/非绑定数据;抽取多个不同的用于训练、测试及验证的化合物靶蛋白绑定/非绑定数据集;分别构建并训练多个化合物靶蛋白绑定/非绑定深度学习模型,提取化合物靶蛋白绑定/非绑定的特征,获得多个最终化合物靶蛋白绑定/非绑定深度学习模型;通过上一步的多个化合物靶蛋白绑定/非绑定深度学习模型预测得到多组化合物靶蛋白绑定/非绑定关系;将得到的多组绑定关系结果集成得到共识的绑定关系,将得到的多组非绑定关系结果集成得到共识的非绑定关系。本发明具有假阳性率低、正确率高的特点,适合推广应用。
-
-
-
-
-