一种基于mvAUC的互补差异表达基因选取方法

    公开(公告)号:CN112802555B

    公开(公告)日:2022-04-19

    申请号:CN202110147526.2

    申请日:2021-02-03

    Applicant: 南开大学

    Abstract: 本发明提出一种基于多变量AUC的特征选择方法,从癌症的差异表达数据中选择最互补的基因子集,实现全局分类性能最大化。本发明首先基于特征的可能误分类集提出一种AUC计算的新角度;然后对于一个特征集,确定其共同可能误分类集并计算每个特征组合后的新AUC;一个特征的新AUC与原始AUC的差值展示了组合后特征集中的其他特征对该特征分类能力的互补作用。最后基于特征组合后的新AUC计算mvAUC,并增量式的选择使当前mvAUC最大化的候选特征加入被选特征子集。本发明方法具有可以直接评估被选特征子集的全局类辨别能力的优点,不需要成对地计算候选特征和每个被选特征之间的冗余信息。

    基于单层网络结构学习上下文信息的方法及系统

    公开(公告)号:CN113609867A

    公开(公告)日:2021-11-05

    申请号:CN202110978023.X

    申请日:2021-08-23

    Applicant: 南开大学

    Abstract: 本发明属于深度学习领域,提供了一种基于单层网络结构学习上下文信息的方法及系统。其中,该方法包括获取文本信息,并将每个句子分成目标单词、上文和下文这三部分,对目标单词、上文和下文分别进行向量表示;基于目标单词、上文和下文向量表示及第一门控结构,建立目标单词及其上下文之间的关系;基于第二门控结构从目标单词及其上下文之间的关系中提取语义特征,并通过加权形式来形成最终的文本表示;其中,第一门控结构和第二门控结构均包含单词‑上下文注意力机制。

    基于并行化零冗余长短期记忆网络的文本处理方法及系统

    公开(公告)号:CN113641792A

    公开(公告)日:2021-11-12

    申请号:CN202110931048.4

    申请日:2021-08-13

    Applicant: 南开大学

    Abstract: 本发明属于文本信息处理领域,提供了一种基于并行化零冗余长短期记忆网络的文本处理方法及系统。其中,该方法包括获取待处理文本数据并转换为词嵌入向量形式;根据待处理文本数据包含的词语数量,自适应计算待处理文本数据中每个词语的上下文窗口覆盖范围;在并行化零冗余长短期记忆网络内,压缩所述上下文窗口覆盖范围内的所有词嵌入向量,形成局部注意力向量矩阵,再通过哈达玛积矩阵相乘,并行计算得到所有词嵌入向量对应的局部上下文向量;将待处理文本数据对应的局部上下文向量经分类网络模型处理,得到文本分类或标注结果。

    基于聚合加权矩阵压缩算法的文本语义表示方法

    公开(公告)号:CN105718440B

    公开(公告)日:2019-01-29

    申请号:CN201410728902.7

    申请日:2014-12-03

    Applicant: 南开大学

    Abstract: 本发明属于数据挖掘技术领域,具体提出了一种基于聚合加权矩阵压缩算法的文本表示方法。该方法通过构建全局平滑语境矩阵,弱化了语用习惯对单词语义的影响;利用单词向量聚合算法加权全局平滑语境,修正了单词向量权重度量方法;最后使用无穷范数压缩算法将全局平滑语境转化为向量来表征文本。相较于已有方法,由于保留了向量各维度的最大可能取值,因此更全面地表征了文本信息。

    基于聚合加权矩阵压缩算法的文本语义表示方法

    公开(公告)号:CN105718440A

    公开(公告)日:2016-06-29

    申请号:CN201410728902.7

    申请日:2014-12-03

    Applicant: 南开大学

    Abstract: 本发明属于数据挖掘技术领域,具体提出了一种基于聚合加权矩阵压缩算法的文本表示方法。该方法通过构建全局平滑语境矩阵,弱化了语用习惯对单词语义的影响;利用单词向量聚合算法加权全局平滑语境,修正了单词向量权重度量方法;最后使用无穷范数压缩算法将全局平滑语境转化为向量来表征文本。相较于已有方法,由于保留了向量各维度的最大可能取值,因此更全面地表征了文本信息。

    基于单层网络结构学习上下文信息的方法及系统

    公开(公告)号:CN113609867B

    公开(公告)日:2024-02-02

    申请号:CN202110978023.X

    申请日:2021-08-23

    Applicant: 南开大学

    Abstract: 本发明属于深度学习领域,提供了一种基于单层网络结构学习上下文信息的方法及系统。其中,该方法包括获取文本信息,并将每个句子分成目标单词、上文和下文这三部分,对目标单词、上文和下文分别进行向量表示;基于目标单词、上文和下文向量表示及第一门控结构,建立目标单词及其上下文之间的关系;基于第二门控结构从目标单词及其上下文之间的关系中提取语义特征,并通过加权形式来形成最终的文本表示;其中,第一门控结构和第二门控结构均包含单词‑上下文注意力机制。

    一种药物-蛋白质相互作用预测方法及系统

    公开(公告)号:CN115458061B

    公开(公告)日:2024-01-23

    申请号:CN202211258086.9

    申请日:2022-10-13

    Applicant: 南开大学

    Abstract: 本申请公开了一种药物‑蛋白质相互作用预测方法及系统,其中,方法包括:收集药物‑蛋白质相互作用预测的数据集;对数据集进行预处理,得到处理后数据;基于处理后数据,进行蛋白质序列编码,提取蛋白质特征;基于蛋白特征,同时对药物和蛋白质的分子机制进行编码,得到第一编码结果;基于处理后数据,将药物和蛋白质的临床信息编码在一起,得到第二编码结果;根据第一编码结果和第二编码结果,计算药物‑蛋白质对的相互作用概率。本申请同时考虑了药物和蛋白质的化学属性、分子机制和临床功能;将药物和蛋白质的原始特征投影到了共同的嵌入子空间中;通过分析药物和蛋白质的特征的一致

    一种药物-蛋白质相互作用预测方法及系统

    公开(公告)号:CN115458061A

    公开(公告)日:2022-12-09

    申请号:CN202211258086.9

    申请日:2022-10-13

    Applicant: 南开大学

    Abstract: 本申请公开了一种药物‑蛋白质相互作用预测方法及系统,其中,方法包括:收集药物‑蛋白质相互作用预测的数据集;对数据集进行预处理,得到处理后数据;基于处理后数据,进行蛋白质序列编码,提取蛋白质特征;基于蛋白特征,同时对药物和蛋白质的分子机制进行编码,得到第一编码结果;基于处理后数据,将药物和蛋白质的临床信息编码在一起,得到第二编码结果;根据第一编码结果和第二编码结果,计算药物‑蛋白质对的相互作用概率。本申请同时考虑了药物和蛋白质的化学属性、分子机制和临床功能;将药物和蛋白质的原始特征投影到了共同的嵌入子空间中;通过分析药物和蛋白质的特征的一致性,探究药物与蛋白质的作用机制。

    一种基于mvAUC的互补差异表达基因选取方法

    公开(公告)号:CN112802555A

    公开(公告)日:2021-05-14

    申请号:CN202110147526.2

    申请日:2021-02-03

    Applicant: 南开大学

    Abstract: 本发明提出一种基于多变量AUC的特征选择方法,从癌症的差异表达数据中选择最互补的基因子集,实现全局分类性能最大化。本发明首先基于特征的可能误分类集提出一种AUC计算的新角度;然后对于一个特征集,确定其共同可能误分类集并计算每个特征组合后的新AUC;一个特征的新AUC与原始AUC的差值展示了组合后特征集中的其他特征对该特征分类能力的互补作用。最后基于特征组合后的新AUC计算mvAUC,并增量式的选择使当前mvAUC最大化的候选特征加入被选特征子集。本发明方法具有可以直接评估被选特征子集的全局类辨别能力的优点,不需要成对地计算候选特征和每个被选特征之间的冗余信息。

Patent Agency Ranking