文本预测方法、用于文本预测的模型建立方法及装置

    公开(公告)号:CN115563976A

    公开(公告)日:2023-01-03

    申请号:CN202210967061.X

    申请日:2022-08-11

    Applicant: 浙江大学

    Abstract: 本申请实施例公开了一种文本预测方法、用于文本预测的模型建立方法及装置。主要技术方案包括:获取待预测文本序列以及与待预测文本序列相关的图像序列;将待预测文本序列和图像序列输入文本表征模型,得到待预测文本序列的文本表征;文本表征模型包括文本编码器、图像编码器和聚合编码器;文本编码器对待预测文本序列进行编码,得到待预测文本序列的第一向量表示;图像编码器对图像序列进行编码,得到图像序列的第二向量表示;聚合编码器对第一向量表示与第二向量表示进行基于关联度的聚合处理,得到待预测文本序列的文本表征;将待预测文本序列的文本表征输入表征映射模型,得到针对待预测文本序列的预测结果。本申请能够提高文本预测的准确性。

    一种基于细粒度领域自适应的图迁移学习方法

    公开(公告)号:CN112668633B

    公开(公告)日:2022-10-14

    申请号:CN202011561512.7

    申请日:2020-12-25

    Applicant: 浙江大学

    Abstract: 本发明提供了一种基于细粒度领域自适应的图迁移学习方法,包括:(1)采集源域和目标域中的样本,并分别标注源域和目标域中的部分或全部样本,获得带标签的样本;(2)为带标签的样本分别构建源域图和目标域图;(3)将源域图中带标签的样本划分为训练集和验证集,将目标域图中带标签的样本视作测试集;(4)使用源域图的训练集及目标域样本训练图神经网络,得到至少两个参数不同的图神经网络;(5)使用源域图的验证集挑选图神经网络;(6)使用挑选出的图神经网络为目标域的样本预测标签;(7)通过对比目标域中全部带标签样本的真实标签和预测标签,得到评价结果。本发明使图迁移学习时可以从共享节点信息中学习领域无关特征。

    基于氨基酸知识图谱和主动学习的蛋白质改造方法

    公开(公告)号:CN114678060A

    公开(公告)日:2022-06-28

    申请号:CN202210121706.8

    申请日:2022-02-09

    Abstract: 本发明公开了一种基于氨基酸知识图谱和主动学习的蛋白质改造方法,包括:基于氨基酸的生化属性构建氨基酸知识图谱;结合氨基酸知识图谱对蛋白质数据进行数据增强,得到蛋白质增强数据并进行表示学习,得到第一蛋白质增强表示;利用预训练蛋白质模型对蛋白质数据,或蛋白质数据和氨基酸知识图谱进行表示学习,得到第二蛋白质增强表示;综合第一蛋白质增强表示和第二蛋白质增强表示,得到蛋白质增强表示;以蛋白质增强表示作为样本,采用主动学习从样本中筛选代表性样本并进行蛋白质性质的人工标注,利用人工标注的代表性样本训练蛋白质性质预测模型;利用蛋白质性质预测模型进行蛋白质改造,能够实现对蛋白质的快速准确改造。

    一种低资源场景下的知识三元组抽取方法

    公开(公告)号:CN112100393B

    公开(公告)日:2022-03-15

    申请号:CN202010789545.0

    申请日:2020-08-07

    Applicant: 浙江大学

    Abstract: 本发明公开了一种低资源场景下的知识三元组抽取方法,通过使用元训练语料训练元模型的方式,指导测试语料训练出泛化性能很好的模型。在元模型训练阶段,通过构造实体对原型和关系原型的方式学习度量查询集与支持集的距离,保证了元模型可以更好的利用低资源的少量样本。同时在抽取知识三元组的过程中,引入知识约束,保证了实体对和关系的内在交互性,可以同时增强两者抽取的性能。

    一种基于本体指导的生成式事件抽取方法

    公开(公告)号:CN113987104A

    公开(公告)日:2022-01-28

    申请号:CN202111142014.3

    申请日:2021-09-28

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于本体指导的生成式事件抽取方法,包括:(1)构建事件本体知识库;(2)设计事件触发词提取模板和事件论元提取模板,分别将输入事件文本映射为第一输入序列,和将融入事件本体的输入事件文本映射为第二输入序列;(3)设计映射多单词标签到事件类型和/或角色类型的类标映射函数;(4)从事件本体知识库中提取与输入事件对应的事件本体后,按照事件触发词提取模板和事件论元提取模板构建第一输入序列和第二输入序列并输入事件提取模型;(5)事件提取模型根据类标映射函数和自身处理机制预测事件类型和角色类型,同时输出事件触发词跨度和事件论元跨度。该方法以实现在全监督和少样本场景下高效地抽取事件结构化知识。

    一种融合图结构和文本信息的自适应知识图谱表示学习方法

    公开(公告)号:CN112632290A

    公开(公告)日:2021-04-09

    申请号:CN202011520309.5

    申请日:2020-12-21

    Applicant: 浙江大学

    Inventor: 陈华钧 朱渝珊

    Abstract: 本发明公开了一种融合图结构和文本信息的自适应知识图谱表示学习方法,包括:(1)采样目标三元组头、尾实体的邻居三元组;(2)计算每个目标三元组和其头、尾实体的邻居三元组的语义表示;(3)计算目标三元组头、尾实体的结构表示;(4)将目标三元组自身的语义表示与其头、尾实体的结构表示拼接,输入自适应分类层,计算分类结果和分类损失;(5)基于梯度下降的优化算法对上述模块进行优化,直至损失值收敛,得到目标三元组自身的语义表示与其头、尾实体的结构表示的最终拼接结果。本发明能够同时捕捉知识图谱的语义表示和图结构表示,自适应地将语义和结构信息融合并且充分利用,在信息缺乏的知识图谱上表现出更好的鲁棒性。

    一种基于神经网络的知识图谱不一致性推理方法

    公开(公告)号:CN112100403A

    公开(公告)日:2020-12-18

    申请号:CN202010973433.0

    申请日:2020-09-16

    Applicant: 浙江大学

    Inventor: 陈华钧 李娟 张文

    Abstract: 本发明公开了一种基于神经网络的知识图谱不一致性推理方法,包括以下步骤:利用知识表示学习算法对三元组表示学习得到实体表示和关系表示以及计算表示得分,并将实体表示和关系表示作为神经网络的输入,利用三元组通过神经网络对公理进行建模以学习用来表示相应的公理的神经网络的参数得到公理模型,利用公理模型获得三元组的公理预测值,基于三元组的表示得分和公理预测值实现三元组和对应公理不一致性的判断。该方法不需要给定本体信息,利用神经网络学习不一致性公理,通过知识表示学习算法和神经网络判断一个三元组是否存在不一致性,在给定公理上是否存在不一致性。

    一种低资源场景下的知识三元组抽取方法

    公开(公告)号:CN112100393A

    公开(公告)日:2020-12-18

    申请号:CN202010789545.0

    申请日:2020-08-07

    Applicant: 浙江大学

    Abstract: 本发明公开了一种低资源场景下的知识三元组抽取方法,通过使用元训练语料训练元模型的方式,指导测试语料训练出泛化性能很好的模型。在元模型训练阶段,通过构造实体对原型和关系原型的方式学习度量查询集与支持集的距离,保证了元模型可以更好的利用低资源的少量样本。同时在抽取知识三元组的过程中,引入知识约束,保证了实体对和关系的内在交互性,可以同时增强两者抽取的性能。

Patent Agency Ranking