基于实体描述的文本生成方法

    公开(公告)号:CN115099235B

    公开(公告)日:2024-11-08

    申请号:CN202210520980.2

    申请日:2022-05-13

    Applicant: 清华大学

    Inventor: 张雷 杨竞潮

    Abstract: 本申请提出了一种基于实体描述的文本生成方法,涉及自然语言处理技术领域,其中,该方法包括:获取目标信息抽取任务的待处理集;使用预先训练的文本生成模型对待处理集进行推理,应用波束搜索对推理结果进行解码,得到所有可能路径,其中,文本生成模型是根据目标信息抽取任务,使用对应的训练集对预训练模型进行训练生成的;对所有可能路径按照概率进行筛选,获得候选路径;根据目标信息抽取任务的类型,对候选路径进行剪枝得到目标信息。采用上述方案的本申请能够很好的完成各类信息抽取任务。

    一种文本分类方法
    2.
    发明公开

    公开(公告)号:CN113344031A

    公开(公告)日:2021-09-03

    申请号:CN202110520242.3

    申请日:2021-05-13

    Applicant: 清华大学

    Inventor: 张雷 杨竞潮

    Abstract: 本发明属于深度学习与算法领域,尤其涉及一种文本分类方法。本发明在构建基于度量学习的三元组损失损失函数时,计算待分类文本与正类目标签之间的欧式距离、待分类文本与负类目标签之间的欧式距离和正类目标签与负类目标签之间的欧式距离,并得到三元组损失函数,同时加入了一个“粗筛‑精筛”的过程。本发明方法基于样本三元组,在优化待分类文本与正样本和负样本的距离之差的同时,加入一个系数同时优化正样本与负样本之间的距离,构造了两层的级联模型,相比于单层模型,有效提高了分类准确率。本发明的文本分类方法,应用简便,易于推广,除了文本分类任务也可以应用在计算机视觉等多种领域。

    一种文本分类方法
    3.
    发明授权

    公开(公告)号:CN113344031B

    公开(公告)日:2022-12-27

    申请号:CN202110520242.3

    申请日:2021-05-13

    Applicant: 清华大学

    Inventor: 张雷 杨竞潮

    Abstract: 本发明属于深度学习与算法领域,尤其涉及一种文本分类方法。本发明在构建基于度量学习的三元组损失损失函数时,计算待分类文本与正类目标签之间的欧式距离、待分类文本与负类目标签之间的欧式距离和正类目标签与负类目标签之间的欧式距离,并得到三元组损失函数,同时加入了一个“粗筛‑精筛”的过程。本发明方法基于样本三元组,在优化待分类文本与正样本和负样本的距离之差的同时,加入一个系数同时优化正样本与负样本之间的距离,构造了两层的级联模型,相比于单层模型,有效提高了分类准确率。本发明的文本分类方法,应用简便,易于推广,除了文本分类任务也可以应用在计算机视觉等多种领域。

    基于实体描述的文本生成方法

    公开(公告)号:CN115099235A

    公开(公告)日:2022-09-23

    申请号:CN202210520980.2

    申请日:2022-05-13

    Applicant: 清华大学

    Inventor: 张雷 杨竞潮

    Abstract: 本申请提出了一种基于实体描述的文本生成方法,涉及自然语言处理技术领域,其中,该方法包括:获取目标信息抽取任务的待处理集;使用预先训练的文本生成模型对待处理集进行推理,应用波束搜索对推理结果进行解码,得到所有可能路径,其中,文本生成模型是根据目标信息抽取任务,使用对应的训练集对预训练模型进行训练生成的;对所有可能路径按照概率进行筛选,获得候选路径;根据目标信息抽取任务的类型,对候选路径进行剪枝得到目标信息。采用上述方案的本申请能够很好的完成各类信息抽取任务。

Patent Agency Ranking