-
公开(公告)号:CN117808094A
公开(公告)日:2024-04-02
申请号:CN202410016560.X
申请日:2024-01-05
Applicant: 东北大学
IPC: G06N5/025 , G06N5/02 , G06F40/279 , G06F40/30 , G06N3/045
Abstract: 本发明提供一种基于深度学习的实体关系联合抽取方法,涉及自然语言处理技术领域。为进一步挖掘关系的语义信息和缓解重叠三元组问题,本发明构建了一种基于深度学习的实体关系联合抽取模型,利用TransE方法对三元组进行双向抽取,根据抽取出的头实体和尾实体以及关系得到对应的头尾实体表示,并将其分别和抽取出来的头尾实体进行相似度的计算,选择相似度排序在一定范围内的头尾实体和对应的关系组成三元组,本发明通过双向抽取可以很大程度上解决重叠三元组的问题,不再将关系作为离散的标签,而是捕获了更细粒度的语义信息,而且还充分考虑了实体和关系之间的联系,使得关系在抽取三元组的时候发挥了很大的作用,进而提升了三元组抽取的准确率。
-
公开(公告)号:CN118820595A
公开(公告)日:2024-10-22
申请号:CN202410918915.4
申请日:2024-07-10
Applicant: 东北大学
IPC: G06F16/9535 , G06F16/36 , G06N5/04
Abstract: 本发明提供一种基于知识森林和用户偏好的个性化搜索推荐方法,涉及推荐知识表示技术领域和搜索技术领域。该方法包括:收集若干个用户历史信息并根据用户需求为每个用户构建一棵知识模式树;采用实体关系抽取算法分别对用户历史信息进行实体关系抽取,并利用抽取到的实体和知识模式树构建知识树,进而利用所有用户的知识树构建知识森林;采用图嵌入技术分别对知识森林中每个知识树进行赋权,得到最终的知识森林并保存至图数据库;根据目标用户的用户需求构建目标用户知识树,通过调用图数据库的知识森林来计算目标用户知识树与知识森林中各知识树的相似度,生成目标用户的个性化推荐列表,提高了推理搜索的准确性和效率。
-
公开(公告)号:CN119938832A
公开(公告)日:2025-05-06
申请号:CN202411982091.3
申请日:2024-12-31
Applicant: 东北大学
IPC: G06F16/3329 , G06F16/334 , G06N5/04 , G06N5/022 , G06V30/19
Abstract: 本发明提供一种结合大模型的复杂问题分解与多模态知识检索方法,涉及人工智能与信息检索技术领域。该方法针对多模态知识库,通过提取图像模态知识数据包含的语义信息,提供一种具有图像理解能力的知识检索方法,通过对复杂问题的分解,构建了复杂问题中可能蕴含的众多子问题之间的语义和结构关系,用于复杂问题分解和多模态知识检索以生成准确全面答案,从而帮助大模型更准确、更全面地回答复杂问题;此外,通过整合复杂问题的相关背景知识,扩展了检索工具对多模态知识库的检索能力。
-
公开(公告)号:CN118114674A
公开(公告)日:2024-05-31
申请号:CN202410412924.6
申请日:2024-04-08
Applicant: 东北大学
IPC: G06F40/295 , G06F16/35 , G06F18/214 , G06F18/241 , G06N3/045 , G06N3/0455 , G06N3/0499 , G06N3/084 , G06N3/0985
Abstract: 本发明公开一种可用于小样本场景的命名实体识别方法,涉及自然语言处理中的命名实体识别技术领域。本发明中包括一种新的编码二维坐标表的方法,在二维坐标表中对每个坐标对应的Span段同时对其是否为某一实体的任一边界和是否为某一实体的左右边界进行标注,每个训练样例可以产生更多有效的训练对,可以有效缓解训练样例信息利用不充分问题,此编码还可以通过解码输出的标注结果方式处理命名实体嵌套及不连续问题,此外,使用了一种单双边界交叉注意力模块,有助于模型识别效果,为了缓解小样本样例不足、训练困难的问题,本发明进一步利用不同任务中对应的不同命名实体类型作为提示词,增加训练的信息,降低任务的难度。
-
公开(公告)号:CN118673131A
公开(公告)日:2024-09-20
申请号:CN202410823151.0
申请日:2024-06-25
Applicant: 东北大学
IPC: G06F16/335 , G06F16/33 , G06F16/31 , G06N5/04 , G06N20/00
Abstract: 本发明提供基于推理轨迹生成的带权有向推理树集合的搜索推荐方法,涉及搜索推荐技术领域。该方法包括:根据用户需求收集特定业务场景下的历史文本数据并提取语义信息,利用提取到的语义信息构建具有语义信息且包含完整推理轨迹的带权有向推理树集合;采用向量空间映射和推理路径融合的方法将该带权有向推理树集合中的带权有向推理树转换为向量表示;将大模型作为策略模型,采用基于大模型的推理轨迹生成方法生成完整的推理路径,并构建偏好数据集,采用直接偏好优化算法对策略模型进行优化;获取用户提供的检索词并输入优化后的策略模型中,得到该检索词的最终推荐结果,从而为用户提供更加个性化和优质的搜索结果和推荐内容。
-
公开(公告)号:CN117874276A
公开(公告)日:2024-04-12
申请号:CN202410029979.9
申请日:2024-01-09
Applicant: 东北大学
IPC: G06F16/583 , G06N3/0455 , G06N3/08
Abstract: 本发明提供基于词生成的端到端编码器‑解码器图像描述生成方法,涉及图像描述生成技术领域。首先获取图像描述数据集全集,并根据图像描述数据集全集构建若干个参考句集合,同时获取用于模型初始化的预训练权重;根据参考句集合构建图像描述数据集子集;然后构建基于词生成的端到端编码器‑解码器的图像描述模型,包括串行的图像特征抽取器、语言模型规模适应器、词级别描述生成器、描述生成集成模块;利用预训练权重对图像描述模型进行初始化;利用构建的图像描述模型生成最终图像描述;通过设定的训练策略训练图像描述模型,得到训练好的图像描述模型;最后通过训练好的图像描述模型实现图像描述生成,提高了图像描述文本的生成效率和质量。
-
-
-
-
-