-
公开(公告)号:CN118193732A
公开(公告)日:2024-06-14
申请号:CN202410193200.7
申请日:2024-02-21
Applicant: 中国科学院自动化研究所
IPC: G06F16/35 , G06F16/33 , G06F16/335 , G06F40/35
Abstract: 本发明提供一种问题加注标签方法、装置、电子设备和存储介质,其中方法包括:获取目标问题和标签集合,标签集合内包含多个候选标签;对目标问题和各候选标签分别进行特征提取,得到目标问题的问题语义特征和各候选标签的标签语义特征;基于问题语义特征,以及各候选标签的标签语义特征,从各候选标签中确定目标问题对应的目标标签,克服了传统方案中标签加注效率低下、主观性强,工作量大,以及自动加注的标签偏离问题语义并不准确的缺陷,实现了全面准确的标签加注,并且能够帮助用户快速定位相关内容,提升了用户在查找相关问题、答案等上的便捷度,助力了推荐系统、搜索引擎以及其他智能系统的优化更新,并为用户的使用体验的优化提供了助益。
-
公开(公告)号:CN110516160B
公开(公告)日:2022-04-01
申请号:CN201910818603.5
申请日:2019-08-30
Applicant: 中国科学院自动化研究所
IPC: G06F16/9535 , G06F16/36
Abstract: 本发明属于用户建模与推荐系统领域,具体涉及一种基于知识图谱的用户建模方法、序列推荐方法,旨在为了解决现有用户建模方法无法有效提取用户动态访问信息的特征,准确捕捉用户兴趣;现有序列推荐系统推荐准确率不高,用户体验较差的问题。本发明将内容特征和结构特征作为项目的完整表示,基于用户与项目之间的语义路径获取用户和项目之间的交互表示,通过自注意力模型获取用户动态偏好。基于用户动态偏好和待预测项目,通过推荐模型得到推荐结果。本发明的用户建模方法能够有效提取用户动态访问信息的特征,引入语义路径准确的捕捉交互级别的用户动态偏好;基于知识图谱序列推荐方法提升了推荐的准确性,用户体验更好。
-
公开(公告)号:CN113761784A
公开(公告)日:2021-12-07
申请号:CN202110494893.X
申请日:2021-05-07
Applicant: 腾讯科技(深圳)有限公司 , 中国科学院自动化研究所
IPC: G06F30/27 , G06F17/16 , G06K9/62 , G06N20/00 , G06F111/08
Abstract: 本发明实施例公开了一种数据处理方法、数据处理模型的训练方法及装置,其中,该数据处理方法通过根据与目标实体节点之间的实体关系相同的邻居实体节点与目标实体节点得到第一子图,根据第一子图中目标实体节点与邻居实体节点的连接结构,得到第一子图中所有实体节点的实体节点特征集合,根据实体节点特征集合得到第一子图的第一子图特征,聚合多个第一子图特征得到目标实体节点对应的目标实体特征,由于目标实体特征根据多个对应不同实体关系的第一子图聚合得到,因而最终得到的目标实体特征嵌入了不同实体关系对应的特征信息,从而使得目标实体特征的表达更加丰富,能够提高目标实体特征的准确性,可广泛应用在人工智能领域。
-
公开(公告)号:CN110895561A
公开(公告)日:2020-03-20
申请号:CN201911103544.X
申请日:2019-11-13
Applicant: 中国科学院自动化研究所
IPC: G06F16/332 , G16H80/00
Abstract: 本发明属于信息检索与问答系统领域,具体涉及了一种基于多模态知识感知的医疗问答检索方法、系统、装置,旨在解决现有医疗问答系统无法理解检索词的内涵导致检索准确率低的问题。本发明方法包括:构建多模态医疗知识图谱,获取用户问题对应的备选答案集合;对问题与备选答案进行文本编码,并提取问题与备选答案的实体;通过路径编码获取问题实体到备选答案实体的路径表示;通过医疗问答检索模型获取问题到各备选答案的交互表示;通过多层感知机分别获取问题到各备选答案的匹配分数;最大匹配分数对应的备选答案为检索答案。本发明有效地将知识图谱语义信息应用到医疗问答中,构建问题与答案对之间的交互,提高了检索得到的回答的精确度与准确性。
-
公开(公告)号:CN110209897A
公开(公告)日:2019-09-06
申请号:CN201810144881.2
申请日:2018-02-12
Applicant: 腾讯科技(深圳)有限公司 , 中国科学院自动化研究所
IPC: G06F16/9032
Abstract: 本发明公开了一种智能对话方法、装置、存储介质及设备,属于人工智能技术领域。所述方法包括:接收目标终端发送的对话内容;获取发起对话的目标用户的用户特征信息;获取与所述对话内容存在内容关联的上下文信息;根据所述用户特征信息以及所述上下文信息,检索与所述对话内容相匹配的目标回复内容;将所述目标回复内容发送给所述目标终端。本发明实现了基于用户发起的对话内容、与该对话内容相关联的上下文信息以及用户特征信息,来寻找与该对话内容相匹配的最佳回复,该种智能对话方式更加符合真实场景中不同用户之间以及同一用户多轮对话的聊天需求,使得人机对话聊天过程更加自然,显著地提升了人与机器之间的对话质量。
-
公开(公告)号:CN109408743A
公开(公告)日:2019-03-01
申请号:CN201810956003.0
申请日:2018-08-21
Applicant: 中国科学院自动化研究所
IPC: G06F16/955 , G06F17/27 , G06K9/62
Abstract: 本发明涉及互联网文本分析技术领域,具体涉及一种文本链接嵌入方法,所述方法是根据预设的字符级特征向量进行向量拼接得出待检测文本的目标词条和知识实体库中实体的特征向量,然后计算实体和目标词条的特征向量相似度以找到与目标词条对应的相似实体,最后将所述相似实体对应的实体链接信息嵌入对应的目标词条以完成文本链接嵌入。本发明的文本链接嵌入方法通过将实体和目标词条转换成能够保留语义特征的特征向量,根据目标词条和实体的特征向量相似度判断目标词条与实体之间词义是否相似。这样一来,即使是在同义不同词的情况下,也能做到目标词条与实体的精准匹配,从而有效地避免出现实体漏检情况。
-
公开(公告)号:CN113469214B
公开(公告)日:2024-12-06
申请号:CN202110553822.2
申请日:2021-05-20
Applicant: 中国科学院自动化研究所
IPC: G06F30/27
Abstract: 本发明提供一种虚假新闻检测方法、装置、电子设备和存储介质,所述方法包括:将待检测新闻数据输入至新闻检测模型中,得到新闻检测模型输出的新闻检测结果;其中,新闻检测模型用于提取待检测新闻数据的多个文本特征和图像特征,基于自注意力机制确定各文本特征与图像特征对应的上下文向量,并基于各上下文向量的拼接向量确定新闻检测结果。本发明基于自注意力机制确定各文本特征与图像特征对应的上下文向量,可以使得文本特征中携带的信息与图像特征中携带的信息相互进行补充,进而使得基于各上下文向量得到的拼接向量够准确且完整表达待检测新闻数据中包含的信息内容,实现准确获取新闻检测结果。
-
公开(公告)号:CN113239214B
公开(公告)日:2022-10-28
申请号:CN202110543714.7
申请日:2021-05-19
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于跨模态检索领域,具体涉及了一种基于有监督对比的跨模态检索方法、系统及设备,旨在解决现有的监督式跨模态学习方法一般通过线性投影捕获数据相关性,且通常聚集于最大化成对相关性或分类准确性,InfoNCE损失平等对待所有类别,从而导致跨模态检索结果准确性不高的问题。本发明包括:获取待检索的跨模态输入数据;通过表示学习网络映射到统一空间中,获得输入数据的跨模态表示;通过训练好的跨模态检索网络进行跨模态检索。本发明将不同模态的数据映射到统一空间中,通过多标签判别性负例注意力提高具有高共现概率的语义上不同类别的样本对的比例,将InfoNCE损失函数扩展为多标签跨模态InfoNCE损失函数,实现了高准确性与高精度的跨模态检索。
-
公开(公告)号:CN113239214A
公开(公告)日:2021-08-10
申请号:CN202110543714.7
申请日:2021-05-19
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于跨模态检索领域,具体涉及了一种基于有监督对比的跨模态检索方法、系统及设备,旨在解决现有的监督式跨模态学习方法一般通过线性投影捕获数据相关性,且通常聚集于最大化成对相关性或分类准确性,InfoNCE损失平等对待所有类别,从而导致跨模态检索结果准确性不高的问题。本发明包括:获取待检索的跨模态输入数据;通过表示学习网络映射到统一空间中,获得输入数据的跨模态表示;通过训练好的跨模态检索网络进行跨模态检索。本发明将不同模态的数据映射到统一空间中,通过多标签判别性负例注意力提高具有高共现概率的语义上不同类别的样本对的比例,将InfoNCE损失函数扩展为多标签跨模态InfoNCE损失函数,实现了高准确性与高精度的跨模态检索。
-
公开(公告)号:CN109408743B
公开(公告)日:2020-11-17
申请号:CN201810956003.0
申请日:2018-08-21
Applicant: 中国科学院自动化研究所
IPC: G06F16/955 , G06F40/284 , G06K9/62
Abstract: 本发明涉及互联网文本分析技术领域,具体涉及一种文本链接嵌入方法,所述方法是根据预设的字符级特征向量进行向量拼接得出待检测文本的目标词条和知识实体库中实体的特征向量,然后计算实体和目标词条的特征向量相似度以找到与目标词条对应的相似实体,最后将所述相似实体对应的实体链接信息嵌入对应的目标词条以完成文本链接嵌入。本发明的文本链接嵌入方法通过将实体和目标词条转换成能够保留语义特征的特征向量,根据目标词条和实体的特征向量相似度判断目标词条与实体之间词义是否相似。这样一来,即使是在同义不同词的情况下,也能做到目标词条与实体的精准匹配,从而有效地避免出现实体漏检情况。
-
-
-
-
-
-
-
-
-