-
公开(公告)号:CN111368050B
公开(公告)日:2023-07-21
申请号:CN202010123950.9
申请日:2020-02-27
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/332 , G06F16/335 , G06F16/36 , G06Q30/0601
Abstract: 本申请的实施例提供了一种文档页面的推送方法、装置。该方法包括:接收由第三方平台根据用户意图提供的第一文档页面集合;通过用户行为特征模型,确定所述第一文档页面集合中的文档页面与所述用户意图的关联度,所述关联度用于表征所述第一文档页面集合中的文档页面符合所述用户意图的程度;过滤所述第一文档页面集合中的所述关联度低于预定阈值的文档页面,得到第二文档页面集合;将所述第二文档页面集合中的文档页面推送给用户。本申请实施例的技术方案可以提高对文档页面进行推送的准确性。
-
公开(公告)号:CN111459990B
公开(公告)日:2021-07-06
申请号:CN202010243704.7
申请日:2020-03-31
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/2457 , G06F16/28
Abstract: 本发明实施例公开了对象处理方法、系统及计算机可读存储介质和计算机设备,应用于基于人工智能的信息处理技术领域。根据目标功能应用的对象行为信息将多个对象划分为多个对象集,分别提取每个对象集的整体特征信息,当对象集中至少两个对象集之间具有共同对象,还需要对这至少两个对象集中任一对象集的共同对象的初始特征信息进行更新,使得任一对象集的共同对象的更新后特征信息包含了其它对象集中共同对象的语义特征,进而再根据多个对象集的更新后整体特征信息得到各个对象的最终特征信息后,进行对象的分类或查找类似。通过将共同对象在不同对象集中得到的初始特征信息进行相互融合,使得共同对象的最终特征信息更准确。
-
公开(公告)号:CN113821608A
公开(公告)日:2021-12-21
申请号:CN202110613456.5
申请日:2021-06-02
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/332 , G06F16/36 , G06F16/953 , G06F40/295 , G06F40/30
Abstract: 本申请涉及一种服务搜索方法、装置、计算机设备和存储介质。所述方法通过获取服务搜索请求;读取查询词条对应的原始服务搜索结果;识别查询词条与原始服务搜索结果的服务知识图谱关联关系;提取原始服务搜索结果中与查询词条存在服务知识图谱上下位关系的数据,得到目标服务搜索结果获取服务搜索请求。本申请的服务搜索方法,通过在得到原始服务搜索结果后,通过识别查询词条与原始服务搜索结果的服务知识图谱关联关系;并提取原始服务搜索结果中与查询词条存在服务知识图谱上下位关系的数据,基于这些数据得到最终的目标服务搜索结果,所得的目标服务搜索结果更能体现与查询词条的关联关系,能有效提高服务搜索过程的搜索准确率。
-
公开(公告)号:CN113821588A
公开(公告)日:2021-12-21
申请号:CN202110614403.5
申请日:2021-06-02
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/33 , G06F16/35 , G06F16/36 , G06F40/194 , G06F40/279 , G06F40/30
Abstract: 本申请涉及人工智能技术领域,公开了一种文本处理方法、装置、电子设备及存储介质,该方法包括:确定查询文本相对于待匹配文本的匹配权重矩阵,匹配权重矩阵包括第一权重矩阵和第二权重矩阵中的至少一项;根据匹配权重矩阵,对查询文本相对于待匹配文本的相似度矩阵进行增强,得到第一相似度矩阵,查询文本相对于待匹配文本的相似度矩阵是根据查询文本中各分词的词向量和待匹配文本中各分词的词向量进行相似度计算得到的;根据第一相似度矩阵确定查询文本与待匹配文本之间的匹配度分数;根据查询文本与待匹配文本之间的匹配度分数确定目标匹配文本。通过本方案可以有效提高文本匹配的准确度。
-
公开(公告)号:CN113408293A
公开(公告)日:2021-09-17
申请号:CN202110265862.7
申请日:2021-03-11
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F40/30 , G06F40/194 , G06F40/279 , G06F16/35 , G06N20/00
Abstract: 本申请提供了一种语义匹配方法、装置、电子设备及存储介质,所述方法包括:获取第一文本以及待与所述第一文本进行匹配的至少两个第二文本;基于文本语义,将所述第一文本向各所述第二文本进行命中,得到第一命中结果;基于文本语义,将所述第二文本分别向所述第一文本进行命中,得到第二命中结果;基于所述第一命中结果以及所述第二命中结果,确定与所述第一文本所匹配的第二文本。本申请实施例能够提高语义匹配的准确度。
-
公开(公告)号:CN113821608B
公开(公告)日:2024-12-10
申请号:CN202110613456.5
申请日:2021-06-02
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/332 , G06F16/36 , G06F16/953 , G06F40/295 , G06F40/30
Abstract: 本申请涉及一种服务搜索方法、装置、计算机设备和存储介质。所述方法通过获取服务搜索请求;读取查询词条对应的原始服务搜索结果;识别查询词条与原始服务搜索结果的服务知识图谱关联关系;提取原始服务搜索结果中与查询词条存在服务知识图谱上下位关系的数据,得到目标服务搜索结果获取服务搜索请求。本申请的服务搜索方法,通过在得到原始服务搜索结果后,通过识别查询词条与原始服务搜索结果的服务知识图谱关联关系;并提取原始服务搜索结果中与查询词条存在服务知识图谱上下位关系的数据,基于这些数据得到最终的目标服务搜索结果,所得的目标服务搜索结果更能体现与查询词条的关联关系,能有效提高服务搜索过程的搜索准确率。
-
公开(公告)号:CN110516250B
公开(公告)日:2024-06-18
申请号:CN201910809204.2
申请日:2019-08-29
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F40/289 , G06F40/216
Abstract: 本申请提供一种新词的发现方法和装置,从文本集合中获取待处理文本后,利用词汇库将待处理文本划分为多个基本单元,然后根据文本集合,计算待处理文本中每两个基本单元之间的关联程度指标,根据待处理文本中每两个基本单元之间的关联程度指标,生成待处理文本中每一个基本单元的特征向量,进而利用各个基本单元的特征向量,计算得到每两个相邻的基本单元之间的相似度;根据待处理文本中每两个相邻的基本单元之间的相似度拆分待处理文本,得到多个子文本,最后将多个子文本作为新词加入所述词汇库。本申请提供的新词发现方法能够直接从无标注的文本集合中发现新词,从而解决基于人为标注的文本实现的现有的新词发现技术效率较低的问题。
-
公开(公告)号:CN113821587B
公开(公告)日:2024-05-17
申请号:CN202110613483.2
申请日:2021-06-02
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/33 , G06F16/35 , G06F40/279 , G06F40/30 , G06N20/00
Abstract: 本申请公开了一种文本相关性确定方法、模型训练方法、装置及存储介质,先对信息请求文本和候选信息文本进行向量化处理,得到多个第一词向量和多个第二词向量,再对候选信息文本进行特征提取处理得到特征词向量,然后将特征词向量和多个第一词向量进行匹配处理得到匹配信息,接着对第一词向量、第二词向量、特征词向量和匹配信息进行组合处理得到相关性参数,根据相关性参数确定信息请求文本和候选信息文本的相关性。本申请在信息请求文本是不属于训练数据的长尾文本的情况下,也能够实现对信息请求文本和候选信息文本的相关性的良好预测,从而能够提高用户使用例如微信的搜一搜功能的粘度。可见,本申请可以广泛应用于自然语言处理技术中。
-
公开(公告)号:CN110580280B
公开(公告)日:2023-11-14
申请号:CN201910848377.5
申请日:2019-09-09
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请提供一种新词的发现方法、装置和存储介质,将文本集合中的每一个文本划分为多个基本单元后,利用最大期望算法计算文本集合中每个基本单元的出现次数,得到每个基本单元的置信度,然后从每个文本中确定出多个词组;其中,每个词组均包括多个连续的基本单元,并且,每个词组均包括至少一个对应的置信度大于置信度阈值的基本单元,利用最大期望算法计算文本集合中每个词组的出现次数得到每个词组的置信度,确定词汇库未包括的基本单元和词组为新词,根据新词的置信度将所有新词分类记录在词汇库中。本申请提供的新词发现方法能够直接从无标注的文本集合中发现新词,从而解决基于人为标注的文本实现的现有的新词发现技术效率较低的问题。
-
公开(公告)号:CN113535795A
公开(公告)日:2021-10-22
申请号:CN202110004248.5
申请日:2021-01-04
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/2458 , G06F16/28 , G06F16/953 , G06N3/08 , G06N3/04
Abstract: 本发明涉及自然语言处理技术领域,具体是一种搜索数据挖掘方法、装置、设备及存储介质,所述方法包括:获取历史搜索行为数据;基于所述历史搜索行为数据构建关系网络图;基于所述关系网络图获取多个节点样本对;利用所述多个节点样本对训练图神经网络模型,得到所述关系网络图中各个节点的词嵌入向量;其中,所述图神经网络模型包括图神经网络层,所述图神经网络层用于捕获每个所述节点样本对中的节点对应的相邻节点集合,从所述相邻节点集合中去除所述节点样本对中的其他节点,得到目标节点集合,基于所述目标节点集合对所述节点进行特征聚合;根据所述词嵌入向量对所述关系网络图中的各个节点与其他节点进行匹配,得到匹配结果。
-
-
-
-
-
-
-
-
-