-
公开(公告)号:CN114139541B
公开(公告)日:2022-08-02
申请号:CN202111389485.4
申请日:2021-11-22
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/295 , G06F16/35
Abstract: 本公开涉及一种命名实体识别方法、装置、设备及介质。其中,命名实体识别方法包括:获取待识别的目标文本;对目标文本进行语义特征编码,得到具有上下文信息的第一编码向量,以及对目标文本进行实体特征编码,得到具有上下文信息的第二编码向量;基于第一编码向量,提取实体片段对应的边界信息;基于第一编码向量、第二编码向量和边界信息,对目标文本进行实体分类,得到目标文本对应的目标实体类别。根据本公开实施例,能够快速地从非结构化文本中提取出实体类别信息,并且提高对非结构化文本进行实体类别分类的准确性。
-
公开(公告)号:CN114692601A
公开(公告)日:2022-07-01
申请号:CN202011572938.2
申请日:2020-12-25
Applicant: 北京中科闻歌科技股份有限公司 , 国科智安(北京)科技有限公司 , 深圳中科闻歌科技有限公司
IPC: G06F40/211 , G06F40/279 , G06F16/31 , G06F16/33 , G06F16/35
Abstract: 本发明实施例涉及一种信息抽取方法、装置、电子设备及存储介质,包括:利用预设规则从至少一个信息通道中获取目标事件的相关文本;对所述相关文本进行分割,得到多个句子;对每一所述句子进行句法分析,根据句法分析结果得到所述句子中的目标专家实体和目标发言指示词;根据所述目标专家实体和目标发言指示词从所述句子中抽取目标专家职称和目标专家观点。由此,可以实现从互联网的海量信息中抽取出专家对于特定事件的观点。
-
公开(公告)号:CN113656660B
公开(公告)日:2022-06-28
申请号:CN202111199634.0
申请日:2021-10-14
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/903 , G06K9/62 , G06N3/08 , G06N3/04
Abstract: 本公开涉及一种跨模态数据的匹配方法、装置、设备及介质。其中,跨模态数据的匹配方法包括:获取待匹配数据和候选数据,待匹配数据和候选数据的数据模态不同;对待匹配数据和候选数据进行量子化表示,得到待匹配数据与候选数据在量子复合系统内的分布信息;基于分布信息,进行相关性特征计算,得到待匹配数据与候选数据之间的相关性特征参数;在相关性特征参数满足预设匹配条件的情况下,确定待匹配数据与候选数据相互匹配。根据本公开实施例,能够提高跨模态信息的匹配精度。
-
公开(公告)号:CN114626863A
公开(公告)日:2022-06-14
申请号:CN202210188256.4
申请日:2022-02-28
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本公开涉及一种出口骗税企业的检测方法、装置、设备及存储介质。本公开实施例,通过获取企业的税务数据;对税务数据进行特征提取处理,得到企业与出口退税行为相关的特征;将特征输入预设的出口骗税企业检测模型,基于出口骗税企业检测模型进行出口骗税企业检测,减少了对人工检测经验的依赖,提高了出口骗税企业检测的准确性和检测效率,能够适用于不断更新的骗税手法的检测。
-
公开(公告)号:CN114429141A
公开(公告)日:2022-05-03
申请号:CN202210334709.X
申请日:2022-03-31
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/30 , G06F40/295
Abstract: 本公开实施例提供了一种答案确定方法、装置、计算设备及存储介质。答案确定方法包括:对待回答问题进行改写,得到改写问题,所述改写问题为与所述待回答问题语义相近的问题;根据所述待回答问题和/或所述改写问题,得到多个候选答案;根据所述多个候选答案确定用于回答所述待回答问题的目标答案。因为目标答案是根据多个候选答案确定的答案,所以相比于现有技术方案,本公开实施例提供的答案确定方法确定的目标答案与待回答问题匹配的可能性提高,也就是提高输出答案为正确答案的可能性。
-
公开(公告)号:CN114297357A
公开(公告)日:2022-04-08
申请号:CN202111616638.4
申请日:2021-12-27
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/332 , G06F40/289 , G06F40/242 , G06N10/20
Abstract: 本申请实施例提供一种基于量子计算的问答模型构建方法、装置、电子设备及存储介质,其中,该方法包括:获取查询词汇向量集合和答案语句向量集合;根据查询词汇向量集合获得查询词汇向量集合中每个查询词汇向量的查询词汇向量密度矩阵,作为查询词汇向量密度矩阵集合;根据答案语句向量集合获得答案语句向量集合中每个答案语句向量的答案语句向量密度矩阵,作为答案语句向量密度矩阵集合;根据查询词汇向量密度矩阵集合和答案语句向量密度矩阵集合获得答案语句向量密度矩阵集合中全部答案语句向量密度矩阵的相关性分值和状态演化矩阵;根据相关性分值和状态演化矩阵构建问答模型。实施本申请实施例,提高了智能问答模型的准确率,方便使用。
-
公开(公告)号:CN114265982A
公开(公告)日:2022-04-01
申请号:CN202111583634.0
申请日:2021-12-22
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/9535 , G06F16/9536 , G06F16/36 , G06F16/335 , G06F40/216 , G06N3/04
Abstract: 本发明涉及一种基于知识图谱的智能推荐方法,包括:A1、针对指定领域内待推荐信息的目标用户,获取目标用户的类型;A2、若目标用户的类型为活跃用户,则根据目标用户在第一预设时间段内的交互行为数据,基于知识图谱推荐内容方式和基于用户协同过滤推荐方式获取个性化的推荐结果;其中,知识图谱是预先构建的存储有指定领域内知识和实体之间关系的结构化的图谱信息;个性化的推荐结果包括:目标用户的最近邻用户对应的信息项和与目标用户的偏好实体匹配的信息项,本发明的方法可以有效解决现有推荐方法中存在的数据稀疏且关联性弱的问题,同时实现了快速精准推送文本信息,并做到千人千面的个性化推送。
-
公开(公告)号:CN114155530A
公开(公告)日:2022-03-08
申请号:CN202111328925.5
申请日:2021-11-10
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06V30/148 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本公开涉及一种文本识别及问答方法、装置、设备及介质。其中,文本识别方法包括:获取待识别图像;对待识别图像进行文本识别,得到文本识别结果,文本识别结果包括多个连续文本片段;计算待拼接文本片段对的语义关联得分;在待拼接文本片段对的语义关联得分满足预设语义关联条件的情况下,对待拼接文本片段对进行文本拼接,得到待识别图像的文本内容。根据本公开实施例,能够提高图文识别精度。
-
公开(公告)号:CN114139541A
公开(公告)日:2022-03-04
申请号:CN202111389485.4
申请日:2021-11-22
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/295 , G06F16/35
Abstract: 本公开涉及一种命名实体识别方法、装置、设备及介质。其中,命名实体识别方法包括:获取待识别的目标文本;对目标文本进行语义特征编码,得到具有上下文信息的第一编码向量,以及对目标文本进行实体特征编码,得到具有上下文信息的第二编码向量;基于第一编码向量,提取实体片段对应的边界信息;基于第一编码向量、第二编码向量和边界信息,对目标文本进行实体分类,得到目标文本对应的目标实体类别。根据本公开实施例,能够快速地从非结构化文本中提取出实体类别信息,并且提高对非结构化文本进行实体类别分类的准确性。
-
公开(公告)号:CN113992944A
公开(公告)日:2022-01-28
申请号:CN202111265047.7
申请日:2021-10-28
Applicant: 北京中科闻歌科技股份有限公司
IPC: H04N21/234 , H04N21/2343 , H04N21/233 , H04N21/44 , H04N21/4402 , H04N21/439 , H04N21/845 , H04N21/8549
Abstract: 本公开涉及一种视频编目方法、装置、设备、系统及介质。其中,该视频编目方法包括:获取目标视频的视频特征;基于目标视频的视频特征,对目标视频进行切分,得到多个视频片段;针对每个视频片段,基于视频片段对应的视频文本,确定视频片段对应的视频标签,视频文本包括第一音频文本和第一字幕文本,视频标签至少包括语义标签;利用多个视频片段和每个视频片段对应的视频标签对目标视频进行编目,得到目标视频对应的编目结果。根据本公开实施例,能够提供一种自动化的视频编目方法,提高了视频编目的效率。
-
-
-
-
-
-
-
-
-