-
公开(公告)号:CN115526338A
公开(公告)日:2022-12-27
申请号:CN202211287916.0
申请日:2022-10-20
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06N20/00 , G06F16/33 , G06F16/338
Abstract: 本申请涉及信息检索领域,特别是涉及一种用于信息检索的强化学习模型构建方法,所述方法包括:S100,获取查询信息Q的特征编码q和候选文档集合中各候选文档的特征编码;S200,构建MDP模型,其中:MDP模型的初始状态s0=[0,q],MDP模型的智能体在初始状态下选择动作a0的概率分布为π(a0|s0;w);S300,根据长期奖励对MDP模型进行模型训练。本发明提高了信息检索时文档排序的精确性。
-
公开(公告)号:CN114528417B
公开(公告)日:2022-07-29
申请号:CN202210377444.1
申请日:2022-04-12
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/36 , G06F40/295 , G06F40/30
Abstract: 本公开涉及一种知识图谱本体构建方法、装置、设备及可读存储介质。本公开通过基于文本语料获取文本领域本体候选集,并基于图像数据获取图像领域本体候选集,基于文本领域本体候选集中文本领域本体的本体概念词,确定文本领域本体的层次结构,基于图像领域本体候选集中图像领域本体的图像语义标签,确定图像领域本体的层次结构。进而基于文本领域本体候选集、文本领域本体的层次结构、图像领域本体候选集和图像领域本体的层次结构,确定包含文本领域本体和图像领域本体的知识图谱本体,实现了对文本和图像等多模态数据的知识本体分类别、分层次的构建。
-
公开(公告)号:CN114495245B
公开(公告)日:2022-07-29
申请号:CN202210363659.8
申请日:2022-04-08
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本公开涉及一种人脸伪造图像鉴别方法、装置、设备以及介质。其中,该方法包括:获取第一样本图像集和第二样本图像集,第一样本图像集中的假脸基于第一伪造方式伪造得到,第二样本图像集中的假脸基于第二伪造方式伪造得到;基于第一样本图像集训练生成用于鉴别第一伪造方式的第一教师模型;基于第二样本图像集训练生成用于鉴别第二伪造方式的第二教师模型;将第一教师模型和第二教师模型融合以训练学生模型,生成用于鉴别第一伪造方式和第二伪造方式的目标人脸伪造图像鉴别模型。根据本公开实施例提供的技术方案,能够使生成的目标人脸伪造图像鉴别模型适用于鉴别不同伪造方法生成的人脸图像,有更好的泛化性、拓展性,且更为高效。
-
公开(公告)号:CN114495245A
公开(公告)日:2022-05-13
申请号:CN202210363659.8
申请日:2022-04-08
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本公开涉及一种人脸伪造图像鉴别方法、装置、设备以及介质。其中,该方法包括:获取第一样本图像集和第二样本图像集,第一样本图像集中的假脸基于第一伪造方式伪造得到,第二样本图像集中的假脸基于第二伪造方式伪造得到;基于第一样本图像集训练生成用于鉴别第一伪造方式的第一教师模型;基于第二样本图像集训练生成用于鉴别第二伪造方式的第二教师模型;将第一教师模型和第二教师模型融合以训练学生模型,生成用于鉴别第一伪造方式和第二伪造方式的目标人脸伪造图像鉴别模型。根据本公开实施例提供的技术方案,能够使生成的目标人脸伪造图像鉴别模型适用于鉴别不同伪造方法生成的人脸图像,有更好的泛化性、拓展性,且更为高效。
-
公开(公告)号:CN113766314B
公开(公告)日:2022-03-04
申请号:CN202111317971.5
申请日:2021-11-09
Applicant: 北京中科闻歌科技股份有限公司
IPC: H04N21/44 , H04N21/439 , H04N21/488 , G06V20/40 , G06V20/62 , G06V10/44 , G06K9/62
Abstract: 本公开涉及一种视频切分方法、装置、设备、系统及存储介质,该方法包括:获取目标视频的视频特征数据,视频特征数据包括音频数据、字幕数据和镜头数据;对音频数据进行切分,得到多个音频数据片段;基于镜头数据对字幕数据进行切分,得到多个字幕子数据;基于音频数据片段和字幕子数据对目标视频进行切分,得到多个视频片段。根据本公开实施例,实现了能够准确的切分目标视频,以进一步使得用户通过浏览目标视频切分后的视频片段,从目标视频中快速获取准确的信息,以准确且快速的浏览目标视频中所包含的信息。
-
公开(公告)号:CN113627151B
公开(公告)日:2022-02-22
申请号:CN202111199899.0
申请日:2021-10-14
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/211 , G06F40/216 , G06F40/242 , G06F40/289 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本公开涉及一种跨模态数据的匹配方法、装置、设备及介质。其中,跨模态数据的匹配方法包括:获取待匹配数据和候选数据,待匹配数据和候选数据的数据模态不同;对待匹配数据和候选数据进行量子化表示,得到待匹配数据与候选数据在量子复合系统内的分布信息;基于分布信息,提取待匹配数据与候选数据之间的量子干涉特征数据;在量子干涉特征数据满足预设匹配条件的情况下,确定候选数据和待匹配数据相匹配。根据本公开实施例,能够提高跨模态信息的匹配精度。
-
公开(公告)号:CN113656660A
公开(公告)日:2021-11-16
申请号:CN202111199634.0
申请日:2021-10-14
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/903 , G06K9/62 , G06N3/08 , G06N3/04
Abstract: 本公开涉及一种跨模态数据的匹配方法、装置、设备及介质。其中,跨模态数据的匹配方法包括:获取待匹配数据和候选数据,待匹配数据和候选数据的数据模态不同;对待匹配数据和候选数据进行量子化表示,得到待匹配数据与候选数据在量子复合系统内的分布信息;基于分布信息,进行相关性特征计算,得到待匹配数据与候选数据之间的相关性特征参数;在相关性特征参数满足预设匹配条件的情况下,确定待匹配数据与候选数据相互匹配。根据本公开实施例,能够提高跨模态信息的匹配精度。
-
公开(公告)号:CN113627151A
公开(公告)日:2021-11-09
申请号:CN202111199899.0
申请日:2021-10-14
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/211 , G06F40/216 , G06F40/242 , G06F40/289 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本公开涉及一种跨模态数据的匹配方法、装置、设备及介质。其中,跨模态数据的匹配方法包括:获取待匹配数据和候选数据,待匹配数据和候选数据的数据模态不同;对待匹配数据和候选数据进行量子化表示,得到待匹配数据与候选数据在量子复合系统内的分布信息;基于分布信息,提取待匹配数据与候选数据之间的量子干涉特征数据;在量子干涉特征数据满足预设匹配条件的情况下,确定候选数据和待匹配数据相匹配。根据本公开实施例,能够提高跨模态信息的匹配精度。
-
公开(公告)号:CN116361470B
公开(公告)日:2024-05-14
申请号:CN202310347961.9
申请日:2023-04-03
Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
IPC: G06F16/35
Abstract: 本发明提供了一种基于话题描述的文本聚类清洗和合并方法,首先对文本进行聚类,得到多个聚类结果,每个聚类结果相当于一个话题,然后基于话题向量与话题中文本向量的文本相似度大小、话题描述与每个文本生成的话题描述的文本相似度大小、文本与话题的关键词相同的个数三个指标,对聚类结果进行清洗和合并,最后得到聚类结果和每个话题的描述,能够使得聚类结果更加准确。
-
公开(公告)号:CN114218381B
公开(公告)日:2022-08-30
申请号:CN202111493451.X
申请日:2021-12-08
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本公开涉及一种立场识别方法、装置、设备及介质。其中,立场识别方法包括:获取待识别的目标文本;对目标文本进行语义识别处理,得到目标文本的整体语义向量;基于预先定义的话题分类模板,对目标文本进行话题识别处理,得到目标文本的话题表示向量;基于整体语义向量和话题表示向量,对目标文本进行立场分类,得到目标文本对应的目标立场类别。根据本公开实施例,能够准确地识别出目标文本所涉及的话题表示向量,从而可以结合文本语义与文本话题对目标文本进行更准确的立场识别。
-
-
-
-
-
-
-
-
-