-
公开(公告)号:CN116049413A
公开(公告)日:2023-05-02
申请号:CN202310346366.3
申请日:2023-04-03
Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
IPC: G06F16/35 , G06F18/22 , G06F18/2415 , G06N3/0455 , G06N3/047
Abstract: 本发明提供了一种基于事件演化的用户观点和立场获取方法,首先对输入的多个文本例如新闻进行文本聚类,然后对聚类结果进行清洗和合并以得到事件,然后针对事件的演化过程,抽取事件对应的评论者、观点和立场,最后按照事件的演化时间顺序,输出对应的评论者、观点和立场,能够根据事件的演变,推断评论者的观点、立场的变化情况。
-
公开(公告)号:CN115526338A
公开(公告)日:2022-12-27
申请号:CN202211287916.0
申请日:2022-10-20
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06N20/00 , G06F16/33 , G06F16/338
Abstract: 本申请涉及信息检索领域,特别是涉及一种用于信息检索的强化学习模型构建方法,所述方法包括:S100,获取查询信息Q的特征编码q和候选文档集合中各候选文档的特征编码;S200,构建MDP模型,其中:MDP模型的初始状态s0=[0,q],MDP模型的智能体在初始状态下选择动作a0的概率分布为π(a0|s0;w);S300,根据长期奖励对MDP模型进行模型训练。本发明提高了信息检索时文档排序的精确性。
-
公开(公告)号:CN114936282A
公开(公告)日:2022-08-23
申请号:CN202210470144.8
申请日:2022-04-28
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本公开实施例涉及一种金融风险线索确定方法、装置、设备和介质。该方法包括:获取待分类文本,并对待分类文本进行分词处理,得到各目标词语;基于各目标词语和目标词向量索引表,生成待分类文本对应的第一融合词向量组合;其中,目标词向量索引表基于初始文本样本集和预设向量转换算法预先构建,初始文本样本集为文本分类模型的训练样本集,预设向量转换算法用于将文本转换为多级别的词向量;将第一融合词向量组合输入文本分类模型,并根据模型输出结果确定待分类文本的目标文本类型;基于目标文本类型确定待分类文本是否为金融分线线索。通过上述技术方案,有效地提升了文本分类速度,进而提升线上金融业务中违规行为信息的发现效率。
-
公开(公告)号:CN114528417B
公开(公告)日:2022-07-29
申请号:CN202210377444.1
申请日:2022-04-12
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/36 , G06F40/295 , G06F40/30
Abstract: 本公开涉及一种知识图谱本体构建方法、装置、设备及可读存储介质。本公开通过基于文本语料获取文本领域本体候选集,并基于图像数据获取图像领域本体候选集,基于文本领域本体候选集中文本领域本体的本体概念词,确定文本领域本体的层次结构,基于图像领域本体候选集中图像领域本体的图像语义标签,确定图像领域本体的层次结构。进而基于文本领域本体候选集、文本领域本体的层次结构、图像领域本体候选集和图像领域本体的层次结构,确定包含文本领域本体和图像领域本体的知识图谱本体,实现了对文本和图像等多模态数据的知识本体分类别、分层次的构建。
-
公开(公告)号:CN114495245B
公开(公告)日:2022-07-29
申请号:CN202210363659.8
申请日:2022-04-08
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本公开涉及一种人脸伪造图像鉴别方法、装置、设备以及介质。其中,该方法包括:获取第一样本图像集和第二样本图像集,第一样本图像集中的假脸基于第一伪造方式伪造得到,第二样本图像集中的假脸基于第二伪造方式伪造得到;基于第一样本图像集训练生成用于鉴别第一伪造方式的第一教师模型;基于第二样本图像集训练生成用于鉴别第二伪造方式的第二教师模型;将第一教师模型和第二教师模型融合以训练学生模型,生成用于鉴别第一伪造方式和第二伪造方式的目标人脸伪造图像鉴别模型。根据本公开实施例提供的技术方案,能够使生成的目标人脸伪造图像鉴别模型适用于鉴别不同伪造方法生成的人脸图像,有更好的泛化性、拓展性,且更为高效。
-
公开(公告)号:CN114495245A
公开(公告)日:2022-05-13
申请号:CN202210363659.8
申请日:2022-04-08
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本公开涉及一种人脸伪造图像鉴别方法、装置、设备以及介质。其中,该方法包括:获取第一样本图像集和第二样本图像集,第一样本图像集中的假脸基于第一伪造方式伪造得到,第二样本图像集中的假脸基于第二伪造方式伪造得到;基于第一样本图像集训练生成用于鉴别第一伪造方式的第一教师模型;基于第二样本图像集训练生成用于鉴别第二伪造方式的第二教师模型;将第一教师模型和第二教师模型融合以训练学生模型,生成用于鉴别第一伪造方式和第二伪造方式的目标人脸伪造图像鉴别模型。根据本公开实施例提供的技术方案,能够使生成的目标人脸伪造图像鉴别模型适用于鉴别不同伪造方法生成的人脸图像,有更好的泛化性、拓展性,且更为高效。
-
公开(公告)号:CN114218923A
公开(公告)日:2022-03-22
申请号:CN202111564484.9
申请日:2021-12-20
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/211 , G06F40/295 , G06F40/258 , G06F40/30 , G06F16/35 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本公开实施例涉及一种文本摘要抽取方法、装置、设备及存储介质。本公开实施例通过对文本进行分句处理,获得文本中的语句和标题;提取语句中的实体,确定语句中的实体占文本中的实体的比例;基于该比例,确定语句的第一得分;基于语句与标题之间的语义相似度,确定语句的第二得分;基于第一得分和第二得分,确定用于形成摘要的语句。本公开实施例通过建模文本语句实体与文本实体,文本语句与文本标题的相关性,减少了文本摘要的冗余性,提高了文本摘要表达文本信息的准确性,提高了用户的阅读体验。
-
公开(公告)号:CN113627151B
公开(公告)日:2022-02-22
申请号:CN202111199899.0
申请日:2021-10-14
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/211 , G06F40/216 , G06F40/242 , G06F40/289 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本公开涉及一种跨模态数据的匹配方法、装置、设备及介质。其中,跨模态数据的匹配方法包括:获取待匹配数据和候选数据,待匹配数据和候选数据的数据模态不同;对待匹配数据和候选数据进行量子化表示,得到待匹配数据与候选数据在量子复合系统内的分布信息;基于分布信息,提取待匹配数据与候选数据之间的量子干涉特征数据;在量子干涉特征数据满足预设匹配条件的情况下,确定候选数据和待匹配数据相匹配。根据本公开实施例,能够提高跨模态信息的匹配精度。
-
公开(公告)号:CN113869383A
公开(公告)日:2021-12-31
申请号:CN202111091011.1
申请日:2021-09-17
Applicant: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司
Abstract: 本公开涉及一种变票实体检测方法及系统。该方法包括:获取多个实体的特征数据,实体包括待检测实体和待检测实体的关联实体,特征数据包括开票特征和属性特征,将特征数据输入至预先训练好的检测模型,得到预先训练好的检测模型输出的待检测实体的变票预测评分,若变票预测评分符合预设的变票实体检测条件,则确定待检测实体属于变票实体。通过上述技术方案,能够利用训练好的检测模型并结合待检测实体和关联实体的特征数据进行较高准确性和鲁棒性的实体预测,可以提高变票实体的预测准确性,以进一步满足税务稽查和征管等涉税业务的实际业务需求。
-
公开(公告)号:CN113656660A
公开(公告)日:2021-11-16
申请号:CN202111199634.0
申请日:2021-10-14
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/903 , G06K9/62 , G06N3/08 , G06N3/04
Abstract: 本公开涉及一种跨模态数据的匹配方法、装置、设备及介质。其中,跨模态数据的匹配方法包括:获取待匹配数据和候选数据,待匹配数据和候选数据的数据模态不同;对待匹配数据和候选数据进行量子化表示,得到待匹配数据与候选数据在量子复合系统内的分布信息;基于分布信息,进行相关性特征计算,得到待匹配数据与候选数据之间的相关性特征参数;在相关性特征参数满足预设匹配条件的情况下,确定待匹配数据与候选数据相互匹配。根据本公开实施例,能够提高跨模态信息的匹配精度。
-
-
-
-
-
-
-
-
-