-
公开(公告)号:CN117033358A
公开(公告)日:2023-11-10
申请号:CN202310937656.5
申请日:2023-07-27
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/215
Abstract: 本公开涉及一种数据排重方法、装置、设备及介质。其中,数据排重方法包括:获取待排重数据以及待排重数据对应的标识信息,标识信息包括待排重数据对应的第一指纹键;基于标识信息确定待排重数据对应的目标存储区域,目标存储区域对应有预设实例,预设实例用于对目标存储区域执行数据写入操作和/或数据读取操作;基于预设实例执行数据读取操作,得到目标存储区域中的目标存储数据,基于目标存储数据确定待排重数据是否存在,根据本公开实施例,能够提高数据排重的效率和准确率。
-
公开(公告)号:CN116797493A
公开(公告)日:2023-09-22
申请号:CN202310964411.1
申请日:2023-08-02
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本发明涉及图像处理领域,尤其涉及一种图像去噪处理系统,包括:含噪人脸图像A、中间素描图像特征集合B=(B1,B2,……,Bn,……,BM)和文本特征C,所述系统实现以下步骤:对A和B1进行下采样得到第一个中间图像特征D1,对Di和Bi进行下采样得到Di+1,对DM和文本特征C进行注意力特征提取得到注意力图像特征E,对E进行上采样得到第一个中间噪声图像特征F1,对Fj和DM‑j进行上采样得到Fj+1,对FM‑1和D1进行上采样得到预测噪声图像G,根据A和G得到去噪人脸图像,将图像模态下的B、文本模态下的C与A进行信息融合,根据双模态的特征信息提高了对A的表征能力,提高了去噪结果的准确性。
-
公开(公告)号:CN115797715B
公开(公告)日:2023-06-23
申请号:CN202211583636.4
申请日:2022-12-09
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06V10/77 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明提供了一种量子视觉MLP处理系统及存储介质,所述系统包括n个量子视觉MLP处理模块、处理器和存储有一段计算机程序的存储器,所述量子视觉处理模块包括n个依次连接的量子视觉MLP处理单元,当所述处理器执行一段计算机程序时,实现如下步骤:获取目标图像对应的图像块初始特征向量,将图像块初始化特征向量输入量子视觉MLP处理模块,以获得该目标图像的最终图像聚合特征和最终图像块特征;本发明提出的量子视觉MLP处理系统,一方面使得图像块的特征充分考虑了其语义内容,更利于图像块的聚合,另一方面,其包含了较少的归纳偏差,具有较高的适应性。
-
公开(公告)号:CN115526338B
公开(公告)日:2023-06-23
申请号:CN202211287916.0
申请日:2022-10-20
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06N20/00 , G06F16/33 , G06F16/338
Abstract: 本申请涉及信息检索领域,特别是涉及一种用于信息检索的强化学习模型构建方法,所述方法包括:S100,获取查询信息Q的特征编码q和候选文档集合中各候选文档的特征编码;S200,构建MDP模型,其中:MDP模型的初始状态s0=[0,q],MDP模型的智能体在初始状态下选择动作a0的概率分布为π(a0|s0;w);S300,根据长期奖励对MDP模型进行模型训练。本发明提高了信息检索时文档排序的精确性。
-
公开(公告)号:CN116049413B
公开(公告)日:2023-06-13
申请号:CN202310346366.3
申请日:2023-04-03
Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
IPC: G06F16/35 , G06F18/22 , G06F18/2415 , G06N3/0455 , G06N3/047
Abstract: 本发明提供了一种基于事件演化的用户观点和立场获取方法,首先对输入的多个文本例如新闻进行文本聚类,然后对聚类结果进行清洗和合并以得到事件,然后针对事件的演化过程,抽取事件对应的评论者、观点和立场,最后按照事件的演化时间顺序,输出对应的评论者、观点和立场,能够根据事件的演变,推断评论者的观点、立场的变化情况。
-
公开(公告)号:CN115840804A
公开(公告)日:2023-03-24
申请号:CN202211602874.5
申请日:2022-12-13
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/332 , G06F16/36 , G06F16/35 , G06F16/33 , G06F40/295
Abstract: 本发明提供了一种面向航空装备知识图谱的问答系统,包括:处理器和存储有一段计算机程序的存储器,当所述处理器执行一段计算机程序时,实现如下步骤:对目标问句进行处理,获取目标问句对应的目标问句向量、目标头实体和目标问答类型,对目标头实体和航空装备知识图谱嵌入表示进行实体链接,获取对应的目标头实体表示向量,将目标问句向量、目标头实体表示向量和目标问答类型输入到判别模型,获取候选答案列表和候选答案得分列表,确定目标答案向量集,本发明融合了得分阈值的筛选,使得问答的效果更为精准。
-
公开(公告)号:CN115828917A
公开(公告)日:2023-03-21
申请号:CN202211505312.9
申请日:2022-11-28
Applicant: 北京中科闻歌科技股份有限公司 , 中国科学院自动化研究所 , 航空工业信息中心
IPC: G06F40/295 , G06N3/045 , G06N3/042 , G06N3/096 , G06N5/02
Abstract: 本发明提供了一种融合知识的低资源语种实体抽取系统,包括:目标语种知识库、关联语种知识库、处理器和存储有计算机程序的存储器,当处理器执行计算机程序时,实现如下步骤:获取无标注语料目标语句中的目标实体,将目标实体与目标语种知识库、关联语种知识库进行实体链接,以预测掩码实体为目标获取第一损失函数,以预测实体的上下文为目标获取第二损失函数,以预测实体类型为目标获取第三损失函数,通过最小化三个损失函数的加权求和函数,获取XLM‑RK模型;从而根据XLM‑RK模型在预训练阶段获得的跨语言实体对齐能力,提升目标语种实体识别效果。
-
公开(公告)号:CN115797715A
公开(公告)日:2023-03-14
申请号:CN202211583636.4
申请日:2022-12-09
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06V10/77 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明提供了一种量子视觉MLP处理系统及存储介质,所述系统包括n个量子视觉MLP处理模块、处理器和存储有一段计算机程序的存储器,所述量子视觉处理模块包括n个依次连接的量子视觉MLP处理单元,当所述处理器执行一段计算机程序时,实现如下步骤:获取目标图像对应的图像块初始特征向量,将图像块初始化特征向量输入量子视觉MLP处理模块,以获得该目标图像的最终图像聚合特征和最终图像块特征;本发明提出的量子视觉MLP处理系统,一方面使得图像块的特征充分考虑了其语义内容,更利于图像块的聚合,另一方面,其包含了较少的归纳偏差,具有较高的适应性。
-
公开(公告)号:CN115481645A
公开(公告)日:2022-12-16
申请号:CN202211268116.4
申请日:2022-10-17
Applicant: 天津大学 , 北京中科闻歌科技股份有限公司
Abstract: 本发明公开了一种基于形态学增强的张量化词嵌入压缩系统,该模型包括语素分割模块、语素索引及嵌入模块、词嵌入生成模块;所述语素分割模块将文本任务的词表中每个词分割成语素,所述语素索引及嵌入模块首先统计语素分割模块的分割结果生成语素表,接着定义语素索引矩阵和多个可训练的语素嵌入矩阵,语素索引矩阵每一行代表词表中对应单词的语素在语素表中的位置,语素嵌入矩阵的每一行代表语素表中对应语素的嵌入向量;词嵌入生成模块对词表中每个词,从语素嵌入矩阵中索引出语素向量并进行张量积,多个张量积的结果相加生成词嵌入向量;本发明克服了一般词嵌入技术参数量及存储空间占用大的问题,以及高倍压缩词嵌入时任务效果损失的问题。
-
公开(公告)号:CN114492420B
公开(公告)日:2022-07-29
申请号:CN202210340732.X
申请日:2022-04-02
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/284 , G06F40/289 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本公开涉及一种文本分类方法、装置、设备及计算机可读存储介质,该方法包括:对待分类的文本进行分词处理,得到文本中包含的词汇;从预设的语义库中查找词汇对应的语义,以及语义在语义库中的位置,得到语义的位置向量;响应于词汇对应的语义有多个,基于词汇在所述文本中的上下文,确定词汇对应的每个语义的权重;基于词汇对应的每个语义的权重,对词汇对应的多个语义的位置向量进行加权叠加处理,得到词汇的特征向量;基于文本中包含的词汇的特征向量,确定文本的特征向量;基于文本的特征向量对文本进行分类。通过上述技术方案,将文本转化到量子领域进行处理,减少计算成本的同时,提升了文本的分类准确率,提升用户的使用体验。
-
-
-
-
-
-
-
-
-