-
公开(公告)号:CN119782464A
公开(公告)日:2025-04-08
申请号:CN202411840115.1
申请日:2024-12-13
Applicant: 北京中科闻歌科技股份有限公司 , 中国科学院自动化研究所 , 航空工业信息中心
IPC: G06F16/3329 , G06F16/34 , G06F40/211 , G06F40/253 , G06F40/30 , G06N3/045
Abstract: 本发明提供了一种多文档摘要生成质量评估方法,方法包括:构建问答对的方式,针对每个文档生成问题及其对应的答案作为答案参考;接着,基于当前需要评估的摘要对问题进行答案生成;然后,基于能否回答问题、回答问题的准确性以及对摘要中是否包含异常句子获取当前需要评估的摘要的生成状态值。本发明能够不依赖于参考标准对多文档摘要的生成质量进行分析。
-
公开(公告)号:CN119759451A
公开(公告)日:2025-04-04
申请号:CN202411952368.8
申请日:2024-12-27
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本发明涉及大语言模型技术领域,特别是涉及一种基于大模型的插件调用方法、电子设备及存储介质,所述方法包括:将预设插件关键词库中的预设插件关键词与用户输入的目标请求文本中的任一请求关键词进行匹配,根据匹配上的预设插件直接确定出目标插件或确定出若干备选插件,而当请求关键词未匹配上预设插件时则将所有预设插件作为备选插件,再通过给定大语言模型从若干个备选插件中筛选出目标插件,从所述目标请求文本中提取目标参数信息并发送至目标插件得到插件反馈结果,当插件反馈结果的判断结果为符合预设要求时,将插件反馈结果作为请求反馈文本;本发明能够提高对话系统中的目标插件选取的准确率,使选择出的目标插件更符合用户的需求。
-
公开(公告)号:CN117390165B
公开(公告)日:2025-03-25
申请号:CN202311409539.8
申请日:2023-10-27
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/3329 , G06F16/334 , G06F16/338 , G06F16/34
Abstract: 本申请涉及图表问答技术领域,特别是涉及一种基于多模态大模型的图表问答方法、系统、介质和设备。该方法包括:提取待处理图表中的目标文本信息,得到图表文本特征向量;提取上述待处理图表中目标图像信息,得到图表图像特征向量;将综合文本特征向量和图表图像特征向量进行对齐;根据对齐后的综合文本特征向量和图表图像特征向量生成待处理图表对应的问题对应的目标回答。本申请对于待处理图表的信息提取分为两部分进行,提供的待处理图表的信息更具针对性,更精确,则最终得到的图标问答对应的回答的准确性也越高。
-
公开(公告)号:CN119357469A
公开(公告)日:2025-01-24
申请号:CN202411434652.6
申请日:2024-10-15
Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
IPC: G06F16/9535 , G06F40/284 , G06F40/216 , G06F18/22
Abstract: 本发明涉及自然语言处理领域,提供一种新闻推荐方法、电子设备和存储介质,包括:获取新闻数据库对应的初始新闻特征;获取新闻数据库对应的用户,并基于用户对应的感兴趣新闻的初始新闻特征获取对应的初始用户特征;基于用户间相似度、用户新闻相似度、新闻间相似度、共现实体词频和用户感兴趣领域,从所述新闻数据库中获取用户潜在感兴趣的候选新闻集;对初始新闻特征进行更新,得到更新新闻特征,以及对初始用户特征进行更新,得到更新用户特征;基于更新用户特征和对应的候选新闻的更新新闻特征获取候选新闻对应的推荐值;将候选新闻集中推荐值大于预设推荐值的候选新闻作为推荐新闻并推荐给对应的用户。本发明能够为用户提供更准确的新闻。
-
公开(公告)号:CN118940826B
公开(公告)日:2024-12-20
申请号:CN202411434591.3
申请日:2024-10-15
Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
IPC: G06N5/02
Abstract: 本发明涉及自然语言处理领域,提供一种事件知识图谱构建方法、装置和电子设备,包括:基于源文本数据集构建事件图谱;基于所述事件图谱和开源知识图谱之间的共同实体,对所述事件图谱和所述开源知识图谱进行融合,得到融合了事件图谱和开源知识图谱的事件知识图谱;获取所述事件知识图谱中的节点和有向边的特征向量,得到进行了知识表示的事件知识图谱,作为目标事件知识图谱。本发明通过将事件图谱与知识图谱深度融合得到具有丰富知识表示的事件知识图谱。
-
公开(公告)号:CN118485046B
公开(公告)日:2024-09-17
申请号:CN202410907835.9
申请日:2024-07-08
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/169 , G06F16/35 , G06F18/214 , G06F18/27 , G06F40/35 , G06F16/332
Abstract: 本公开提供了一种标注数据处理方法和装置,涉及人工智能技术领域,具体涉及自然语言处理、深度学习、大模型等技术领域。具体实现方案为:获取初始标注指令数据集,初始标注指令数据集包括标注回复文本数据;基于初始标注指令数据集中的标注回复文本数据,得到筛选标注指令数据集,筛选标注指令数据集中的标注回复文本数据不具有重复内容;基于筛选标注指令数据集,确定内容问题类型;基于内容问题类型以及多种不同类型的大模型,对筛选标注指令数据集进行处理,得到目标标注指令数据集。
-
公开(公告)号:CN117275068B
公开(公告)日:2024-05-17
申请号:CN202311224982.8
申请日:2023-09-21
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06V40/16 , G06V40/40 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种含不确定性引导的测试阶段训练人脸伪造检测方法及系统,属于深度学习以及计算机视觉技术领域,方法包括:获取待判别的图像作为初始输入图像;获取所述初始输入图像的高频信息图像;提取所述高频信息图像中不同尺度的RGB特征和频域注意力特征,将所述RGB特征和所述频域注意力特征进行融合;将所述融合后RGB特征和所述频域特征进行交叉注意力计算,得到融合特征;基于所述融合特征,并根据不同的输入图像和任务需求,自适应选择融合方式,得到判别特征,并基于所述判别特征进行分类任务。本发明充分利用频域和RGB域中有效的信息挖掘伪造痕迹,利用不确定性引导的测试阶段训练策略,对网络中的不确定性进行优化,提高了泛化性能。
-
公开(公告)号:CN113553839B
公开(公告)日:2024-05-10
申请号:CN202010340711.9
申请日:2020-04-26
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/279 , G06F40/194
Abstract: 本申请涉及一种文本原创识别方法、装置、电子设备及存储介质,该方法包括:获取待识别的第一文本数据,以及与所述第一文本数据相关联的第二文本数据;确定所述第一文本数据的来源信息;当所述来源信息不满足于预设条件时,对所述第一文本数据和所述第二文本数据进行比较,得到相似度特征指标;将所述相似度特征指标输入训练好的识别模型,由所述识别模型根据所述相似度特征指标进行计算得到所述文本数据的原创识别结果。该技术方案一方面通过基于来源信息对文本进行初步原创判断,另一方面采用相似度指标对文本进行原创识别,以此种方式提高了原创识别的准确性和有效性,本申请采用的方法能够更好的服务于新闻工作的需求。
-
公开(公告)号:CN116823597B
公开(公告)日:2024-05-07
申请号:CN202310964424.9
申请日:2023-08-02
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06T3/04 , G06N3/0475 , G06N3/094
Abstract: 本发明涉及图像处理领域,尤其涉及一种图像生成系统,包括:目标图像A和A对应的目标语义特征向量B,所述系统实现以下步骤:将A作为待加噪图像A0,初始化加噪次数t=0,通过噪声预测模型对A0和B进行噪声预测,得到噪声预测结果Ct,对A0和Ct进行加权相加,得到加噪图像Dt,以Dt作为A0,迭代得到目标加噪图像E,将E和B输入图像生成模型中进行图像生成,得到生成图像Es,以Es作为E,迭代得到目标生成图像,通过编码噪声的形式提取A中的随机信息、面部细节和语义信息等信息,并在A上多次叠加编码得到的噪声来得到E,进一步对E和B进行多次图像生成处理得到目标生成图像,提高了目标生成图像的准确性。
-
公开(公告)号:CN117611938A
公开(公告)日:2024-02-27
申请号:CN202311371318.6
申请日:2023-10-20
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06V10/774 , G06V10/74 , G06F18/214 , G06F18/22
Abstract: 本公开涉及一种多模态模型训练方法、装置、设备及存储介质。本公开通过连接图文对齐模型以及大型语言模型,将图文对齐模型得到的视觉表达信息输入大型语言模型中,提高了多模态信息的对齐效果,使得多模态模型对于图像视觉信息的理解能力得到提升。
-
-
-
-
-
-
-
-
-