-
公开(公告)号:CN119849624A
公开(公告)日:2025-04-18
申请号:CN202411916261.8
申请日:2024-12-24
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06N5/04 , G06F18/25 , G06N3/0455 , G06N3/0464 , G06N3/0475
Abstract: 本申请涉及一种基于多模态情感的大模型对话方法、装置、设备及介质,尤其涉及自然语言处理技术领域。包括:接收用户的多模态输入,并对多模态输入进行多模态情感分析得到多模态情感表征;将多模态情感表征和当前对话上下文输入情感生成网络,得到情感生成网络输出的当前情感倾向;基于当前情感倾向对历史情感倾向进行更新,得到目标情感倾向;将目标情感倾向和当前对话上下文输入解码器,得到解码器输出的情感回复内容。本申请实施例提升了情感理解的准确性,适应于用户情感波动,能够生成连贯且一致的情感回复内容。
-
公开(公告)号:CN119848168A
公开(公告)日:2025-04-18
申请号:CN202411916262.2
申请日:2024-12-24
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/31 , G06F16/3329 , G06F16/36 , G06F16/3332 , G06F16/334 , G06F16/901 , G06N5/022
Abstract: 本申请实施例公开了一种基于大语言模型和知识图谱的检索生成方法及装置,可解决检索语义关联性弱、召回数据缺乏全局性知识的问题。该方法包括:对预设的多个领域文档进行向量解析,构建向量数据库;根据多个领域文档中提取出的实体描述信息和关系描述信息,构建知识图谱,并将知识图谱存储到图数据库中;对用户输入的目标问题进行特征提取,得到目标问题对应的多维度关键词;通过预设搜索引擎、向量数据库以及图数据库,对多维度关键词进行检索,得到目标检索结果;根据目标检索结果,确定目标输入信息,并将目标输入信息输入到目标语言模型中,得到目标输出响应信息。
-
公开(公告)号:CN119761336A
公开(公告)日:2025-04-04
申请号:CN202411820053.8
申请日:2024-12-11
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/194 , G06F40/16 , G06N5/04 , G06N3/045 , G06N3/0475 , G06F18/25
Abstract: 本发明提供了一种图表问答模型的综合评测方法、设备及介质,涉及数据处理技术领域,方法根据预设图表问答任务类型列表和目标图表类型列表,获取初始图表数据列表集合的总集,根据初始图表数据、初始图表数据对应的预设图表问答任务类型的定义文本和目标多模态大模型,获取初始图表数据对应的问题文本列表和问题文本对应的标准答案文本,根据多线程处理方式、预设配置文件和图表问答模型,并行获取问题文本对应的目标答案文本,根据问题文本对应的标准答案文本和目标答案文本,获取图表问答模型对应的人工评分和自动评分,用于评测图表问答模型,能够评估多种图表问答任务类型的情况下图表问答模型的输出结果的准确性,可以满足用户的多样化需求。
-
公开(公告)号:CN119761333A
公开(公告)日:2025-04-04
申请号:CN202411891714.6
申请日:2024-12-20
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/186 , G06F40/194 , G06F40/30 , G06F18/214
Abstract: 本公开涉及一种基于大语言模型的公平竞争审查方法、装置、设备及介质。其中,基于大语言模型的公平竞争审查方法包括:获取待审文档;基于所述待审文档确定参考案例,并获取目标审查条例;根据预设指令模板,对所述待审文档、所述参考案例和所述目标审查条例进行处理,生成目标模型指令;对所述目标模型指令进行审查处理,得到对应的审查结论。根据本公开实施例,能够提高处理文档的判断准确性和可靠性,提供更为全面和深刻的审查结果。
-
公开(公告)号:CN119692335A
公开(公告)日:2025-03-25
申请号:CN202411760336.8
申请日:2024-12-03
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/205 , G06F18/2431 , G06V30/41
Abstract: 本发明提供了一种基于多模型的PDF解析方法、电子设备和存储介质,方法包括利用规则提取、版面分析、表格识别、公式检测、公式识别、多模态大模型chart2text、多模态大模型段落排序等方法获取复杂PDF中可能出现的所有元素类型。本发明能够实现复杂PDF的完整结构化解析以及支持扫描件和非扫描件。
-
公开(公告)号:CN116996707B
公开(公告)日:2024-08-13
申请号:CN202310967284.0
申请日:2023-08-02
Applicant: 北京中科闻歌科技股份有限公司
IPC: H04N21/234 , H04N21/44 , G06T3/4038 , G06N3/094 , G06N3/0475 , G06N3/0464 , G06T3/4046 , G06V10/82 , G06V40/16
Abstract: 本发明提供了一种虚拟角色的视频渲染方法,包括如下步骤:基于目标虚拟角色的第一人脸图像和目标虚拟角色对应的目标音频数据,获取到预设口型图像集;预设口型图像集包括若干个口型图像;根据若干个口型图像和第二人脸图像,获取到拼接人脸图像集;拼接人脸图像集包括若干个拼接人脸图像;根据若干个拼接人脸图像和目标换脸模型,获取到目标人脸图像集;目标人脸图像集包括若干个目标人脸图像;根据若干个目标人脸图像和目标虚拟角色的初始人脸图像,获取到目标虚拟角色对应的目标渲染视频。本发明能够实现虚拟角色视频的实时驱动与渲染,并能够应用于多种语言的语音播报。
-
公开(公告)号:CN116797493A
公开(公告)日:2023-09-22
申请号:CN202310964411.1
申请日:2023-08-02
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本发明涉及图像处理领域,尤其涉及一种图像去噪处理系统,包括:含噪人脸图像A、中间素描图像特征集合B=(B1,B2,……,Bn,……,BM)和文本特征C,所述系统实现以下步骤:对A和B1进行下采样得到第一个中间图像特征D1,对Di和Bi进行下采样得到Di+1,对DM和文本特征C进行注意力特征提取得到注意力图像特征E,对E进行上采样得到第一个中间噪声图像特征F1,对Fj和DM‑j进行上采样得到Fj+1,对FM‑1和D1进行上采样得到预测噪声图像G,根据A和G得到去噪人脸图像,将图像模态下的B、文本模态下的C与A进行信息融合,根据双模态的特征信息提高了对A的表征能力,提高了去噪结果的准确性。
-
公开(公告)号:CN109815296B
公开(公告)日:2020-12-22
申请号:CN201811654206.0
申请日:2018-12-29
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本发明实施例涉及一种公证文档的人物知识库构建方法、装置及存储介质,所述方法包括:接收输入的公证文档数据;从所述公证文档数据中提取人名信息;从所述公证文档数据中提取与所述人名信息对应的属性信息;根据所述人名信息和所述属性信息更新数据库,当后续需要使用有关该人物的公证文档数据时,通过数据库调取,即可获取该人物的属性信息,节省人工查询的时间,提升办事效率。
-
公开(公告)号:CN109815296A
公开(公告)日:2019-05-28
申请号:CN201811654206.0
申请日:2018-12-29
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本发明实施例涉及一种公证文档的人物知识库构建方法、装置及存储介质,所述方法包括:接收输入的公证文档数据;从所述公证文档数据中提取人名信息;从所述公证文档数据中提取与所述人名信息对应的属性信息;根据所述人名信息和所述属性信息更新数据库,当后续需要使用有关该人物的公证文档数据时,通过数据库调取,即可获取该人物的属性信息,节省人工查询的时间,提升办事效率。
-
公开(公告)号:CN119782889A
公开(公告)日:2025-04-08
申请号:CN202411952956.1
申请日:2024-12-27
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F18/24 , G06F18/213 , G06V10/44 , G06N3/0455 , G06F18/22 , G06N3/048
Abstract: 本申请涉及一种基于大模型的多模态假新闻检测方法、装置、及设备,尤其涉及信息处理技术领域。包括:将多模态待测新闻分别输入大模型gte‑Qwen2‑1.5B‑instruct、预训练视觉模型SwinT和预训练图文对比模型Clip,得到文本特征、图像特征以及文本对比特征和图像对比特征;计算归一化后的文本对比特征与图像对比特征之间的余弦相似度,得到图文相似度;将图文相似度作为注意力矩阵阈值来增强文本特征和图像特征,以提取局部异同特征;将图文相似度作为权重来增强文本特征和图像特征,以提取全局异同特征;将局部异同特征和全局异同特征输入假新闻分类器,得到假新闻分类器输出的多模态待测新闻的真实性预测值。
-
-
-
-
-
-
-
-
-