-
公开(公告)号:CN117390165B
公开(公告)日:2025-03-25
申请号:CN202311409539.8
申请日:2023-10-27
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/3329 , G06F16/334 , G06F16/338 , G06F16/34
Abstract: 本申请涉及图表问答技术领域,特别是涉及一种基于多模态大模型的图表问答方法、系统、介质和设备。该方法包括:提取待处理图表中的目标文本信息,得到图表文本特征向量;提取上述待处理图表中目标图像信息,得到图表图像特征向量;将综合文本特征向量和图表图像特征向量进行对齐;根据对齐后的综合文本特征向量和图表图像特征向量生成待处理图表对应的问题对应的目标回答。本申请对于待处理图表的信息提取分为两部分进行,提供的待处理图表的信息更具针对性,更精确,则最终得到的图标问答对应的回答的准确性也越高。
-
公开(公告)号:CN117611938A
公开(公告)日:2024-02-27
申请号:CN202311371318.6
申请日:2023-10-20
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06V10/774 , G06V10/74 , G06F18/214 , G06F18/22
Abstract: 本公开涉及一种多模态模型训练方法、装置、设备及存储介质。本公开通过连接图文对齐模型以及大型语言模型,将图文对齐模型得到的视觉表达信息输入大型语言模型中,提高了多模态信息的对齐效果,使得多模态模型对于图像视觉信息的理解能力得到提升。
-
公开(公告)号:CN114495245B
公开(公告)日:2022-07-29
申请号:CN202210363659.8
申请日:2022-04-08
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本公开涉及一种人脸伪造图像鉴别方法、装置、设备以及介质。其中,该方法包括:获取第一样本图像集和第二样本图像集,第一样本图像集中的假脸基于第一伪造方式伪造得到,第二样本图像集中的假脸基于第二伪造方式伪造得到;基于第一样本图像集训练生成用于鉴别第一伪造方式的第一教师模型;基于第二样本图像集训练生成用于鉴别第二伪造方式的第二教师模型;将第一教师模型和第二教师模型融合以训练学生模型,生成用于鉴别第一伪造方式和第二伪造方式的目标人脸伪造图像鉴别模型。根据本公开实施例提供的技术方案,能够使生成的目标人脸伪造图像鉴别模型适用于鉴别不同伪造方法生成的人脸图像,有更好的泛化性、拓展性,且更为高效。
-
公开(公告)号:CN114495245A
公开(公告)日:2022-05-13
申请号:CN202210363659.8
申请日:2022-04-08
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本公开涉及一种人脸伪造图像鉴别方法、装置、设备以及介质。其中,该方法包括:获取第一样本图像集和第二样本图像集,第一样本图像集中的假脸基于第一伪造方式伪造得到,第二样本图像集中的假脸基于第二伪造方式伪造得到;基于第一样本图像集训练生成用于鉴别第一伪造方式的第一教师模型;基于第二样本图像集训练生成用于鉴别第二伪造方式的第二教师模型;将第一教师模型和第二教师模型融合以训练学生模型,生成用于鉴别第一伪造方式和第二伪造方式的目标人脸伪造图像鉴别模型。根据本公开实施例提供的技术方案,能够使生成的目标人脸伪造图像鉴别模型适用于鉴别不同伪造方法生成的人脸图像,有更好的泛化性、拓展性,且更为高效。
-
公开(公告)号:CN113766314B
公开(公告)日:2022-03-04
申请号:CN202111317971.5
申请日:2021-11-09
Applicant: 北京中科闻歌科技股份有限公司
IPC: H04N21/44 , H04N21/439 , H04N21/488 , G06V20/40 , G06V20/62 , G06V10/44 , G06K9/62
Abstract: 本公开涉及一种视频切分方法、装置、设备、系统及存储介质,该方法包括:获取目标视频的视频特征数据,视频特征数据包括音频数据、字幕数据和镜头数据;对音频数据进行切分,得到多个音频数据片段;基于镜头数据对字幕数据进行切分,得到多个字幕子数据;基于音频数据片段和字幕子数据对目标视频进行切分,得到多个视频片段。根据本公开实施例,实现了能够准确的切分目标视频,以进一步使得用户通过浏览目标视频切分后的视频片段,从目标视频中快速获取准确的信息,以准确且快速的浏览目标视频中所包含的信息。
-
-
-
-