-
公开(公告)号:CN116823597B
公开(公告)日:2024-05-07
申请号:CN202310964424.9
申请日:2023-08-02
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06T3/04 , G06N3/0475 , G06N3/094
Abstract: 本发明涉及图像处理领域,尤其涉及一种图像生成系统,包括:目标图像A和A对应的目标语义特征向量B,所述系统实现以下步骤:将A作为待加噪图像A0,初始化加噪次数t=0,通过噪声预测模型对A0和B进行噪声预测,得到噪声预测结果Ct,对A0和Ct进行加权相加,得到加噪图像Dt,以Dt作为A0,迭代得到目标加噪图像E,将E和B输入图像生成模型中进行图像生成,得到生成图像Es,以Es作为E,迭代得到目标生成图像,通过编码噪声的形式提取A中的随机信息、面部细节和语义信息等信息,并在A上多次叠加编码得到的噪声来得到E,进一步对E和B进行多次图像生成处理得到目标生成图像,提高了目标生成图像的准确性。
-
公开(公告)号:CN117611938A
公开(公告)日:2024-02-27
申请号:CN202311371318.6
申请日:2023-10-20
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06V10/774 , G06V10/74 , G06F18/214 , G06F18/22
Abstract: 本公开涉及一种多模态模型训练方法、装置、设备及存储介质。本公开通过连接图文对齐模型以及大型语言模型,将图文对齐模型得到的视觉表达信息输入大型语言模型中,提高了多模态信息的对齐效果,使得多模态模型对于图像视觉信息的理解能力得到提升。
-
公开(公告)号:CN117591948A
公开(公告)日:2024-02-23
申请号:CN202410082714.5
申请日:2024-01-19
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F18/2411 , G06F40/166 , G06F18/214
Abstract: 本公开提供了一种评论生成模型训练方法和装置,涉及人工智能技术领域,具体涉及自然语言处理、深度学习、大模型等技术领域。具体实现方案为:获取文本样本集,文本样本集包括:第一文本样本,第一文本样本包括:展示文本以及与展示文本相关的情感立场文本;获取预先构建的评论生成网络,评论生成网络包括:编码器和解码器,编码器分别对展示文本和情感立场文本进行建模,得到评论全局特征向量;解码器用于对评论全局特征向量进行解码,得到评论结果信息;将从文本样本集中选取的第一文本样本输入评论生成网络,得到评论生成网络输出的评论结果信息;基于评论结果信息,得到训练完成的评论生成模型。
-
公开(公告)号:CN117113990B
公开(公告)日:2024-01-12
申请号:CN202311374453.6
申请日:2023-10-23
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/284 , G06F40/289 , G06F18/25
Abstract: 本发明涉及计算机技术应用领域,提供了一种面向大语言模型的词向量生成方法、电子设备及存储介质,包括:获取待分词的文本,作为目标文本;对目标文本进行分词处理,得到对应的分词集S;基于预设词向量基准表T,获取每个词在每个嵌入矩阵的特征向量;基于预设滑动窗口长度d,将S划分为多个语句片段,得到对应的语句片段集SP;对每个语句片段的特征向量进行融合,得到对应的特征向量;得到SP对应的特征向量F作为目标文本的特征向量。本发明在词向量生成过程中,将多个相邻的词组合视为一个词,能够使得分词的长度得到极大的压缩。此外,将不同词的特征向量通过张量积的方式组合成一个词的特征向量,可以极大的降低可训练参数量。
-
公开(公告)号:CN117275068A
公开(公告)日:2023-12-22
申请号:CN202311224982.8
申请日:2023-09-21
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06V40/16 , G06V40/40 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种含不确定性引导的测试阶段训练人脸伪造检测方法及系统,属于深度学习以及计算机视觉技术领域,方法包括:获取待判别的图像作为初始输入图像;获取所述初始输入图像的高频信息图像;提取所述高频信息图像中不同尺度的RGB特征和频域注意力特征,将所述RGB特征和所述频域注意力特征进行融合;将所述融合后RGB特征和所述频域特征进行交叉注意力计算,得到融合特征;基于所述融合特征,并根据不同的输入图像和任务需求,自适应选择融合方式,得到判别特征,并基于所述判别特征进行分类任务。本发明充分利用频域和RGB域中有效的信息挖掘伪造痕迹,利用不确定性引导的测试阶段训练策略,对网络中的不确定性进行优化,提高了泛化性能。
-
公开(公告)号:CN116996707A
公开(公告)日:2023-11-03
申请号:CN202310967284.0
申请日:2023-08-02
Applicant: 北京中科闻歌科技股份有限公司
IPC: H04N21/234 , H04N21/44 , G06T3/40 , G06N3/094 , G06N3/0475 , G06N3/0464 , G06V10/82 , G06V40/16
Abstract: 本发明提供了一种虚拟角色的视频渲染方法,包括如下步骤:基于目标虚拟角色的第一人脸图像和目标虚拟角色对应的目标音频数据,获取到预设口型图像集;预设口型图像集包括若干个口型图像;根据若干个口型图像和第二人脸图像,获取到拼接人脸图像集;拼接人脸图像集包括若干个拼接人脸图像;根据若干个拼接人脸图像和目标换脸模型,获取到目标人脸图像集;目标人脸图像集包括若干个目标人脸图像;根据若干个目标人脸图像和目标虚拟角色的初始人脸图像,获取到目标虚拟角色对应的目标渲染视频。本发明能够实现虚拟角色视频的实时驱动与渲染,并能够应用于多种语言的语音播报。
-
公开(公告)号:CN114139547B
公开(公告)日:2023-07-04
申请号:CN202111416144.1
申请日:2021-11-25
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/30 , G06F40/295
Abstract: 本公开涉及一种知识融合方法、装置、设备、系统及介质。其中,知识融合法包括:基于第一实体数据中的第一实体名,获取第一实体数据对应的实体的至少一个实体别称,得到实体名称集;基于实体名称集,检测第一实体名和第二实体数据中的第二实体名是否匹配;在检测到第一实体名和第二实体名匹配时,将第一实体数据和第二实体数据进行融合,得到融合实体数据。根据本公开实施例,能够根据两条实体数据中的实体名是否匹配来判断它们是否需要融合,以减少计算量,提高融合效率,并且在两条实体数据中的实体名不匹配时,能够根据该两条实体数据的多维度相似度进行融合判别,以提高判别精度,进而实现多来源知识的融合,达到精准有效融合效果。
-
公开(公告)号:CN115982395B
公开(公告)日:2023-05-23
申请号:CN202310267414.X
申请日:2023-03-20
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/45 , G06F18/2415 , G06F18/25 , G06F18/2135
Abstract: 本发明涉及多模态情感预测领域,特别是涉及一种基于量子的媒体信息的情感预测方法、介质及设备。包括如下步骤:对每一模态的表示信息进行预处理,生成每一模态的表示信息对应的复数词向量集A1及A2,对A1及A2进行特征转换处理,生成对应的特征密度矩阵集ρt及ρv;对ρt及ρv进行特征融合处理,生成融合特征fp;根据fp与多个预设情感类型的投影算子,生成fp为每一种预设情感类型的概率值。将P(e1),P(e2),…,P(ew)中最大值对应的情感类型,作为目标媒体信息的情感类型。通过利用量子理论的模型,可以更加有效的捕获不同模态之间的信息交互,进而可以提高对媒体信息所表达情绪的预测结果的精度。
-
公开(公告)号:CN116049413A
公开(公告)日:2023-05-02
申请号:CN202310346366.3
申请日:2023-04-03
Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
IPC: G06F16/35 , G06F18/22 , G06F18/2415 , G06N3/0455 , G06N3/047
Abstract: 本发明提供了一种基于事件演化的用户观点和立场获取方法,首先对输入的多个文本例如新闻进行文本聚类,然后对聚类结果进行清洗和合并以得到事件,然后针对事件的演化过程,抽取事件对应的评论者、观点和立场,最后按照事件的演化时间顺序,输出对应的评论者、观点和立场,能够根据事件的演变,推断评论者的观点、立场的变化情况。
-
公开(公告)号:CN115526338A
公开(公告)日:2022-12-27
申请号:CN202211287916.0
申请日:2022-10-20
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06N20/00 , G06F16/33 , G06F16/338
Abstract: 本申请涉及信息检索领域,特别是涉及一种用于信息检索的强化学习模型构建方法,所述方法包括:S100,获取查询信息Q的特征编码q和候选文档集合中各候选文档的特征编码;S200,构建MDP模型,其中:MDP模型的初始状态s0=[0,q],MDP模型的智能体在初始状态下选择动作a0的概率分布为π(a0|s0;w);S300,根据长期奖励对MDP模型进行模型训练。本发明提高了信息检索时文档排序的精确性。
-
-
-
-
-
-
-
-
-