-
公开(公告)号:CN112329470B
公开(公告)日:2024-05-28
申请号:CN202011241374.4
申请日:2020-11-09
Applicant: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司 , 国科智安(北京)科技有限公司
IPC: G06F40/295 , G06F40/226 , G06N3/08
Abstract: 本申请提供了一种基于端到端模型训练的智能地址识别方法及装置,属于计算机技术领域。本申请通过获取训练数据集,所述训练数据集包括多个地址文本数据及每个所述地址文本数据对应的验证数据;针对每个地址文本数据,生成所述地址文本数据对应的字符嵌入向量序列;将所述字符嵌入向量序列输入至第一级子模型;将每一级子模型的输出数据与所述验证数据比较,得到多个误差;根据所述多个误差调整所述地址文本识别模型的参数,直至所述地址文本识别模型收敛时,训练结束。通过本申请,可以将多个级联的子模型产生的多个误差,作为依据以调整地址文本识别模型的参数,减少多个级联子模型的整体误差,避免了多个子模型之间的误差累积。
-
公开(公告)号:CN117275068B
公开(公告)日:2024-05-17
申请号:CN202311224982.8
申请日:2023-09-21
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06V40/16 , G06V40/40 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种含不确定性引导的测试阶段训练人脸伪造检测方法及系统,属于深度学习以及计算机视觉技术领域,方法包括:获取待判别的图像作为初始输入图像;获取所述初始输入图像的高频信息图像;提取所述高频信息图像中不同尺度的RGB特征和频域注意力特征,将所述RGB特征和所述频域注意力特征进行融合;将所述融合后RGB特征和所述频域特征进行交叉注意力计算,得到融合特征;基于所述融合特征,并根据不同的输入图像和任务需求,自适应选择融合方式,得到判别特征,并基于所述判别特征进行分类任务。本发明充分利用频域和RGB域中有效的信息挖掘伪造痕迹,利用不确定性引导的测试阶段训练策略,对网络中的不确定性进行优化,提高了泛化性能。
-
公开(公告)号:CN113553839B
公开(公告)日:2024-05-10
申请号:CN202010340711.9
申请日:2020-04-26
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/279 , G06F40/194
Abstract: 本申请涉及一种文本原创识别方法、装置、电子设备及存储介质,该方法包括:获取待识别的第一文本数据,以及与所述第一文本数据相关联的第二文本数据;确定所述第一文本数据的来源信息;当所述来源信息不满足于预设条件时,对所述第一文本数据和所述第二文本数据进行比较,得到相似度特征指标;将所述相似度特征指标输入训练好的识别模型,由所述识别模型根据所述相似度特征指标进行计算得到所述文本数据的原创识别结果。该技术方案一方面通过基于来源信息对文本进行初步原创判断,另一方面采用相似度指标对文本进行原创识别,以此种方式提高了原创识别的准确性和有效性,本申请采用的方法能够更好的服务于新闻工作的需求。
-
公开(公告)号:CN116823597B
公开(公告)日:2024-05-07
申请号:CN202310964424.9
申请日:2023-08-02
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06T3/04 , G06N3/0475 , G06N3/094
Abstract: 本发明涉及图像处理领域,尤其涉及一种图像生成系统,包括:目标图像A和A对应的目标语义特征向量B,所述系统实现以下步骤:将A作为待加噪图像A0,初始化加噪次数t=0,通过噪声预测模型对A0和B进行噪声预测,得到噪声预测结果Ct,对A0和Ct进行加权相加,得到加噪图像Dt,以Dt作为A0,迭代得到目标加噪图像E,将E和B输入图像生成模型中进行图像生成,得到生成图像Es,以Es作为E,迭代得到目标生成图像,通过编码噪声的形式提取A中的随机信息、面部细节和语义信息等信息,并在A上多次叠加编码得到的噪声来得到E,进一步对E和B进行多次图像生成处理得到目标生成图像,提高了目标生成图像的准确性。
-
公开(公告)号:CN117611938A
公开(公告)日:2024-02-27
申请号:CN202311371318.6
申请日:2023-10-20
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06V10/774 , G06V10/74 , G06F18/214 , G06F18/22
Abstract: 本公开涉及一种多模态模型训练方法、装置、设备及存储介质。本公开通过连接图文对齐模型以及大型语言模型,将图文对齐模型得到的视觉表达信息输入大型语言模型中,提高了多模态信息的对齐效果,使得多模态模型对于图像视觉信息的理解能力得到提升。
-
公开(公告)号:CN117591948A
公开(公告)日:2024-02-23
申请号:CN202410082714.5
申请日:2024-01-19
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F18/2411 , G06F40/166 , G06F18/214
Abstract: 本公开提供了一种评论生成模型训练方法和装置,涉及人工智能技术领域,具体涉及自然语言处理、深度学习、大模型等技术领域。具体实现方案为:获取文本样本集,文本样本集包括:第一文本样本,第一文本样本包括:展示文本以及与展示文本相关的情感立场文本;获取预先构建的评论生成网络,评论生成网络包括:编码器和解码器,编码器分别对展示文本和情感立场文本进行建模,得到评论全局特征向量;解码器用于对评论全局特征向量进行解码,得到评论结果信息;将从文本样本集中选取的第一文本样本输入评论生成网络,得到评论生成网络输出的评论结果信息;基于评论结果信息,得到训练完成的评论生成模型。
-
公开(公告)号:CN117113990B
公开(公告)日:2024-01-12
申请号:CN202311374453.6
申请日:2023-10-23
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/284 , G06F40/289 , G06F18/25
Abstract: 本发明涉及计算机技术应用领域,提供了一种面向大语言模型的词向量生成方法、电子设备及存储介质,包括:获取待分词的文本,作为目标文本;对目标文本进行分词处理,得到对应的分词集S;基于预设词向量基准表T,获取每个词在每个嵌入矩阵的特征向量;基于预设滑动窗口长度d,将S划分为多个语句片段,得到对应的语句片段集SP;对每个语句片段的特征向量进行融合,得到对应的特征向量;得到SP对应的特征向量F作为目标文本的特征向量。本发明在词向量生成过程中,将多个相邻的词组合视为一个词,能够使得分词的长度得到极大的压缩。此外,将不同词的特征向量通过张量积的方式组合成一个词的特征向量,可以极大的降低可训练参数量。
-
公开(公告)号:CN117275068A
公开(公告)日:2023-12-22
申请号:CN202311224982.8
申请日:2023-09-21
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06V40/16 , G06V40/40 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种含不确定性引导的测试阶段训练人脸伪造检测方法及系统,属于深度学习以及计算机视觉技术领域,方法包括:获取待判别的图像作为初始输入图像;获取所述初始输入图像的高频信息图像;提取所述高频信息图像中不同尺度的RGB特征和频域注意力特征,将所述RGB特征和所述频域注意力特征进行融合;将所述融合后RGB特征和所述频域特征进行交叉注意力计算,得到融合特征;基于所述融合特征,并根据不同的输入图像和任务需求,自适应选择融合方式,得到判别特征,并基于所述判别特征进行分类任务。本发明充分利用频域和RGB域中有效的信息挖掘伪造痕迹,利用不确定性引导的测试阶段训练策略,对网络中的不确定性进行优化,提高了泛化性能。
-
公开(公告)号:CN116996707A
公开(公告)日:2023-11-03
申请号:CN202310967284.0
申请日:2023-08-02
Applicant: 北京中科闻歌科技股份有限公司
IPC: H04N21/234 , H04N21/44 , G06T3/40 , G06N3/094 , G06N3/0475 , G06N3/0464 , G06V10/82 , G06V40/16
Abstract: 本发明提供了一种虚拟角色的视频渲染方法,包括如下步骤:基于目标虚拟角色的第一人脸图像和目标虚拟角色对应的目标音频数据,获取到预设口型图像集;预设口型图像集包括若干个口型图像;根据若干个口型图像和第二人脸图像,获取到拼接人脸图像集;拼接人脸图像集包括若干个拼接人脸图像;根据若干个拼接人脸图像和目标换脸模型,获取到目标人脸图像集;目标人脸图像集包括若干个目标人脸图像;根据若干个目标人脸图像和目标虚拟角色的初始人脸图像,获取到目标虚拟角色对应的目标渲染视频。本发明能够实现虚拟角色视频的实时驱动与渲染,并能够应用于多种语言的语音播报。
-
公开(公告)号:CN114139547B
公开(公告)日:2023-07-04
申请号:CN202111416144.1
申请日:2021-11-25
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/30 , G06F40/295
Abstract: 本公开涉及一种知识融合方法、装置、设备、系统及介质。其中,知识融合法包括:基于第一实体数据中的第一实体名,获取第一实体数据对应的实体的至少一个实体别称,得到实体名称集;基于实体名称集,检测第一实体名和第二实体数据中的第二实体名是否匹配;在检测到第一实体名和第二实体名匹配时,将第一实体数据和第二实体数据进行融合,得到融合实体数据。根据本公开实施例,能够根据两条实体数据中的实体名是否匹配来判断它们是否需要融合,以减少计算量,提高融合效率,并且在两条实体数据中的实体名不匹配时,能够根据该两条实体数据的多维度相似度进行融合判别,以提高判别精度,进而实现多来源知识的融合,达到精准有效融合效果。
-
-
-
-
-
-
-
-
-