Patent search ap:("国家计算机网络与信息安全管理中心" OR "北京中科闻歌科技股份有限公司") AND inv:"罗引" Page 7

61.

发明授权
一种基于端到端模型训练的智能地址识别方法及装置有权

公开(公告)号：CN112329470B

公开(公告)日：2024-05-28

申请号：CN202011241374.4

申请日：2020-11-09

Applicant: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司 , 国科智安(北京)科技有限公司

Inventor： 蒋永余 , 孔庆超 , 张佳旭 , 王宇琪 , 赵菲菲 , 吴晓飞 , 彭鑫 , 奉凡 , 罗引 , 王磊

IPC: G06F40/295 , G06F40/226 , G06N3/08

Abstract: 本申请提供了一种基于端到端模型训练的智能地址识别方法及装置，属于计算机技术领域。本申请通过获取训练数据集，所述训练数据集包括多个地址文本数据及每个所述地址文本数据对应的验证数据；针对每个地址文本数据，生成所述地址文本数据对应的字符嵌入向量序列；将所述字符嵌入向量序列输入至第一级子模型；将每一级子模型的输出数据与所述验证数据比较，得到多个误差；根据所述多个误差调整所述地址文本识别模型的参数，直至所述地址文本识别模型收敛时，训练结束。通过本申请，可以将多个级联的子模型产生的多个误差，作为依据以调整地址文本识别模型的参数，减少多个级联子模型的整体误差，避免了多个子模型之间的误差累积。

62.

发明授权
含不确定性引导的测试阶段训练人脸伪造检测方法及系统有权

公开(公告)号：CN117275068B

公开(公告)日：2024-05-17

申请号：CN202311224982.8

申请日：2023-09-21

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 罗引 , 徐楠 , 郝艳妮 , 陈博 , 李军锋 , 曹家 , 王磊

IPC: G06V40/16 , G06V40/40 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08

Abstract: 本发明公开了一种含不确定性引导的测试阶段训练人脸伪造检测方法及系统，属于深度学习以及计算机视觉技术领域，方法包括：获取待判别的图像作为初始输入图像；获取所述初始输入图像的高频信息图像；提取所述高频信息图像中不同尺度的RGB特征和频域注意力特征，将所述RGB特征和所述频域注意力特征进行融合；将所述融合后RGB特征和所述频域特征进行交叉注意力计算，得到融合特征；基于所述融合特征，并根据不同的输入图像和任务需求，自适应选择融合方式，得到判别特征，并基于所述判别特征进行分类任务。本发明充分利用频域和RGB域中有效的信息挖掘伪造痕迹，利用不确定性引导的测试阶段训练策略，对网络中的不确定性进行优化，提高了泛化性能。

63.

发明授权
一种文本原创识别方法、装置、电子设备及存储介质有权

公开(公告)号：CN113553839B

公开(公告)日：2024-05-10

申请号：CN202010340711.9

申请日：2020-04-26

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 孔庆超 , 张佳旭 , 王婧宜 , 王宇琪 , 柳力多 , 方省 , 罗引 , 王磊

IPC: G06F40/279 , G06F40/194

Abstract: 本申请涉及一种文本原创识别方法、装置、电子设备及存储介质，该方法包括：获取待识别的第一文本数据，以及与所述第一文本数据相关联的第二文本数据；确定所述第一文本数据的来源信息；当所述来源信息不满足于预设条件时，对所述第一文本数据和所述第二文本数据进行比较，得到相似度特征指标；将所述相似度特征指标输入训练好的识别模型，由所述识别模型根据所述相似度特征指标进行计算得到所述文本数据的原创识别结果。该技术方案一方面通过基于来源信息对文本进行初步原创判断，另一方面采用相似度指标对文本进行原创识别，以此种方式提高了原创识别的准确性和有效性，本申请采用的方法能够更好的服务于新闻工作的需求。

64.

发明授权
一种图像生成系统有权

公开(公告)号：CN116823597B

公开(公告)日：2024-05-07

申请号：CN202310964424.9

申请日：2023-08-02

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 王磊 , 徐楠 , 郝艳妮 , 陈博 , 李军锋 , 曹家 , 罗引

IPC: G06T3/04 , G06N3/0475 , G06N3/094

Abstract: 本发明涉及图像处理领域，尤其涉及一种图像生成系统，包括：目标图像A和A对应的目标语义特征向量B，所述系统实现以下步骤：将A作为待加噪图像A0，初始化加噪次数t=0，通过噪声预测模型对A0和B进行噪声预测，得到噪声预测结果Ct，对A0和Ct进行加权相加，得到加噪图像Dt，以Dt作为A0，迭代得到目标加噪图像E，将E和B输入图像生成模型中进行图像生成，得到生成图像Es，以Es作为E，迭代得到目标生成图像，通过编码噪声的形式提取A中的随机信息、面部细节和语义信息等信息，并在A上多次叠加编码得到的噪声来得到E，进一步对E和B进行多次图像生成处理得到目标生成图像，提高了目标生成图像的准确性。

65.

发明公开
多模态模型训练方法、装置、设备及存储介质审中-实审

公开(公告)号：CN117611938A

公开(公告)日：2024-02-27

申请号：CN202311371318.6

申请日：2023-10-20

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 罗引 , 郝艳妮 , 马先钦 , 陈博 , 徐楠 , 曹家 , 王磊

IPC: G06V10/774 , G06V10/74 , G06F18/214 , G06F18/22

Abstract: 本公开涉及一种多模态模型训练方法、装置、设备及存储介质。本公开通过连接图文对齐模型以及大型语言模型，将图文对齐模型得到的视觉表达信息输入大型语言模型中，提高了多模态信息的对齐效果，使得多模态模型对于图像视觉信息的理解能力得到提升。

66.

发明公开
评论生成模型训练方法和装置、信息生成方法和装置审中-实审

公开(公告)号：CN117591948A

公开(公告)日：2024-02-23

申请号：CN202410082714.5

申请日：2024-01-19

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 罗引 , 李庆晓 , 徐楠 , 王宇琪 , 曹家 , 王磊

IPC: G06F18/2411 , G06F40/166 , G06F18/214

Abstract: 本公开提供了一种评论生成模型训练方法和装置，涉及人工智能技术领域，具体涉及自然语言处理、深度学习、大模型等技术领域。具体实现方案为：获取文本样本集，文本样本集包括：第一文本样本，第一文本样本包括：展示文本以及与展示文本相关的情感立场文本；获取预先构建的评论生成网络，评论生成网络包括：编码器和解码器，编码器分别对展示文本和情感立场文本进行建模，得到评论全局特征向量；解码器用于对评论全局特征向量进行解码，得到评论结果信息；将从文本样本集中选取的第一文本样本输入评论生成网络，得到评论生成网络输出的评论结果信息；基于评论结果信息，得到训练完成的评论生成模型。

67.

发明授权
面向大语言模型的词向量生成方法、电子设备及存储介质有权

公开(公告)号：CN117113990B

公开(公告)日：2024-01-12

申请号：CN202311374453.6

申请日：2023-10-23

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 罗引 , 蒋永余 , 王宇琪 , 李庆晓 , 徐楠 , 曹家 , 王磊

IPC: G06F40/284 , G06F40/289 , G06F18/25

Abstract: 本发明涉及计算机技术应用领域，提供了一种面向大语言模型的词向量生成方法、电子设备及存储介质，包括：获取待分词的文本，作为目标文本；对目标文本进行分词处理，得到对应的分词集S；基于预设词向量基准表T，获取每个词在每个嵌入矩阵的特征向量；基于预设滑动窗口长度d，将S划分为多个语句片段，得到对应的语句片段集SP；对每个语句片段的特征向量进行融合，得到对应的特征向量；得到SP对应的特征向量F作为目标文本的特征向量。本发明在词向量生成过程中，将多个相邻的词组合视为一个词，能够使得分词的长度得到极大的压缩。此外，将不同词的特征向量通过张量积的方式组合成一个词的特征向量，可以极大的降低可训练参数量。

68.

发明公开
含不确定性引导的测试阶段训练人脸伪造检测方法及系统审中-实审

公开(公告)号：CN117275068A

公开(公告)日：2023-12-22

申请号：CN202311224982.8

申请日：2023-09-21

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 罗引 , 徐楠 , 郝艳妮 , 陈博 , 李军锋 , 曹家 , 王磊

IPC: G06V40/16 , G06V40/40 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08

Abstract: 本发明公开了一种含不确定性引导的测试阶段训练人脸伪造检测方法及系统，属于深度学习以及计算机视觉技术领域，方法包括：获取待判别的图像作为初始输入图像；获取所述初始输入图像的高频信息图像；提取所述高频信息图像中不同尺度的RGB特征和频域注意力特征，将所述RGB特征和所述频域注意力特征进行融合；将所述融合后RGB特征和所述频域特征进行交叉注意力计算，得到融合特征；基于所述融合特征，并根据不同的输入图像和任务需求，自适应选择融合方式，得到判别特征，并基于所述判别特征进行分类任务。本发明充分利用频域和RGB域中有效的信息挖掘伪造痕迹，利用不确定性引导的测试阶段训练策略，对网络中的不确定性进行优化，提高了泛化性能。

69.

发明公开
一种虚拟角色的渲染方法、电子设备及存储介质审中-实审

公开(公告)号：CN116996707A

公开(公告)日：2023-11-03

申请号：CN202310967284.0

申请日：2023-08-02

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 罗引 , 陈博 , 郑洋 , 李彤 , 徐楠 , 李军锋 , 曹家 , 王磊

IPC: H04N21/234 , H04N21/44 , G06T3/40 , G06N3/094 , G06N3/0475 , G06N3/0464 , G06V10/82 , G06V40/16

Abstract: 本发明提供了一种虚拟角色的视频渲染方法，包括如下步骤：基于目标虚拟角色的第一人脸图像和目标虚拟角色对应的目标音频数据，获取到预设口型图像集；预设口型图像集包括若干个口型图像；根据若干个口型图像和第二人脸图像，获取到拼接人脸图像集；拼接人脸图像集包括若干个拼接人脸图像；根据若干个拼接人脸图像和目标换脸模型，获取到目标人脸图像集；目标人脸图像集包括若干个目标人脸图像；根据若干个目标人脸图像和目标虚拟角色的初始人脸图像，获取到目标虚拟角色对应的目标渲染视频。本发明能够实现虚拟角色视频的实时驱动与渲染，并能够应用于多种语言的语音播报。

70.

发明授权
知识融合方法、装置、设备、系统及介质有权

公开(公告)号：CN114139547B

公开(公告)日：2023-07-04

申请号：CN202111416144.1

申请日：2021-11-25

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 王宇琪 , 张佳旭 , 郭建彬 , 张文军 , 郝保 , 曹家 , 罗引 , 王磊

IPC: G06F40/30 , G06F40/295

Abstract: 本公开涉及一种知识融合方法、装置、设备、系统及介质。其中，知识融合法包括：基于第一实体数据中的第一实体名，获取第一实体数据对应的实体的至少一个实体别称，得到实体名称集；基于实体名称集，检测第一实体名和第二实体数据中的第二实体名是否匹配；在检测到第一实体名和第二实体名匹配时，将第一实体数据和第二实体数据进行融合，得到融合实体数据。根据本公开实施例，能够根据两条实体数据中的实体名是否匹配来判断它们是否需要融合，以减少计算量，提高融合效率，并且在两条实体数据中的实体名不匹配时，能够根据该两条实体数据的多维度相似度进行融合判别，以提高判别精度，进而实现多来源知识的融合，达到精准有效融合效果。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification