Patent search ap:("国家计算机网络与信息安全管理中心" OR "北京中科闻歌科技股份有限公司") AND inv:"罗引" Page 12

111.

发明公开
一种通用数据获取系统审中-实审

公开(公告)号：CN117472720A

公开(公告)日：2024-01-30

申请号：CN202311826887.5

申请日：2023-12-28

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 韩东 , 朱超 , 方省 , 曹家 , 罗引 , 王磊

IPC: G06F11/34 , G06F11/30

Abstract: 本申请涉及数据处理技术领域，特别是涉及一种通用数据获取系统，该系统包括处理器和存储有计算机程序、目标应用程序和可读性源码的存储器，当计算机程序被处理器执行时，实现以下步骤：获取到目标应用程序的初始运行数据并获取到可读性源码中的目标参数，根据目标参数确定可读性源码中包括起始钩子点和结束钩子点的钩子点，根据钩子点设置钩子函数，在运行目标应用程序时调用钩子函数得到通用数据，通过定位钩子点以及设置钩子函数，改变了目标应用程序的原始程序运行逻辑，自动得到通用数据，可以获取因加密等问题不能正确请求相关页面请求连接及返回的数据内容，并解决了获取目标应用程序的通用数据的低效问题，提高了通用数据的获取效率。

112.

发明公开
一种多模态大型语言模型训练方法、电子设备及存储介质审中-实审

公开(公告)号：CN117409431A

公开(公告)日：2024-01-16

申请号：CN202311412797.1

申请日：2023-10-27

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 罗引 , 郝艳妮 , 陈博 , 马先钦 , 徐楠 , 曹家 , 王磊

IPC: G06V30/413 , G06V30/146 , G06V30/19

Abstract: 本发明提供了多模态大型语言模型训练方法、电子设备和存储介质，涉及计算机技术应用领域，包括：利用第一训练样本对图文对齐模型进行训练，得到训练后的图文对齐模型；第二训练样本对大型语言模型进行训练，第一训练样本对包含一个第一图像样本和对应的原始文本；第一图像样本仅包括自然图像；第二训练样本集包括多个第二训练样本对，每个第二训练样本对包含一个第二图像样本和对应的问答对文本，其中，第二图像样本中设置有目标检测框，第二图像样本至少包括文档、表格、图表和自然图像。本发明能够理解不同种类的图表和文档数据，且具有对图片中的区域准确定位的能力，能够解锁更加多样的多模态能力。

113.

发明公开
一种多模态大模型训练策略确定方法、电子设备及介质审中-实审

公开(公告)号：CN117407754A

公开(公告)日：2024-01-16

申请号：CN202311415357.1

申请日：2023-10-27

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 罗引 , 魏靖烜 , 郝艳妮 , 陈博 , 马先钦 , 徐楠 , 曹家 , 王磊

IPC: G06F18/24 , G06F18/214 , G06F18/22 , G06N3/09

Abstract: 本发明提供了一种多模态大模型训练策略确定方法、电子设备及介质，涉及多模态大模型训练策略确定领域，所述方法包括：获取初始多模态大模型对应的状态列表A；使用预设的一阶段训练策略，对初始多模态大模型进行训练，以得到第一中间多模态大模型列表B；使用预设的两阶段训练策略，分别对处于A中每一状态的初始多模态大模型进行训练，以得到第二中间多模态大模型列表C；获取B对应的第一性能参数列表α＝(α1，α2，α3)以及C对应的第二性能参数列表β＝(β1，β2，β3)；若α1＜β1、α2＜β2且α3＜β3，则将预设的两阶段训练策略确定为初始多模态大模型对应的目标训练策略；本发明能够达到确定出最佳的模型训练策略的目的。

114.

发明公开
面向大语言模型的词向量生成方法、电子设备及存储介质有权

公开(公告)号：CN117113990A

公开(公告)日：2023-11-24

申请号：CN202311374453.6

申请日：2023-10-23

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 罗引 , 蒋永余 , 王宇琪 , 李庆晓 , 徐楠 , 曹家 , 王磊

IPC: G06F40/284 , G06F40/289 , G06F18/25

Abstract: 本发明涉及计算机技术应用领域，提供了一种面向大语言模型的词向量生成方法、电子设备及存储介质，包括：获取待分词的文本，作为目标文本；对目标文本进行分词处理，得到对应的分词集S；基于预设词向量基准表T，获取每个词在每个嵌入矩阵的特征向量；基于预设滑动窗口长度d，将S划分为多个语句片段，得到对应的语句片段集SP；对每个语句片段的特征向量进行融合，得到对应的特征向量；得到SP对应的特征向量F作为目标文本的特征向量。本发明在词向量生成过程中，将多个相邻的词组合视为一个词，能够使得分词的长度得到极大的压缩。此外，将不同词的特征向量通过张量积的方式组合成一个词的特征向量，可以极大的降低可训练参数量。

115.

发明公开
数据处理方法、装置、设备及计算机可读存储介质审中-实审

公开(公告)号：CN117056408A

公开(公告)日：2023-11-14

申请号：CN202311110409.4

申请日：2023-08-30

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 邢日上 , 杜江涛 , 禹平 , 方省 , 曹家 , 罗引 , 王磊

IPC: G06F16/25 , G06F16/2455 , G06F3/06

Abstract: 本公开涉及一种数据处理方法、装置、设备及计算机可读存储介质，该方法包括：获取序列化的二进制数据，将所述数据解码为标准化格式的数据对象；对所述标准化格式数据进行数据处理，得到处理结果；将所述处理结果序列化编码后存储到内存，进而写入磁盘中。本公开通过将数据解码为标准化格式数据，通过解码为标准化格式数据，提高使用便捷度；对标准化格式数据进行数据处理，得到处理结果，并将结果通过网络传输，降低了传输的数据大小，节省了带宽；将处理结果编码后存储到内存中，降低了对内存空间的占用；写入磁盘，提高了磁盘利用率，节省了磁盘的使用。

116.

发明公开
基于语音驱动和人脸自驱动的虚拟人视频合成方法有权

公开(公告)号：CN116528019A

公开(公告)日：2023-08-01

申请号：CN202310724745.1

申请日：2023-06-19

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 罗引 , 郑洋 , 陈博 , 徐楠 , 李军锋 , 曹家 , 王磊

IPC: H04N21/81 , G06T13/20 , G06T13/40

Abstract: 本发明提供了一种基于语音驱动和人脸自驱动的虚拟人视频合成方法，包括：对原始虚拟人视频素材进行预处理，得到首帧人脸图像为基准人脸图像的第一视频素材；利用设定口型驱动模型驱动所述第一视频素材，得到第二视频素材；将第一视频素材中的首帧人脸图像作为被驱动人脸图像，将第二视频素材中的人脸图像作为口型驱动图像序列，通过设定人脸驱动算法得到第三视频素材；利用第三视频素材中的人脸图像替换原始虚拟人视频素材中对应的人脸图像，得到第四视频素材；将第四视频素材和目标音频文件进行合成，得到虚拟人内容播报视频。本发明能够高清化虚拟人的唇形、牙齿细节，发音和唇形吻合度高，可以对新的人物形象不加训练而快速迁移。

117.

发明公开
一种视觉驱动的虚拟角色处理系统有权

公开(公告)号：CN116452787A

公开(公告)日：2023-07-18

申请号：CN202310696721.X

申请日：2023-06-13

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 罗引 , 郑洋 , 陈博 , 徐楠 , 方省 , 曹家 , 王磊

IPC: G06T19/20 , G06T7/55 , G06T7/70 , G06V40/16

Abstract: 本发明提供了一种视觉驱动的虚拟角色处理系统，该系统包括非虚拟角色图像组列表A={A1，A2，……，Ai，……，Am}、虚拟角色图像组B、处理器和存储有计算机程序的存储器，i=1，2，……，m，m为非虚拟角色图像组数量，Ai为第i帧非虚拟角色图像组，还包括根据A获得的非虚拟姿态图像组C={C1，C2，……，Ci，……，Cm}和非虚拟面部图像组D={D1，D2，……，Di，……，Dm}，以及根据虚拟角色图像组B获得的虚拟角色的姿态图像Bb和虚拟角色的表情图像Bm，当所述计算机程序被处理器执行时，将Ci与Bb对齐，将Di与Bm对齐，提高了虚拟角色与非虚拟角色的吻合度。

118.

发明公开
一种基于预训练模型的话题生成方法审中-实审

公开(公告)号：CN116361469A

公开(公告)日：2023-06-30

申请号：CN202310347857.X

申请日：2023-04-03

Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司

Inventor： 王磊 , 郭鸿飞 , 王俊艳 , 徐才 , 王柯淇 , 蔡昌艳 , 王宇琪 , 曹家 , 罗引

IPC: G06F16/35

Abstract: 本发明提供了一种基于预训练模型的话题生成方法，包括：获取待聚类文本中的每个文本的特征向量和关键词，每个文本包括h个关键词；利用设定聚类算法对待聚类文本进行聚类，得到多个话题；对多个话题进行清洗和合并处理，得到处理后的n个话题；对于n个话题中的任一话题，基于预训练生成模型生成对应的话题描述；输出n个话题的话题描述和对应的文本。本发明由于采用预训练生成模型生成话题描述，使得得到的话题描述通顺，可读性强，并且由于对话题进行了清洗和合并，使得聚类结果更加准确。

119.

发明授权
基于话题描述的文本聚类方法、电子设备和存储介质有权

公开(公告)号：CN116049414B

公开(公告)日：2023-06-06

申请号：CN202310346367.8

申请日：2023-04-03

Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司

Inventor： 罗引 , 郭鸿飞 , 王俊艳 , 蔡昌艳 , 蒋永余 , 徐才 , 王婧宜 , 王宇琪 , 曹家 , 王磊

IPC: G06F16/35 , G06F18/22

Abstract: 本发明提供了一种基于话题描述的文本聚类方法、电子设备和存储介质，方法包括：首先对待聚类的每个文本生成一个话题描述，然后将该话题描述输入话题描述特征生成模型，提取话题描述的特征，作为当前文本的话题描述特征，基于该特征，对文本进行聚类，相较于直接使用原始文本提取的特征进行聚类，使用生成的话题描述特征进行聚类，减少了文本内容形式多样导致的噪声干扰，提高了聚类准确性。聚类后，基于文本和话题的特征向量之间的相似度以及文本和话题的话题描述特征向量之间的相似度，对聚类结果进行清洗和合并，最后得到聚类结果和每个话题的话题描述，能够使得聚类结果更加准确。

120.

发明公开
基于细粒度感知的文本视频跨模态检索方法和装置审中-实审

公开(公告)号：CN116166843A

公开(公告)日：2023-05-26

申请号：CN202310200445.3

申请日：2023-03-02

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 罗引 , 郝艳妮 , 马先钦 , 郝保 , 方省 , 曹家 , 王磊

IPC: G06F16/783 , G06F40/289 , G06F18/22

Abstract: 本公开涉及一种基于细粒度感知的文本视频跨模态检索方法和装置。所述方法包括：通过文本特征编码模型，对待匹配文本进行特征提取，获得所述待匹配文本的多个词语的文本特征向量集；通过视频特征编码模型，对待匹配视频进行特征提取，获得多个目标对象的目标特征向量集；通过跨模态匹配模型，确定目标特征向量集和文本特征向量集之间的相关性得分。根据本公开的实施例的基于细粒度感知的文本视频跨模态检索方法，可在检索任务中引入更细粒度的语义特征，并在模型训练中针对更细粒度的语义特征的识别和对比能力加以训练，使得模型能够对更细粒度的语义特征进行检索，可提升跨模态检索的准确性。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification