Patent search ap:("国家计算机网络与信息安全管理中心" OR "北京中科闻歌科技股份有限公司") AND inv:"王磊" Page 11

101.

发明公开
面向大语言模型的词向量生成方法、电子设备及存储介质有权

公开(公告)号：CN117113990A

公开(公告)日：2023-11-24

申请号：CN202311374453.6

申请日：2023-10-23

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 罗引 , 蒋永余 , 王宇琪 , 李庆晓 , 徐楠 , 曹家 , 王磊

IPC: G06F40/284 , G06F40/289 , G06F18/25

Abstract: 本发明涉及计算机技术应用领域，提供了一种面向大语言模型的词向量生成方法、电子设备及存储介质，包括：获取待分词的文本，作为目标文本；对目标文本进行分词处理，得到对应的分词集S；基于预设词向量基准表T，获取每个词在每个嵌入矩阵的特征向量；基于预设滑动窗口长度d，将S划分为多个语句片段，得到对应的语句片段集SP；对每个语句片段的特征向量进行融合，得到对应的特征向量；得到SP对应的特征向量F作为目标文本的特征向量。本发明在词向量生成过程中，将多个相邻的词组合视为一个词，能够使得分词的长度得到极大的压缩。此外，将不同词的特征向量通过张量积的方式组合成一个词的特征向量，可以极大的降低可训练参数量。

102.

发明公开
数据处理方法、装置、设备及计算机可读存储介质审中-实审

公开(公告)号：CN117056408A

公开(公告)日：2023-11-14

申请号：CN202311110409.4

申请日：2023-08-30

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 邢日上 , 杜江涛 , 禹平 , 方省 , 曹家 , 罗引 , 王磊

IPC: G06F16/25 , G06F16/2455 , G06F3/06

Abstract: 本公开涉及一种数据处理方法、装置、设备及计算机可读存储介质，该方法包括：获取序列化的二进制数据，将所述数据解码为标准化格式的数据对象；对所述标准化格式数据进行数据处理，得到处理结果；将所述处理结果序列化编码后存储到内存，进而写入磁盘中。本公开通过将数据解码为标准化格式数据，通过解码为标准化格式数据，提高使用便捷度；对标准化格式数据进行数据处理，得到处理结果，并将结果通过网络传输，降低了传输的数据大小，节省了带宽；将处理结果编码后存储到内存中，降低了对内存空间的占用；写入磁盘，提高了磁盘利用率，节省了磁盘的使用。

103.

发明公开
基于语音驱动和人脸自驱动的虚拟人视频合成方法有权

公开(公告)号：CN116528019A

公开(公告)日：2023-08-01

申请号：CN202310724745.1

申请日：2023-06-19

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 罗引 , 郑洋 , 陈博 , 徐楠 , 李军锋 , 曹家 , 王磊

IPC: H04N21/81 , G06T13/20 , G06T13/40

Abstract: 本发明提供了一种基于语音驱动和人脸自驱动的虚拟人视频合成方法，包括：对原始虚拟人视频素材进行预处理，得到首帧人脸图像为基准人脸图像的第一视频素材；利用设定口型驱动模型驱动所述第一视频素材，得到第二视频素材；将第一视频素材中的首帧人脸图像作为被驱动人脸图像，将第二视频素材中的人脸图像作为口型驱动图像序列，通过设定人脸驱动算法得到第三视频素材；利用第三视频素材中的人脸图像替换原始虚拟人视频素材中对应的人脸图像，得到第四视频素材；将第四视频素材和目标音频文件进行合成，得到虚拟人内容播报视频。本发明能够高清化虚拟人的唇形、牙齿细节，发音和唇形吻合度高，可以对新的人物形象不加训练而快速迁移。

104.

发明公开
一种视觉驱动的虚拟角色处理系统有权

公开(公告)号：CN116452787A

公开(公告)日：2023-07-18

申请号：CN202310696721.X

申请日：2023-06-13

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 罗引 , 郑洋 , 陈博 , 徐楠 , 方省 , 曹家 , 王磊

IPC: G06T19/20 , G06T7/55 , G06T7/70 , G06V40/16

Abstract: 本发明提供了一种视觉驱动的虚拟角色处理系统，该系统包括非虚拟角色图像组列表A={A1，A2，……，Ai，……，Am}、虚拟角色图像组B、处理器和存储有计算机程序的存储器，i=1，2，……，m，m为非虚拟角色图像组数量，Ai为第i帧非虚拟角色图像组，还包括根据A获得的非虚拟姿态图像组C={C1，C2，……，Ci，……，Cm}和非虚拟面部图像组D={D1，D2，……，Di，……，Dm}，以及根据虚拟角色图像组B获得的虚拟角色的姿态图像Bb和虚拟角色的表情图像Bm，当所述计算机程序被处理器执行时，将Ci与Bb对齐，将Di与Bm对齐，提高了虚拟角色与非虚拟角色的吻合度。

105.

发明公开
一种基于预训练模型的话题生成方法审中-实审

公开(公告)号：CN116361469A

公开(公告)日：2023-06-30

申请号：CN202310347857.X

申请日：2023-04-03

Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司

Inventor： 王磊 , 郭鸿飞 , 王俊艳 , 徐才 , 王柯淇 , 蔡昌艳 , 王宇琪 , 曹家 , 罗引

IPC: G06F16/35

Abstract: 本发明提供了一种基于预训练模型的话题生成方法，包括：获取待聚类文本中的每个文本的特征向量和关键词，每个文本包括h个关键词；利用设定聚类算法对待聚类文本进行聚类，得到多个话题；对多个话题进行清洗和合并处理，得到处理后的n个话题；对于n个话题中的任一话题，基于预训练生成模型生成对应的话题描述；输出n个话题的话题描述和对应的文本。本发明由于采用预训练生成模型生成话题描述，使得得到的话题描述通顺，可读性强，并且由于对话题进行了清洗和合并，使得聚类结果更加准确。

106.

发明授权
基于话题描述的文本聚类方法、电子设备和存储介质有权

公开(公告)号：CN116049414B

公开(公告)日：2023-06-06

申请号：CN202310346367.8

申请日：2023-04-03

Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司

Inventor： 罗引 , 郭鸿飞 , 王俊艳 , 蔡昌艳 , 蒋永余 , 徐才 , 王婧宜 , 王宇琪 , 曹家 , 王磊

IPC: G06F16/35 , G06F18/22

Abstract: 本发明提供了一种基于话题描述的文本聚类方法、电子设备和存储介质，方法包括：首先对待聚类的每个文本生成一个话题描述，然后将该话题描述输入话题描述特征生成模型，提取话题描述的特征，作为当前文本的话题描述特征，基于该特征，对文本进行聚类，相较于直接使用原始文本提取的特征进行聚类，使用生成的话题描述特征进行聚类，减少了文本内容形式多样导致的噪声干扰，提高了聚类准确性。聚类后，基于文本和话题的特征向量之间的相似度以及文本和话题的话题描述特征向量之间的相似度，对聚类结果进行清洗和合并，最后得到聚类结果和每个话题的话题描述，能够使得聚类结果更加准确。

107.

发明公开
基于细粒度感知的文本视频跨模态检索方法和装置审中-实审

公开(公告)号：CN116166843A

公开(公告)日：2023-05-26

申请号：CN202310200445.3

申请日：2023-03-02

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 罗引 , 郝艳妮 , 马先钦 , 郝保 , 方省 , 曹家 , 王磊

IPC: G06F16/783 , G06F40/289 , G06F18/22

Abstract: 本公开涉及一种基于细粒度感知的文本视频跨模态检索方法和装置。所述方法包括：通过文本特征编码模型，对待匹配文本进行特征提取，获得所述待匹配文本的多个词语的文本特征向量集；通过视频特征编码模型，对待匹配视频进行特征提取，获得多个目标对象的目标特征向量集；通过跨模态匹配模型，确定目标特征向量集和文本特征向量集之间的相关性得分。根据本公开的实施例的基于细粒度感知的文本视频跨模态检索方法，可在检索任务中引入更细粒度的语义特征，并在模型训练中针对更细粒度的语义特征的识别和对比能力加以训练，使得模型能够对更细粒度的语义特征进行检索，可提升跨模态检索的准确性。

108.

发明公开
基于话题描述的文本聚类方法、电子设备和存储介质有权

公开(公告)号：CN116049414A

公开(公告)日：2023-05-02

申请号：CN202310346367.8

申请日：2023-04-03

Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司

Inventor： 罗引 , 郭鸿飞 , 王俊艳 , 蔡昌艳 , 蒋永余 , 徐才 , 王婧宜 , 王宇琪 , 曹家 , 王磊

IPC: G06F16/35 , G06F18/22

Abstract: 本发明提供了一种基于话题描述的文本聚类方法、电子设备和存储介质，方法包括：首先对待聚类的每个文本生成一个话题描述，然后将该话题描述输入话题描述特征生成模型，提取话题描述的特征，作为当前文本的话题描述特征，基于该特征，对文本进行聚类，相较于直接使用原始文本提取的特征进行聚类，使用生成的话题描述特征进行聚类，减少了文本内容形式多样导致的噪声干扰，提高了聚类准确性。聚类后，基于文本和话题的特征向量之间的相似度以及文本和话题的话题描述特征向量之间的相似度，对聚类结果进行清洗和合并，最后得到聚类结果和每个话题的话题描述，能够使得聚类结果更加准确。

109.

发明公开
税收预测方法、装置、设备及计算机可读存储介质审中-实审

公开(公告)号：CN115796389A

公开(公告)日：2023-03-14

申请号：CN202310045255.9

申请日：2023-01-30

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 郭建彬 , 董立峰 , 赵菲菲 , 罗引 , 王磊

IPC: G06Q10/04 , G06Q40/10

Abstract: 本公开涉及一种税收预测方法、装置、设备及计算机可读存储介质，该方法包括：获取目标税收主体的税收样本数据以及所述税收样本数据的演化模式标注结果；基于所述税收样本数据以及所述演化模式标注结果进行模型训练，得到训练好的税收演化模式匹配模型；将目标税收主体的历史税收数据输入所述税收演化模式匹配模型，得到所述目标税收主体的税收演化模式预测结果；基于所述税收演化模式预测结果，生成所述目标税收主体的衍生特征向量；将所述目标税收主体的衍生特征向量输入预先训练好的多模式税收预测模型，得到所述目标税收主体的税收预测结果。本公开通过为目标税收主体匹配最佳的税收演化模式，显著提升了预测的精准性。

110.

发明公开
迁出风险企业的税源管理方法、装置、设备及存储介质审中-实审

公开(公告)号：CN115660796A

公开(公告)日：2023-01-31

申请号：CN202211577616.6

申请日：2022-12-09

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 郭建彬 , 董立峰 , 黄泰文 , 柳力多 , 赵菲菲 , 罗引 , 王磊

IPC: G06Q40/00 , G06Q40/10

Abstract: 本公开涉及一种迁出风险企业的税源管理方法、装置、设备及存储介质，涉及数据分析技术领域，迁出风险企业的税源管理方法包括：获取目标企业的经营数据；对经营数据进行特征提取处理，得到目标企业与企业迁出行为相关的特征；将特征输入预设的企业迁出风险监控模型，基于企业迁出风险监控模型，对目标企业进行迁出风险检测。本公开实施例可以通过预设的企业迁出风险监控模型对存在迁出风险的企业进行精准稳定地的识别与预警，无需依靠人为经验，缩短企业迁出风险税前监控的时间，提高对重点税源流失预警响应的时效性和准确性。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification