Patent search ap:("国家计算机网络与信息安全管理中心" OR "北京中科闻歌科技股份有限公司") AND inv:"曹家" Page 5

41.

发明公开
一种基于大模型的多模态假新闻检测方法、装置、及设备审中-公开

公开(公告)号：CN119782889A

公开(公告)日：2025-04-08

申请号：CN202411952956.1

申请日：2024-12-27

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 巫啸宇 , 王婧宜 , 徐楠 , 郝燕妮 , 李军锋 , 曹家 , 罗引 , 王磊

IPC: G06F18/24 , G06F18/213 , G06V10/44 , G06N3/0455 , G06F18/22 , G06N3/048

Abstract: 本申请涉及一种基于大模型的多模态假新闻检测方法、装置、及设备，尤其涉及信息处理技术领域。包括：将多模态待测新闻分别输入大模型gte‑Qwen2‑1.5B‑instruct、预训练视觉模型SwinT和预训练图文对比模型Clip，得到文本特征、图像特征以及文本对比特征和图像对比特征；计算归一化后的文本对比特征与图像对比特征之间的余弦相似度，得到图文相似度；将图文相似度作为注意力矩阵阈值来增强文本特征和图像特征，以提取局部异同特征；将图文相似度作为权重来增强文本特征和图像特征，以提取全局异同特征；将局部异同特征和全局异同特征输入假新闻分类器，得到假新闻分类器输出的多模态待测新闻的真实性预测值。

42.

发明公开
一种仿人类复杂问题检索方法、电子设备及存储介质审中-公开

公开(公告)号：CN119782463A

公开(公告)日：2025-04-08

申请号：CN202411840111.3

申请日：2024-12-13

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 张帅星 , 徐楠 , 张倩 , 孙雷 , 李军锋 , 曹家 , 罗引 , 王磊

IPC: G06F16/3329 , G06F16/353 , G06F40/35 , G06N3/045 , G06N5/022

Abstract: 本发明提供了一种仿人类复杂问题检索方法、电子设备及存储介质，该方法包括：对原始问题语句进行拆解处理，以得到若干个原子问题语句；根据若干个原子问题语句之间的关联关系，确定若干个原子问题语句之间的执行顺序；根据每一原子问题语句对应的语句类型，确定每一原子问题语句对应的目标检索信源；根据若干原子问题语句之间的执行顺序，依次通过每一原子问题语句对应的目标检索信源，对该原子问题语句进行检索，得到每一原子问题语句对应的原始答复语句；对若干原始答复语句进行语义整合，得到原始问题语句对应的目标答复语句，以通过意图识别、问题拆解、逻辑规划、扩展生成以及动态执行等多个模块协同工作，有效解决了复杂问题的检索难题。

43.

发明授权
针对包含边框的视频拷贝检测方法及装置有权

公开(公告)号：CN113971770B

公开(公告)日：2024-10-29

申请号：CN202010648949.8

申请日：2020-07-07

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 郝艳妮 , 孔庆超 , 徐楠 , 方省 , 郝保 , 曹家 , 赵菲菲 , 罗引 , 王磊

IPC: G06V20/40 , G06N3/0464 , G06T5/70 , G06T7/11 , G06T7/13 , G06F16/71 , G06V10/82 , G06T5/60

Abstract: 本发明涉及一种针对包含边框的视频拷贝检测方法及装置，该方法包括：从样本视频中抽取多个第一关键帧图像；基于图像边缘由外向内遍历第一关键帧图像，去除纯色像素点区域，得到多个非纯色像素点为边缘的第二关键帧图像；对第二关键帧图像进行二次遍历，去除纯色像素点个数大于第一阈值的图像区域；从每个第二关键帧图像中提取图像特征，得到多个第一多维图像特征向量；基于多个第一多维图像特征向量与视频库中存储的视频的多个第二多维图像特征向量建立索引，获取多个拷贝视频帧图像；根据时间信息，将多个拷贝视频帧图像进行整合，获得拷贝视频片段，由此，可以实现对视频中存在的多处拷贝视频片段的准确检测，并确定其在原视频中的位置。

44.

发明授权
图片匹配方法、装置、电子设备以及存储介质有权

公开(公告)号：CN112650867B

公开(公告)日：2024-09-24

申请号：CN202011561238.3

申请日：2020-12-25

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 徐楠 , 马先钦 , 吴晓飞 , 孔庆超 , 张西娜 , 曹家 , 曲宝玉 , 罗引 , 王磊

IPC: G06F16/535 , G06F16/583

Abstract: 本发明实施例公开了一种图片匹配方法、装置、电子设备以及存储介质。该方法包括：获取目标文本，基于预先训练的特征提取模型提取所述目标文本的文本特征信息；将所述文本特征信息与预设图库中各图片的图片特征信息进行匹配，其中，所述各图片的图片特征信息基于所述预先训练的特征提取模型对各图片提取得到，所述特征提取模型包括文本特征提取子模型、图片特征提取子模型以及分别与所述文本特征提取子模型、所述图片特征提取子模型连接的联合特征提取子模型；将与所述文本特征信息相匹配的图片确定为所述目标文本的匹配图片。通过本发明实施例公开的技术方案，实现了文本自动配图，提升文本的观感质量，激发读者的阅读兴趣，提升读者的阅读体验。

45.

发明授权
评论生成模型训练方法和装置、信息生成方法和装置有权

公开(公告)号：CN117591948B

公开(公告)日：2024-09-03

申请号：CN202410082714.5

申请日：2024-01-19

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 罗引 , 李庆晓 , 徐楠 , 王宇琪 , 曹家 , 王磊

IPC: G06F18/2411 , G06F40/166 , G06F18/214

Abstract: 本公开提供了一种评论生成模型训练方法和装置，涉及人工智能技术领域，具体涉及自然语言处理、深度学习、大模型等技术领域。具体实现方案为：获取文本样本集，文本样本集包括：第一文本样本，第一文本样本包括：展示文本以及与展示文本相关的情感立场文本；获取预先构建的评论生成网络，评论生成网络包括：编码器和解码器，编码器分别对展示文本和情感立场文本进行建模，得到评论全局特征向量；解码器用于对评论全局特征向量进行解码，得到评论结果信息；将从文本样本集中选取的第一文本样本输入评论生成网络，得到评论生成网络输出的评论结果信息；基于评论结果信息，得到训练完成的评论生成模型。

46.

发明授权
金融风险线索确定方法、装置、设备和介质有权

公开(公告)号：CN114936282B

公开(公告)日：2024-06-11

申请号：CN202210470144.8

申请日：2022-04-28

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 张东雷 , 柳力多 , 王芳芳 , 董立峰 , 曲宝玉 , 王磊 , 罗引 , 曹家

IPC: G06F18/24 , G06F18/23 , G06F18/214 , G06N3/04 , G06Q10/0635 , G06Q40/00

Abstract: 本公开实施例涉及一种金融风险线索确定方法、装置、设备和介质。该方法包括：获取待分类文本，并对待分类文本进行分词处理，得到各目标词语；基于各目标词语和目标词向量索引表，生成待分类文本对应的第一融合词向量组合；其中，目标词向量索引表基于初始文本样本集和预设向量转换算法预先构建，初始文本样本集为文本分类模型的训练样本集，预设向量转换算法用于将文本转换为多级别的词向量；将第一融合词向量组合输入文本分类模型，并根据模型输出结果确定待分类文本的目标文本类型；基于目标文本类型确定待分类文本是否为金融分线线索。通过上述技术方案，有效地提升了文本分类速度，进而提升线上金融业务中违规行为信息的发现效率。

47.

发明授权
一种基于话题描述的文本聚类清洗和合并方法有权

公开(公告)号：CN116361470B

公开(公告)日：2024-05-14

申请号：CN202310347961.9

申请日：2023-04-03

Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司

Inventor： 王磊 , 郭鸿飞 , 王俊艳 , 徐才 , 王柯淇 , 蔡昌艳 , 蒋永余 , 王璋盛 , 曹家 , 罗引

IPC: G06F16/35

Abstract: 本发明提供了一种基于话题描述的文本聚类清洗和合并方法，首先对文本进行聚类，得到多个聚类结果，每个聚类结果相当于一个话题，然后基于话题向量与话题中文本向量的文本相似度大小、话题描述与每个文本生成的话题描述的文本相似度大小、文本与话题的关键词相同的个数三个指标，对聚类结果进行清洗和合并，最后得到聚类结果和每个话题的描述，能够使得聚类结果更加准确。

48.

发明公开
基于预训练模型的通用立场检测方法、装置和存储介质审中-实审

公开(公告)号：CN117972420A

公开(公告)日：2024-05-03

申请号：CN202410038893.2

申请日：2024-01-10

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 罗引 , 刘宏宇 , 王宇琪 , 徐楠 , 张西娜 , 曹家 , 王磊

IPC: G06F18/214 , G06F40/194 , G06F40/30

Abstract: 本申请涉及自然语言处理技术领域，尤其涉及一种基于预训练模型的通用立场检测方法、装置和存储介质。包括：获取待检测文本和待检测立场目标；将待检测文本和待检测立场目标输入通用立场检测模型，预测待检测文本对于待检测立场目标的立场类别概率分布；立场类别用于表示待检测文本对于待检测立场目标的立场；通用立场检测模型为根据至少一个文本、至少一个立场目标、每个文本的立场类别和每个文本的立场类型预先训练得到；立场类型用于表示文本的立场类别是否依赖于立场目标；将立场类别概率分布中最大概率数值对应的立场类别，确定为待检测文本对于待检测立场目标的立场类别。本申请实施例用于解决立场检测的检测效果较差的问题。

49.

发明公开
一种通用数据获取系统审中-实审

公开(公告)号：CN117472720A

公开(公告)日：2024-01-30

申请号：CN202311826887.5

申请日：2023-12-28

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 韩东 , 朱超 , 方省 , 曹家 , 罗引 , 王磊

IPC: G06F11/34 , G06F11/30

Abstract: 本申请涉及数据处理技术领域，特别是涉及一种通用数据获取系统，该系统包括处理器和存储有计算机程序、目标应用程序和可读性源码的存储器，当计算机程序被处理器执行时，实现以下步骤：获取到目标应用程序的初始运行数据并获取到可读性源码中的目标参数，根据目标参数确定可读性源码中包括起始钩子点和结束钩子点的钩子点，根据钩子点设置钩子函数，在运行目标应用程序时调用钩子函数得到通用数据，通过定位钩子点以及设置钩子函数，改变了目标应用程序的原始程序运行逻辑，自动得到通用数据，可以获取因加密等问题不能正确请求相关页面请求连接及返回的数据内容，并解决了获取目标应用程序的通用数据的低效问题，提高了通用数据的获取效率。

50.

发明公开
一种多模态大型语言模型训练方法、电子设备及存储介质审中-实审

公开(公告)号：CN117409431A

公开(公告)日：2024-01-16

申请号：CN202311412797.1

申请日：2023-10-27

Applicant: 北京中科闻歌科技股份有限公司

Inventor： 罗引 , 郝艳妮 , 陈博 , 马先钦 , 徐楠 , 曹家 , 王磊

IPC: G06V30/413 , G06V30/146 , G06V30/19

Abstract: 本发明提供了多模态大型语言模型训练方法、电子设备和存储介质，涉及计算机技术应用领域，包括：利用第一训练样本对图文对齐模型进行训练，得到训练后的图文对齐模型；第二训练样本对大型语言模型进行训练，第一训练样本对包含一个第一图像样本和对应的原始文本；第一图像样本仅包括自然图像；第二训练样本集包括多个第二训练样本对，每个第二训练样本对包含一个第二图像样本和对应的问答对文本，其中，第二图像样本中设置有目标检测框，第二图像样本至少包括文档、表格、图表和自然图像。本发明能够理解不同种类的图表和文档数据，且具有对图片中的区域准确定位的能力，能够解锁更加多样的多模态能力。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification