-
公开(公告)号:CN115563342A
公开(公告)日:2023-01-03
申请号:CN202211277485.X
申请日:2022-10-19
Applicant: 国家计算机网络与信息安全管理中心广东分中心 , 人民中科(北京)智能技术有限公司
IPC: G06F16/75 , G06F16/783 , G06F16/738
Abstract: 本发明公开了一种视频主题检索的方法、系统、设备及存储介质,用以解决现有技术样例视频的相似度计算是在较低级别上进行的问题。方法包括:S1、预训练跨模态视觉语言模型,并对所述跨模态视觉语言模型进行调整;S2、对给定的样例视频集合的场景进行分割,并对分割后的各样例视频片段的主题进行聚类;S3、基于所述调整后的跨模态视觉语言模型以及聚类的样例视频片段进行视频主题检索,并对检索结果进行聚合和排序后输出。系统包括:预训练和调整模块、分割和聚类模块、输出模块。计算机设备包括:存储器、处理器,以及计算机程序。包含计算机可执行指令的存储介质用于执行视频主题检索的方法。
-
公开(公告)号:CN118820444B
公开(公告)日:2024-12-17
申请号:CN202411280356.5
申请日:2024-09-13
Applicant: 人民中科(北京)智能技术有限公司 , 人民中科(黑龙江)数字产业有限公司
Abstract: 本发明公开了一种基于垂直领域知识的智能问答方法,包括以下步骤,基于垂直领域数据类型进行数据划分,根据若干个数据类型构建若干个知识库,并将数据保存至知识库中;知识库包括问答对知识库、知识图谱数据库和文档知识库;基于垂直领域的知识构建LLM微调指令以意图理解垂直领域专业词汇和用户问题涉及的内容;基于划分的数据类型和LLM的微调,构建智能问答核心组件以输出答案。将原始数据划分为三种类型,分别给出相应的技术方案进行解决;并深度融合通用LLM和垂直领域内的数据,通过精细的微调和定制化,使LLM进行意图理解;通过构建智能问答核心组件,给出三种问答模块,在垂直领域提供更准确、更专业的答案。
-
公开(公告)号:CN118820444A
公开(公告)日:2024-10-22
申请号:CN202411280356.5
申请日:2024-09-13
Applicant: 人民中科(北京)智能技术有限公司 , 人民中科(黑龙江)数字产业有限公司
Abstract: 本发明公开了一种基于垂直领域知识的智能问答方法,包括以下步骤,基于垂直领域数据类型进行数据划分,根据若干个数据类型构建若干个知识库,并将数据保存至知识库中;知识库包括问答对知识库、知识图谱数据库和文档知识库;基于垂直领域的知识构建LLM微调指令以意图理解垂直领域专业词汇和用户问题涉及的内容;基于划分的数据类型和LLM的微调,构建智能问答核心组件以输出答案。将原始数据划分为三种类型,分别给出相应的技术方案进行解决;并深度融合通用LLM和垂直领域内的数据,通过精细的微调和定制化,使LLM进行意图理解;通过构建智能问答核心组件,给出三种问答模块,在垂直领域提供更准确、更专业的答案。
-
公开(公告)号:CN118334399A
公开(公告)日:2024-07-12
申请号:CN202410075929.4
申请日:2024-01-18
Applicant: 人民中科(北京)智能技术有限公司
IPC: G06V10/764 , G06V10/774 , G06V10/40 , G06V30/422
Abstract: 本发明公开了一种基于两阶段方法和关键点的地图位置缺失识别方法,包括以下步骤:S1、数据采集以及标注;S2、地图边框检测模型的训练;S3、关键点检测模型的训练;S4、两阶段式识别地图是否存在位置缺失,并输出识别结果。本方法先进行地图的边框检测,之后将特别关注的地图关键区域的中心点(或具有明显标志的位置)作为地图该位置的关键点,进而判别地图是否存在缺失位置。得益于两阶段的方式以及使用关键点热图作为中间表示,即使在图片中干扰信息较多时、地图存在较大变换时、地图的尺寸变化较多时仍旧具有很好的鲁棒性,能够处理互联网海量数据的复杂性和多样性问题,为解决问题地图识别任务提供了新思路。
-
公开(公告)号:CN117786116A
公开(公告)日:2024-03-29
申请号:CN202311854048.4
申请日:2023-12-29
Applicant: 人民中科(北京)智能技术有限公司
IPC: G06F16/35 , G06N3/0455 , G06N3/0464 , G06N3/082 , G06N3/096 , G06Q50/18
Abstract: 本发明公开了一种基于多层级标签文本分类的公平竞争审查方法,采集大量的政策措施文件以构建政策措施本文信息库;基于库中的文本数据,采用BERT模型对政策语义模型进行训练,保存最终参数;随机选择库中的文本数据,构建审查案例库,并对案例文本进行人工标注;构建基于卷积神经网络的违规类型识别模型,结合标注结果进行训练,保存模型结构及参数;采集待审查文件,利用政策语义模型进行文本特征提取,并结合违规类型识别模型实现待审查文件的违规判断。本发明解决了现有基于同等级标签公平竞争审查模型模型准确率不高,缺少样本数据等问题,提升审查工作智能化水平,提升工作效率,有效解决审查、监管资源不足等问题。
-
公开(公告)号:CN116824710A
公开(公告)日:2023-09-29
申请号:CN202310587326.8
申请日:2023-05-23
Applicant: 中国科学院自动化研究所 , 人民中科(北京)智能技术有限公司
IPC: G06V40/40 , G06V40/16 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种伪造人脸鉴别方法、装置、设备和存储介质,将待鉴别图像输入人脸鉴别模型;获取人脸鉴别模型输出的待鉴别图像对应的鉴别结果;其中,人脸鉴别模型用于获取待鉴别图像的面部单元一致性特征,并基于待鉴别图像的面部单元一致性特征确定待鉴别图像对应的鉴别结果;待鉴别图像的面部单元一致性特征用于表征待鉴别图像的各面部单元相关区域之间的相关性;人脸鉴别模型是基于样本图像和样本图像对应的鉴别标签训练得到的,提升了对于未知造假方法合成的图像的鉴别效果。
-
公开(公告)号:CN119202660A
公开(公告)日:2024-12-27
申请号:CN202411292061.X
申请日:2024-09-14
Applicant: 人民中科(北京)智能技术有限公司 , 人民中科(黑龙江)数字产业有限公司
IPC: G06F18/213 , G06F18/10 , G06N5/02
Abstract: 本发明涉及互联网大数据技术领域,且公开了一种社交平台账号画像多模态向量化表征方法,包括作品内容画像表征、账号资料画像表征和社交关系画像表征。该社交平台账号画像多模态向量化表征方法,将基于用户发表的作品内容、账号资料、账号社交关系等信息对账号画像进行建模,并利用多模态内容将账号特征向量化,尽可能地多维度、全方位的表征账号信息,从而精准构建账号画像,通过特征向量化技术,解决文本标签提取信息损失问题和人工设计文本标签缺陷,同时通过作品内容、账号资料、账号社交关系等多个维度,以及多模态内容识别与分析,解决只基于文本信息表征账号画像不全面的问题。
-
公开(公告)号:CN114880514B
公开(公告)日:2022-11-01
申请号:CN202210781107.9
申请日:2022-07-05
Applicant: 人民中科(北京)智能技术有限公司
IPC: G06F16/583 , G06F16/58 , G06V10/75
Abstract: 本申请公开了一种图像检索方法、装置以及存储介质。其中,图像检索方法,包括:接收检索信息;确定与所述检索信息关联的文本信息以及图像信息;对所述文本信息以及所述图像信息进行基于注意力机制的特征表示,生成与所述检索信息对应的图像检索特征;以及根据所述图像检索特征,检索与所述检索信息匹配的图像。
-
公开(公告)号:CN116824710B
公开(公告)日:2025-04-29
申请号:CN202310587326.8
申请日:2023-05-23
Applicant: 中国科学院自动化研究所 , 人民中科(北京)智能技术有限公司
IPC: G06V40/40 , G06V40/16 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种伪造人脸鉴别方法、装置、设备和存储介质,将待鉴别图像输入人脸鉴别模型;获取人脸鉴别模型输出的待鉴别图像对应的鉴别结果;其中,人脸鉴别模型用于获取待鉴别图像的面部单元一致性特征,并基于待鉴别图像的面部单元一致性特征确定待鉴别图像对应的鉴别结果;待鉴别图像的面部单元一致性特征用于表征待鉴别图像的各面部单元相关区域之间的相关性;人脸鉴别模型是基于样本图像和样本图像对应的鉴别标签训练得到的,提升了对于未知造假方法合成的图像的鉴别效果。
-
公开(公告)号:CN118283380A
公开(公告)日:2024-07-02
申请号:CN202410329443.9
申请日:2024-03-21
Applicant: 人民中科(黑龙江)数字产业有限公司 , 人民中科(北京)智能技术有限公司
IPC: H04N21/84 , H04N21/845 , H04N21/44 , H04N21/234
Abstract: 本发明涉及一种视频描述生成方法、装置、计算机设备及存储介质,该方法包括:从目标视频中采样得到视频帧序列;从视频帧序列中提取出多个视觉特征以及语义概念特征;根据多个视觉特征和语义概念特征进行多特征融合编码,得到视频编码特征;基于一组可学习的事件查询以及视频编码特征,使用解码器进行解码,得到多个事件建议表示;利用多个子任务头对多个事件建议表示进行并行解码,得到事件建议集合;从事件建议集合中筛选出目标事件建议作为目标视频的描述结果。通过本申请,解决了相关技术中的密集视频描述方法缺乏对语义概念的关注与利用导致的密集视频描述中事件定位以及事件描述不准确的问题,实现了提升密集视频描述准确度的效果。
-
-
-
-
-
-
-
-
-