-
公开(公告)号:CN111753657B
公开(公告)日:2023-01-13
申请号:CN202010428815.5
申请日:2020-05-20
Applicant: 中国科学院信息工程研究所(CN)
IPC: G06V20/40 , G06V10/774
Abstract: 本发明公开了一种基于自训练的文本检测器训练方法及系统。本方法步骤包括:1)获取来源于目标域的视频数据;使用源域的数据对检测器和跟踪器进行预训练;2)利用步骤1)训练后的检测器处理来源于目标域的视频数据,获得该视频数据每一帧的检测结果;步骤1)训练后的跟踪器根据前一帧的检测结果预测当前帧的跟踪结果;3)文本挖掘模块将每一帧的检测结果与跟踪结果进行融合生成运动轨迹,然后根据该运动轨迹中的边界包围盒来预测轨迹结果,以及从该运动轨迹中挖掘得到难正样本和难负样本,其中当且仅当该视频数据中的一帧图像A中存在难正样本或难负样本,则将图像A添加到伪数据集中;4)利用步骤3)得到的伪数据集训练检测器。
-
公开(公告)号:CN112347097B
公开(公告)日:2022-07-29
申请号:CN202011011197.0
申请日:2020-09-23
Applicant: 中国科学院信息工程研究所
IPC: G06F16/22 , G06F16/242 , G06F16/27
Abstract: 本发明提供的支持多版本Hive表分区的数据加载、查询方法及电子装置,包括获取每条数据的分区字段;根据分区字段与各分区字段值列表的匹配关系,将每条数据写入相应的Hive表分区内;若存入哈希分区或自动间隔分区时,分区字段不能与现有的值列表匹配,创建新的哈希分区或自动间隔分区并生成新版本;若数据存入列表分区或区间分区时,列表分区规则或区间分区规则发生改动并生成相应新版本时,写入相应的列表分区或区间分区。本发明能够面对海量数据的存储和查询提供更加高效的复杂分区机制,在保持历史数据分区规则不变的同时,以多版本技术支持对增量数据分区规则在线调整,避免无意义扫描和计算,节省大量时间,极大提高系统的可维护性和查询效率。
-
公开(公告)号:CN112380427B
公开(公告)日:2022-07-08
申请号:CN202011159408.5
申请日:2020-10-27
Applicant: 中国科学院信息工程研究所
IPC: G06F16/9535 , G06Q50/00 , G06N20/00
Abstract: 本发明公开了一种基于迭代图注意力网络的用户兴趣预测方法及电子装置,通过未知兴趣标签分布与兴趣标签联合依赖概率,将用户特征学习的图注意力网络GATθ与兴趣潜在关系建模的图注意力网络相结合,并引入标签传播机制捕捉兴趣标签的局部依赖关系,对用户网络中的各用户兴趣进行预测。本发明,弥补了目前主流的用户兴趣预测方法对兴趣潜在关系建模的空缺,充分利用用户社交关系数据,预测准确率更高,并且高效快捷。
-
公开(公告)号:CN113722608A
公开(公告)日:2021-11-30
申请号:CN202110825699.5
申请日:2021-07-21
Applicant: 中国科学院信息工程研究所
IPC: G06F16/9536 , G06F16/9535
Abstract: 本发明公开了一种迭代副信息指导下基于关联关系学习的协同过滤方法及装置,将用户与物品的异质副信息集成到评分记录矩阵;利用生成的偏好预测矩阵,对每一用户进行物品推荐。本发明通过对用户和物品的不同类型的异质副信息进行重要性区分,利用神经因子分解机挖掘各个类型的异质副信息之间的关联关系,并通过迭代的指导充分发挥用户和物品的异质副信息的作用,从而实现对用户和物品的综合理解,提高用户对物品偏好预测的准确度。
-
公开(公告)号:CN110175248B
公开(公告)日:2021-08-31
申请号:CN201910270855.9
申请日:2019-04-04
Applicant: 中国科学院信息工程研究所
IPC: G06F16/51 , G06F16/55 , G06F16/583 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于深度学习和哈希编码的人脸图像检索方法和装置。该方法针对现有的人脸图像检索中人脸特征表达不充分、特征区分力不够的问题,提出人脸空间网络和人脸空间损失来自动地挖掘人脸图像中有区分力的人脸区域,降低背景信息的影响;同时哈希网络学习人脸特征和哈希码之间的内在关系,将人脸图像映射成哈希码,显著地降低检索的计算和存储代价;哈希网络中多尺度的人脸特征通道增强模块增强了人脸特征中区分力强的维度。本发明提供的交替训练的策略使得两个网络有机的融合在一起,减少了人脸特征提取和哈希码生成之间的信息损失,在增强了人脸特征的区分力的同时,增强了生成的哈希码的区分力,提高人脸检索的准确度。
-
公开(公告)号:CN112347756A
公开(公告)日:2021-02-09
申请号:CN202011051087.7
申请日:2020-09-29
Applicant: 中国科学院信息工程研究所
IPC: G06F40/205 , G06F40/216 , G06N3/04
Abstract: 本发明涉及一种基于序列化证据抽取的推理阅读理解方法及系统。该方法训练基于序列化证据抽取的阅读理解模型,该模型包括编码层、推理交互层、证据预测层、答案预测层;利用训练完成的基于序列化证据抽取的阅读理解模型,输入上下文文本和问题文本,输出答案的类型、答案文本以及相关证据句子的集合。本发明通过GRU与注意力机制根据问题句子来序列化抽取证据文档中的句子作为证据句子的预测结果,将证据句子之间的相关关系考虑进去,逐步推理得到相关证据,同时覆盖问题中的重要信息。本发明从原来的独立预测每个证据句子变为序列化抽取证据句子,从而建模证据之间的相关性认证,从而提高了网络的安全可靠性。
-
公开(公告)号:CN112163493A
公开(公告)日:2021-01-01
申请号:CN202010995945.7
申请日:2020-09-21
Applicant: 中国科学院信息工程研究所
Abstract: 本发明提供一种视频虚假人脸检测方法及电子装置,包括:对待检测视频进行人脸定位,得到人脸序列;对人脸序列进行预处理,得到指定大小和长度的视频采样帧序列;将视频采样帧序列输入训练好的三维残差学习卷积神经网络,判断待检测视频中的人脸是否为虚假人脸;其中,所述三维残差学习卷积神经网络包括一或多个卷积层及相应最大池化层、若干由一或多个三维残差学习模块组成的三维残差学习层、一平均池化层及一输出层;所述三维残差学习模块包括分别连接三维残差学习模块输入的第一支路、第二支路和对两条第一支路与第二支路输出结果相加的运算层。本发明对视频特征进行残差学习,以解决网络过深时可能导致的模型退化问题,提升模型性能。
-
公开(公告)号:CN112163488A
公开(公告)日:2021-01-01
申请号:CN202010994947.4
申请日:2020-09-21
Applicant: 中国科学院信息工程研究所
Abstract: 本发明提供一种视频虚假人脸检测方法及电子装置,包括:对待检测视频进行人脸定位,得到人脸序列;对人脸序列进行预处理,得到指定大小和长度的视频采样帧序列;将视频采样帧序列输入训练好的三维压缩卷积神经网络,判断待检测视频中的人脸是否为虚假人脸;其中,通过在三维卷积神经网络中的每一最大池化层前,分别增加一层卷积核大小为1*1*1且通道数为n的三维卷积层,得到三维压缩卷积神经网络,n为自定义参数。本发明创新性地提出三维模型压缩模块,通过在池化层前引入1*1*1大小卷积核的卷积层,降低了模型的负责度与体积,使之更适于实际使用与部署。
-
公开(公告)号:CN111753657A
公开(公告)日:2020-10-09
申请号:CN202010428815.5
申请日:2020-05-20
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于自训练的文本检测器训练方法及系统。本方法步骤包括:1)获取来源于目标域的视频数据;使用源域的数据对检测器和跟踪器进行预训练;2)利用步骤1)训练后的检测器处理来源于目标域的视频数据,获得该视频数据每一帧的检测结果;步骤1)训练后的跟踪器根据前一帧的检测结果预测当前帧的跟踪结果;3)文本挖掘模块将每一帧的检测结果与跟踪结果进行融合生成运动轨迹,然后根据该运动轨迹中的边界包围盒来预测轨迹结果,以及从该运动轨迹中挖掘得到难正样本和难负样本,其中当且仅当该视频数据中的一帧图像A中存在难正样本或难负样本,则将图像A添加到伪数据集中;4)利用步骤3)得到的伪数据集训练检测器。
-
公开(公告)号:CN107317865B
公开(公告)日:2019-11-05
申请号:CN201710521896.1
申请日:2017-06-30
Applicant: 中国科学院信息工程研究所
IPC: H04L29/08
Abstract: 本发明公开了一种通用的离线数据接入方法及系统,基于离线数据接入通用处理模板,来适配多种业务数据接入。具有如下优点:1)数据接入与业务耦合度低,数据接入系统更为通用,音视频数据、图片数据、博客数据、即时通信数据等数据源,都可以采用该方法及系统;2)多节点分布式采集数据,在保证数据正确传输的前提下,提供传输的并行度和传输效率,并实现了负载均衡;3)提供完善的异常处理和报错机制;4)实时监控系统运行状态,系统更为稳定。
-
-
-
-
-
-
-
-
-