-
公开(公告)号:CN117237968A
公开(公告)日:2023-12-15
申请号:CN202311025547.2
申请日:2023-08-15
Applicant: 中国科学院信息工程研究所
IPC: G06V30/412 , G06V30/18 , G06V30/19 , G06V10/82 , G06N3/0455
Abstract: 本发明提出了一种基于Transformer的逐行扫描的表格结构识别方法及系统,涉及表格图像识别领域。本发明设计一个全新的表格结构识别模型,由编码器模块、行解码器模块和单元格解码器模块组成,结合表格本身独有的特性,按照符合表格逻辑的二维形式进行解码;同时通过使用半自回归形式生成表格序列,从而在一定程度上缓解较长的表格序列所带来的严重的误差累计问题。
-
公开(公告)号:CN117220925A
公开(公告)日:2023-12-12
申请号:CN202311084112.5
申请日:2023-08-25
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , G06F16/951 , G06F16/2455 , H04L9/06 , G06F16/248 , G06F16/174 , G06F3/06
Abstract: 本发明公开了一种基于分块存储和压缩编码的可搜索对称加密方法和系统。该方法包括:1)用户初始化参数并生成相关密钥,云服务提供商初始化倒排索引数据库;2)用户对待上传的文档进行分词,生成倒排索引,添加到本地倒排索引缓存中,加密文件并上传到云服务提供商;3)以块为单位编码压缩文档标识符列表,生成密态倒排索引并上传至云服务提供商;4)用户将查询条件转换为查询令牌进行查询;5)云服务提供商返回查询结果;6)用户解密并解压查询结果,得到满足查询条件的文档标识符;7)用户从云服务提供商取回文档标识符对应的密态文件,解密得到文档明文。本发明在大数据场景下实现了一种空间利用率高、检索延迟低的可搜索对称加密技术。
-
公开(公告)号:CN112199214B
公开(公告)日:2023-12-01
申请号:CN202011089941.9
申请日:2020-10-13
Applicant: 中国科学院信息工程研究所
IPC: G06F9/54 , G06F9/50 , G06F18/214 , G06F8/41
Abstract: 本发明公开了一种GPU上的候选口令生成及应用破解方法。口令生成方法包括:1)根据目标需求创建破解任务,设置破解空间大小N1;2)对训练集进行处理,得到上下文无关文法和规则概率;3)根据上下文无关文法计算出可生成的最大候选口令数目N2,确定破解任务生成的总候选口令数目N=MIN(N1,N2);然后根据N以及GPU性能确定每次核函数生成的候选口令数、开启的线程总数以及为运行核函数分配所需要GPU上的内存空间;4)核函数根据上下文无关文法和本次核函数生成候选口令数目,确定本次核函数处理的基础语法规则表中的基础语法结构,并利用GPU来生成符合文法要求的候选口令;5)返回第4步直到生成所有候选口令。
-
公开(公告)号:CN116561308A
公开(公告)日:2023-08-08
申请号:CN202310358885.1
申请日:2023-04-06
Applicant: 中国科学院信息工程研究所
IPC: G06F16/35 , G06F16/36 , G06F18/214 , G06F18/22 , G06F18/25 , G06N3/0499 , G06N3/092
Abstract: 本发明涉及一种基于强化对比学习微调的跨域小样本关系抽取方法和系统。该方法包括:利用预训练语言模型和特定领域知识库,采用训练集和验证集训练得到预训练的特征提取模型;利用测试集中支持集的少量新类样本,通过类别感知层和数据增强层进行增强后,利用对比学习损失函数对预训练的特征提取模型和类别感知层进行微调;将待处理的查询实例通过预训练的特征提取模型提取特征,并通过类别感知层进行增强,计算增强后的查询实例与各个类别原型之间的相似度,选择最相似的类别原型所属的类别作为查询实例的关系类别。本发明能够弥合不同领域之间的语义空间差距,并从新类中学习新的类敏感信息,能够有效提高关系预测的准确度。
-
公开(公告)号:CN116170456A
公开(公告)日:2023-05-26
申请号:CN202111393135.5
申请日:2021-11-23
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于部分域适应的物联网入侵检测方法及装置,包括基于源域中的源域数据xs,获取源域特征提取器FS与入侵检测分类器C;基于具有私有标签的源域数据与具有共享标签的目标数据,获取分类器D;根据源域数据xs相应的源域分类器D输出,得到源域数据xs的权重ωs;基于源域特征提取器FS、权重ωs、源域数据xs、目标数据xt,获取目标域特征提取器Ft;依据目标域特征提取器Ft、分类器D与入侵检测分类器C,构建入侵检测模型;将待测试目标域数据输入入侵检测模型,获取入侵检测结果。本发明能在大量有标记数据样本的情况,不仅取得较好的检测攻击的性能,且能检测到未知的攻击。
-
公开(公告)号:CN116051901A
公开(公告)日:2023-05-02
申请号:CN202310102438.X
申请日:2023-01-31
Applicant: 中国科学院信息工程研究所
IPC: G06V10/764 , G06V10/774 , G06V10/74
Abstract: 本发明公开了一种基于单目标重放的增量目标检测方法及装置,所述方法包括获取旧目标检测器、旧图像训练集中的旧类目标切片图像、新目标检测器、新图像训练集和待检测图像;将旧图像中的旧类目标切片图像和新图像合成,得到合成图像;使用新图像中的新类目标对旧类目标在旧目标检测器中的原始特征进行增广,得到增广特征;基于L1蒸馏损失、交叉熵分类损失、分类损失和回归损失对新目标检测器进行优化训练,以得到训练后的新目标检测器;将所述待检测图像送入训练后的新目标检测器,得到目标检测结果。本发明可以减少旧样本的存储空间,并达到与重放整张图像相当的性能。
-
公开(公告)号:CN115879462A
公开(公告)日:2023-03-31
申请号:CN202211233226.7
申请日:2022-10-10
Applicant: 中国传媒大学 , 中国科学院信息工程研究所
IPC: G06F40/289 , G06F40/284 , G06V30/40 , G06V30/19 , G06N3/044 , G06N3/08
Abstract: 本发明提供一种无需细粒度检测的场景文本提取方法,首先将所获取的文本图像输入至预训练的文本块检测器中以使文本块检测器对文本图像进行检测剪裁形成文本块图像;再通过预训练的文本块识别器基于文本块特征图获取所述文本块图像的语义特征向量和位置特征向量,基于语义特征向量和所述位置特征向量进行特征融合和拼接以获取预测特征,并获取与预测特征相对应的预测文本,通过这种粗粒度检测与多实例识别相结合的框架减轻检测负担,同时利用丰富的上下文信息进行识别,能够通过启发式文本块生成方法依据真实数据集生成的文本块级数据集训练文本块检测器,无需细粒度检测即可实现高精度文本提取。
-
公开(公告)号:CN111091157B
公开(公告)日:2023-03-10
申请号:CN201911348018.X
申请日:2019-12-24
Applicant: 中国科学院信息工程研究所
IPC: G06V10/764 , G06V20/40
Abstract: 本发明提出一种基于完形填空任务的视频自监督学习方法,属于数字化视频自监督领域,通过切分视频段,对选取视频段进行空间或/和时间的变换操作,再放回原视频中提取特征,进行变换操作的分类识别,由此实现自监督学习,通过这种完形填空的方式,在不需要人工标注数据的同时,引导网络学习丰富的视频特征,同时基于完形填空的特性,可以针对不同的特征融合多个自监督任务,增加了泛化性。
-
公开(公告)号:CN113095319B
公开(公告)日:2022-11-15
申请号:CN202110235490.3
申请日:2021-03-03
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于全卷积角点修正网络的多向场景文字检测方法及装置,包括:依据图片的视觉特征,获取融合特征;根据融合特征,分别得到初始特征、初始分数与初始包围框偏移;将初始包围框偏移进行线性变换,得到角点感知卷积的采样网格,并依据该采样网格,对初始特征进行卷积,产生角点感知特征;依据角点感知特征,获取修正分数与修正包围框偏移;根据初始包围框偏移、修正包围框偏移及预定义参考点进行解码运算,获取修正包围框,从而得到多向场景文字检测结果。本发明利用多向场景文本的几何特性进行特征采样,通过角点感知的卷积模块,扩大了有效感受野且没有冗余信息引入,解决了密集长文本和高质量检测的问题,获取更优秀的性能。
-
公开(公告)号:CN112883229B
公开(公告)日:2022-11-15
申请号:CN202110256218.3
申请日:2021-03-09
Applicant: 中国科学院信息工程研究所
IPC: G06F16/75 , G06F16/78 , G06F16/783 , G06V10/774
Abstract: 本发明涉及一种基于多特征图注意网络模型的视频‑文本跨模态检索方法和装置。该方法的步骤包括:建立多特征图注意网络模型,用于挖掘视频不同模态特征之间的结构关系,通过不同视频特征之间的高级语义信息交换获得高效的视频特征表示;采用双重约束排序损失函数训练所述多特征图注意网络模型,所述双重约束排序损失函数包含视频‑文本对之间的排序约束函数和单类数据内部的结构约束函数,不仅可以让语义相似的文本和视频在嵌入空间相近,而且能够在嵌入空间中保持原始的结构特性;利用训练完成的所述多特征图注意网络模型进行视频‑文本的跨模态检索。本发明使视频‑文本检索的检索性能得到了显著提升。
-
-
-
-
-
-
-
-
-