-
公开(公告)号:CN119227684A
公开(公告)日:2024-12-31
申请号:CN202310792590.5
申请日:2023-06-30
Applicant: 中国科学院信息工程研究所
IPC: G06F40/295 , G06F40/284 , G06F16/35 , G06F16/335 , G06N3/0455 , G06N3/082
Abstract: 本发明提出了一种自然语言文本的复杂命名实体的识别方法及系统,涉及自然语言处理技术领域,通过引入含位置信息和类别信息的输入输出模板来指导候选实体生成模块,并采用基于特征增强网络和多层感知机的候选实体筛选模块,从而提升实体识别的准确性和召回率。本发明综合利用模板引导、特征增强和类别信息,有效降低无效输出概率,生成精准全面的候选实体,实现准确高效的实体识别。
-
公开(公告)号:CN114155524B
公开(公告)日:2024-11-08
申请号:CN202111271651.0
申请日:2021-10-29
Applicant: 中国科学院信息工程研究所
IPC: G06V20/64 , G06V20/58 , G06V10/25 , G06V10/762 , G06V10/766 , G06V10/80 , G06V10/774 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种单阶段3D点云目标检测方法及装置、计算机设备、介质。本方法为:根据3D点云中目标与获取3D点云的采样传感器距离不同,设置不同的聚类半径参数对3D点云进行聚类操作,用立体包围框将同类的点云包含起来得到最小立体包围框,并对每一所述最小立体包围框内的点集合进行下采样,得到数据增广后的点云数据;对数据增广后的点云数据进行基于球内最远距离采样,并对采样得到的点进行特征提取,得到语义特征和空间特征;根据空间特征和语义特征预测每个点的预测分数,然后按照预测分数从高到低完成点采样;对采样点的特征进行融合得到融合特征图;回归预测网络根据该融合特征图进行预测,得到点云当中目标的位置和类别。
-
公开(公告)号:CN114428776B
公开(公告)日:2024-10-29
申请号:CN202111477748.7
申请日:2021-12-06
Applicant: 中国科学院信息工程研究所
IPC: G06F16/22 , G06F16/245 , G06F16/2458
Abstract: 本发明涉及一种面向时序数据的索引分区管理方法和系统。该方法包括:将一条时序数据创建索引所需的必要信息封装到一个Document对象中;根据时序数据的时间值,基于Time Detector组件判断时序数据的索引所属的索引分区;根据时序数据所属的索引分区的起止时间,从Time Partition Metadata组件中得到该索引分区的元数据信息以及与该索引分区相关的IndexWriter对象;利用对应索引分区的IndexWriter对象对Document对象中封装的数据进行索引创建操作。本发明将时序数据索引数据在时间维度进行分区管理,能够大幅提升查询效率,适合查询类型复杂且数据量大的时序数据应用场景。
-
公开(公告)号:CN118674036A
公开(公告)日:2024-09-20
申请号:CN202410728857.9
申请日:2024-06-06
Applicant: 中国科学院信息工程研究所
IPC: G06N5/025 , G06F40/16 , G06N3/042 , G06N3/045 , G06N3/0464 , G06N3/082 , G06N3/0895
Abstract: 本发明涉及一种学习细粒度通用知识的跨域小样本关系抽取方法和装置。该方法包括:进行数据预处理,包括将语义提示模板拼接在数据集中每个句子的尾部;构建跨域小样本关系抽取模型,包含特征提取网络、双通道通用知识学习网络、关系对比学习网络和关系分类网络,双通道通用知识学习网络包含隐式通用知识学习网络和显式通用知识学习网络;利用训练集,通过隐式通用知识学习网络的损失函数、关系对比学习损失函数和关系分类损失函数训练跨域小样本关系抽取模型,并利用验证集获得最优模型;利用最优模型抽取目标域的句子中的关系。本发明能够精准地捕捉和利用跨领域的通用知识,减少对源域独有知识的依赖,提高在目标域中的关系抽取性能。
-
公开(公告)号:CN118430078A
公开(公告)日:2024-08-02
申请号:CN202410376819.1
申请日:2024-03-29
Applicant: 中国科学院信息工程研究所
Abstract: 本发明属于人脸隐私保护技术领域,涉及一种基于稳定扩散模型的人脸隐私保护方法和系统。该方法在目标图像嵌入阶段使用文本逆转方法训练能够保存目标图像语义信息的文本嵌入;在对抗样本生成阶段,利用目标图像嵌入阶段得到的文本嵌入对保护图像的去噪过程进行去噪引导,将目标图像的语义信息注入保护图像中,并通过DDIM反转得到原始图像和目标图像在稳定扩散模型隐空间的编码,以在保护图像的去噪过程中提供对抗引导;通过去噪引导和对抗引导生成保护图像,实现人脸隐私保护。本发明能够解决目前人脸隐私保护领域对抗样本不自然、与原图像视觉不一致、对抗扰动易被感知等问题,并能够提高在目标黑盒模型上的迁移性攻击能力。
-
公开(公告)号:CN118349820A
公开(公告)日:2024-07-16
申请号:CN202410529092.6
申请日:2024-04-29
Applicant: 中国科学院信息工程研究所
IPC: G06F18/211 , G06F18/214 , G06F18/2431 , G06F18/22 , G06N3/0455 , G06N3/084 , G06N3/094 , G06F40/30 , G06F16/35 , G06N3/048
Abstract: 本发明涉及一种基于协同自适应特征变换的跨域小样本关系抽取方法和系统。该方法包括:对支持集、查询集中的样本进行编码,得到样本的初步特征;将编码得到的样本的初步特征输入域感知变换模块,所述域感知变换模块利用目标域数据的分布特征对源域数据进行特征变换,得到领域感知特征;利用领域感知特征,通过协同自适应原型网络计算出支持集中各个类别的关系原型特征;计算查询样本与各个类别的关系原型特征之间的距离,选择距离最近的关系原型特征所属的类别作为查询样本的关系类别。本发明能够提高模型在不同领域间的泛化能力,能够显著提升模型对于目标域特征的理解和适应性,从而能够在目标域中获得更好的性能。
-
公开(公告)号:CN118245796A
公开(公告)日:2024-06-25
申请号:CN202410279277.6
申请日:2024-03-12
Applicant: 中国科学院信息工程研究所
IPC: G06F18/214 , G06F18/24 , G06N20/00 , G06F11/34
Abstract: 本发明公开一种面向API异常检测的数据集生成方法及系统,属于API异常检测技术领域。所述方法包括:构建包含正常样本和异常样本的专家数据集,并初始化一合成数据集;在专家数据集和合成数据集中进行样本采样,并基于生成的示例数据集引导大模型学习示例的格式特征后,得到伪造数据样本;生成伪造数据样本的第一质量分数;生成伪造数据样本的第二质量分数;根据第一质量分数和第二质量分数对伪造数据样本进行筛选,并将筛选结果放入到合成数据集中;循环上述步骤,直至得到最终数据集。本发明可以利用已有的小规模API请求专家数据集和大语言模型生成大量高质量的API异常检测数据集。
-
公开(公告)号:CN113806630B
公开(公告)日:2024-06-14
申请号:CN202110896075.2
申请日:2021-08-05
Applicant: 中国科学院信息工程研究所
IPC: G06F16/9535 , G06F16/9536 , G06F18/25
Abstract: 本发明公开了一种基于注意力的多视角特征融合跨域推荐方法及装置,包括利用公共用户在源域的域特性特征#imgabs0#公共用户与物品在目标域的域特性特征#imgabs1#与域特性特征IT、公共用户与物品在源域与目标域之间的潜在可迁移特征#imgabs2#与潜在可迁移特征#imgabs3#进行融合;基于融合结果进行训练;在最优模型的基础上,获取最优偏好预测集,以对公共用户进行目标域中的物品推荐。本发明解决了源域和目标域之间潜在可迁移特征的捕获问题,对不同类型的特征设置不同的权值,实现不同类型特征的有机结合和充分利用,进而提高推荐系统的性能。
-
公开(公告)号:CN112256434B
公开(公告)日:2024-04-05
申请号:CN202011194618.8
申请日:2020-10-30
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种加密数据破解场景中的资源匹配方法,其步骤包括:1)分布式集群资源管理系统对任务调度发出的资源匹配请求进行检查,如果正确则进行步骤2),否则将错误信息返回至任务调度;2)分布式集群资源管理系统根据资源匹配请求中的条件信息,对分布式集群资源管理系统中的资源节点进行过滤筛选,得到可用的资源节点集合;3)从时间成本、能源成本、故障成本、已运行任务数量四个维度,对该资源节点集合中的资源节点属性信息进行量化,分别计算出相应的时间成本值、能源成本值、故障成本值和任务负载值;4)根据上述所得结果计算得到对应资源节点的rank值,对资源节点进行优先级排序,选取优先级最高的资源节点返回至任务调度。
-
公开(公告)号:CN117765520A
公开(公告)日:2024-03-26
申请号:CN202311573331.X
申请日:2023-11-23
Applicant: 中国科学院信息工程研究所
IPC: G06V20/62 , G06V20/70 , G06V10/82 , G06V10/764 , G06V10/766 , G06V10/74 , G06N3/0464 , G06N3/044 , G06N3/0442 , G06N3/0499 , G06N3/0895
Abstract: 本发明公开一种高效准确的歧义场景文字检测方法及系统,属于图像文字识别领域,使用基于Mask R‑CNN结构的文本检测分支检测场景图像中的文本,生成文本候选框;使用歧义感知模块检测场景图像的文本块,将文本块与文本候选框进行匹配及关联,分析文本块中所有文本候选框之间的连接情况,找出有歧义的文本块;构建由图像编码器、文本编码器和跨模态编码器组成的语义感知模块,通过对比学习、匹配预测和掩码预测来训练该语义感知模块;使用训练好的语义感知模块对有歧义的文本块进行场景文字检测。本发明能够高效准确地检测歧义文字,并提高识别的准确率。
-
-
-
-
-
-
-
-
-