-
公开(公告)号:CN116434210A
公开(公告)日:2023-07-14
申请号:CN202111666783.3
申请日:2021-12-31
Applicant: 中国科学院信息工程研究所
IPC: G06V20/62 , G06V10/774 , G06V10/764 , G06V10/766 , G06V10/82
Abstract: 本发明提供一种文本检测方法、装置、电子设备及存储介质,文本检测方法,包括:将目标图像输入文本检测模型提取所述目标图像的特征图,并对所述特征图进行初始文本锚框标记以及回归量预测,得到所述目标图像的文本检测结果;其中,所述文本检测模型是基于训练样本、训练样本标签和回归损失函数对训练前的文本检测模型进行训练得到,在所述训练过程中所述回归损失函数中的各个回归变量的权重是根据所述文本检测模型的预测结果适配的,提升了极端长宽比文本回归的效果和文本检测结果的准确性。
-
公开(公告)号:CN110443068A
公开(公告)日:2019-11-12
申请号:CN201910709096.1
申请日:2019-08-01
Applicant: 中国科学院信息工程研究所
Abstract: 本发明实施例提供一种隐私保护方法和装置。其中,隐私保护方法包括:将与用户敏感信息相关的原始数据表,根据原始数据表之间关联的键值进行合并,获取合并表;根据合并表中敏感属性的键值名,对合并表中的数据记录进行分组,并根据分组结果对合并表进行分解,获取多张发布数据表。本发明实施例提供的隐私保护方法和装置,通过将同一数据库中多个包含用户关联信息的数据表作为一个整体进行分析,获得合并表,并利用数据库的相关理论和多维敏感属性隐私保护方法对合并表进行分解,获取多张发布数据表,能实现对多表多隐私属性的隐私保护,能有效地提升隐私保护效果、提升数据处理效率同时提高数据的可用性。
-
公开(公告)号:CN112487795A
公开(公告)日:2021-03-12
申请号:CN202011171055.0
申请日:2020-10-28
Applicant: 中国科学院信息工程研究所
IPC: G06F40/284 , G06F40/30 , G06N3/04
Abstract: 本发明实施例提供上下文讽刺检测方法、装置、电子设备及存储介质,该方法包括:对用户评论文本进行分析得到用户评论特征;将所述用户评论特征输入预设讽刺检测模型,得到讽刺检测结果;其中,所述预设讽刺检测模型是通过对带讽刺标签的用户评论样本特征和无标签的用户评论样本特征训练得到的。针对讽刺检测的特点设计了内容特征和上下文特征的用户评论特征,然后针对讽刺检测的实际业务场景特点选取了一种半监督学习方法,采用多次抽取与带讽刺标签的用户评论样本特征相等数量的无标记数据构建决策树,集成多棵决策树预测输入文本,节省了大量的数据标注工作,从而更符合真实应用场景,最终更好的实现上下文讽刺检测。
-
公开(公告)号:CN115964709A
公开(公告)日:2023-04-14
申请号:CN202211659562.8
申请日:2022-12-22
Applicant: 中国科学院信息工程研究所
IPC: G06F21/56 , G06F18/214 , G06F18/241 , G06N3/08 , G06N3/0442
Abstract: 本发明提供一种恶意文档检测方法、电子设备及可读存储介质,其中,恶意文档检测方法包括:将待检测文档进行内存转储分析,得到待检测文档的内存差异特征;将所述待检测文档的内存差异特征输入到预设的恶意文档检测模型中,得到检测结果信息;其中,所述预设的恶意文档检测模型通过恶意文档的内存差异特征和正常文档的内存差异特征训练得到。本发明的目的时解决现有的恶意文档检测方法的缺陷,导致对恶意文档进行检测的准确率不高的问题。
-
公开(公告)号:CN110443068B
公开(公告)日:2022-03-22
申请号:CN201910709096.1
申请日:2019-08-01
Applicant: 中国科学院信息工程研究所
Abstract: 本发明实施例提供一种隐私保护方法和装置。其中,隐私保护方法包括:将与用户敏感信息相关的原始数据表,根据原始数据表之间关联的键值进行合并,获取合并表;根据合并表中敏感属性的键值名,对合并表中的数据记录进行分组,并根据分组结果对合并表进行分解,获取多张发布数据表。本发明实施例提供的隐私保护方法和装置,通过将同一数据库中多个包含用户关联信息的数据表作为一个整体进行分析,获得合并表,并利用数据库的相关理论和多维敏感属性隐私保护方法对合并表进行分解,获取多张发布数据表,能实现对多表多隐私属性的隐私保护,能有效地提升隐私保护效果、提升数据处理效率同时提高数据的可用性。
-
公开(公告)号:CN116432042A
公开(公告)日:2023-07-14
申请号:CN202111659455.0
申请日:2021-12-30
Applicant: 中国科学院信息工程研究所
IPC: G06F18/22 , G06F18/241 , G06N3/0464 , G06N3/0442 , G06N3/042 , G06N3/045 , G06F21/10 , G06F21/56 , G06F21/57
Abstract: 本发明提供一种二进制函数相似性检测方法及装置,包括:分别对待检测的两个二进制函数进行预处理,得到各个二进制函数的中间语言序列和控制流程图;基于第一预设神经网络模型,分别对各个二进制函数的中间语言序列进行语义特征提取,得到各个二进制函数的语义特征向量表示,并基于第二预设神经网络模型,分别对各个二进制函数的控制流程图进行结构特征提取,得到各个二进制函数的结构特征向量表示;将每个二进制函数的语义特征向量表示和结构特征向量表示输入到预设多层感知机分类器,得到两个二进制函数的相似性检测结果。本发明的方法有效地解决了语法和结构特征易受干扰等现有技术缺陷,提高了二进制函数相似性检测的精度和鲁棒性。
-
-
-
-
-