-
公开(公告)号:CN114298035A
公开(公告)日:2022-04-08
申请号:CN202111640408.1
申请日:2021-12-29
Applicant: 电子科技大学广东电子信息工程研究院
IPC: G06F40/289 , G06F40/284 , G06F40/117 , G06F21/62 , G06K9/62
Abstract: 本发明公开了一种文本识别脱敏方法及其系统,该方法包括:获取待识别文本,将待识别文本拆分为多个句子,再将句子分词为多个字词;将待识别文本的每个字词转换为对应的向量;将向量输入至Bert模型,Bert模型将向量转换为词表示向量,并对词表示向量进行分类标注;将标注后的词表示向量输入条件随机场,条件随机场基于标注之间的关联依赖关系进行计算,得到全局最优标注序列;对标注为敏感实体的字词进行脱敏操作。本发明能够做到并发执行,同时提取字词在句子中的关系特征,进而更全面反映句子语义,又能根据句子上下文获取词义,从而避免歧义出现,此外,能够针对不同类别的敏感实体进行不同的脱敏操作。
-
公开(公告)号:CN114297714A
公开(公告)日:2022-04-08
申请号:CN202111654194.3
申请日:2021-12-30
Applicant: 电子科技大学广东电子信息工程研究院
IPC: G06F21/62 , G06F21/60 , G06F16/953
Abstract: 本发明涉及数据安全技术领域,尤其是指一种云环境下数据隐私保护与安全搜索的方法,本发明在存在数据时对原始数据进行了多轮加细匿名算法处理,并将处理的数据通过云服务提供商进行二次加密储存,可防止原始数据的泄密,并且本发明采用授权用户访问制度,可防止数据的被盗,提供了数据的安全性,对原源数据属性进行的关联、聚合等操作,可能会产生潜在的融合隐私泄露风险,传统的数据隐私保护方案多是针对单源、静态数据提出的,无法抵御多源动态融合数据发布及搜索过程中面临的推理攻击,因此采用本发明数据储存与访问更加安全可靠。
-
公开(公告)号:CN114297711A
公开(公告)日:2022-04-08
申请号:CN202111635134.7
申请日:2021-12-27
Applicant: 电子科技大学广东电子信息工程研究院
IPC: G06F21/62
Abstract: 本发明涉及数据储存技术领域,尤其是指一种基于云端服务器的数据安全保护方法,包括以下步骤:步骤一、以DaaS承载平台作为混合云,混合云包括私有云和公有云,私有云通过分割策略将原数据划分为若干个数据块;步骤二、然后将数据块进行匿名分割化处理;步骤三、私有云将匿名分割化处理之后的数据块发送至公有云;步骤四、公有云将接受的数据按照数据块的个数和大小进行储存,并向私人用户进行授权查询权限;本发明在进行数据储存时对数据进行了匿名分割化处理,之后再将数据进行储存,保证了数据的安全性和可靠性,还有本发明能够减少信息损失,提高算法的执行效率,从而提高数据的隐私保护的可行性和实用性。
-
公开(公告)号:CN114417376A
公开(公告)日:2022-04-29
申请号:CN202111654091.7
申请日:2021-12-30
Applicant: 电子科技大学广东电子信息工程研究院
IPC: G06F21/60 , G06F21/62 , G06F16/2458 , H04L9/40 , H04L67/10
Abstract: 本发明涉及数据保护技术领域,尤其是指一种混合云环境下数据检索过程中的差异化隐私保护方法,步骤一、数据拥有者对原始数据进行加密处理得到加密数据,并将加密之后的加密数据发送至云端服务器;步骤二、云服务提供商接受加密数据并将接受到的加密数据进行二次加密;步骤三、云服务提供商接受所有用户的访问请求;步骤四、云服务提供商对访问的用户进行授权判断,本发明在数据保存时进行了二次加密,当授权用户访问时,云服务提供商可直接进行数据返回,当未授权用户进行访问时,则通过v粒度化准进行搜索域空间和关键字的语义空间,从而使攻击者不能准确地推断出文件内容。
-
公开(公告)号:CN114417109A
公开(公告)日:2022-04-29
申请号:CN202111642128.4
申请日:2021-12-29
Applicant: 电子科技大学广东电子信息工程研究院
IPC: G06F16/953 , G06F21/62 , G06F21/60
Abstract: 本发明公开了一种基于安全网关的密文搜索方法、装置及其系统,该方法包括:接收用户端的上传请求;对应用数据进行加密,由第一应用服务器存储加密密文,并返回加密密文标识符;提取应用数据的关键词,并构建对应的索引并进行加密,由第二应用服务器存储索引密文,并返回索引密文标识符;将索引与索引密文标识符以及加密密文标识符进行关联;接收用户端的查询请求,将搜索关键词变换为对应的索引密文,并向第二应用服务器发起查询请求;根据第二应用服务器返回对应的索引密文标识符,得到加密密文标识符;使用加密密文标识符向第一应用服务器发起请求,得到对应的加密密文,并将加密密文返回用户端。本发明解决了密文的可搜索性和安全性问题。
-
公开(公告)号:CN114297468A
公开(公告)日:2022-04-08
申请号:CN202111650142.9
申请日:2021-12-30
Applicant: 电子科技大学广东电子信息工程研究院
IPC: G06F16/953 , G06F16/957 , G06F16/2458
Abstract: 本发明涉及数据所述技术领域,尤其是指一种云环境下面向数据近似搜索的隐私保护方法,本发明可根据搜索引擎Hermes进行第一步的判断是否为同构搜索,若是则直接输出结果,可有效的缩短数据搜索的时间,若不是,再采用白举法进行查询,由于自举法只需从原始数据集中抽取一个较小的随机均匀样本,因此,自举法能够显著地降低采样过程的磁盘I/O成本;相比于其它的重采样技术自举法对上层的具体操作不敏感能解决对中位数的操作需求。
-
公开(公告)号:CN114285631A
公开(公告)日:2022-04-05
申请号:CN202111584537.3
申请日:2021-12-22
Applicant: 电子科技大学广东电子信息工程研究院
Abstract: 本发明公开了一种基于安全网关的自动化数据加密系统及其应用,自动化数据加密系统包括:协议解析器,接收云服务器的web页面并识别云服务器的通信协议,解析请求内容格式,传至注入模块或数据加解密模块;注入模块,接收到web页面后,将JavaScript包装器的代码注入到web页面的头部;请求转发器,接收各类请求转发至云服务器与浏览器;数据加解密模块,将敏感文件数据对称加密为加密文件,在生成密钥时引入随机数将密钥分解为多个分组;密钥管理模块,管理密钥;JavaScript包装器,在浏览器中执行并重写JavaScriptAPI。本申请保证了用户储存在云服务器的数据的安全。
-
公开(公告)号:CN114417109B
公开(公告)日:2024-05-17
申请号:CN202111642128.4
申请日:2021-12-29
Applicant: 电子科技大学广东电子信息工程研究院
IPC: G06F16/953 , G06F21/62 , G06F21/60
Abstract: 本发明公开了一种基于安全网关的密文搜索方法、装置及其系统,该方法包括:接收用户端的上传请求;对应用数据进行加密,由第一应用服务器存储加密密文,并返回加密密文标识符;提取应用数据的关键词,并构建对应的索引并进行加密,由第二应用服务器存储索引密文,并返回索引密文标识符;将索引与索引密文标识符以及加密密文标识符进行关联;接收用户端的查询请求,将搜索关键词变换为对应的索引密文,并向第二应用服务器发起查询请求;根据第二应用服务器返回对应的索引密文标识符,得到加密密文标识符;使用加密密文标识符向第一应用服务器发起请求,得到对应的加密密文,并将加密密文返回用户端。本发明解决了密文的可搜索性和安全性问题。
-
公开(公告)号:CN114329154A
公开(公告)日:2022-04-12
申请号:CN202111650058.7
申请日:2021-12-30
Applicant: 电子科技大学广东电子信息工程研究院
IPC: G06F16/953 , G06F16/9538 , G06F21/62
Abstract: 本发明涉及搜索方法技术领域,尤其是指本发明提供的一种基于云端服务器储存数据的安全搜索方法,本发明从提高搜索精度、时效、隐私保护粒度及数据可用性等视角研究了大数据近似搜索与隐私保护的新模式与量化评估准则,实现大数据搜索三大维度相协的数据检索方案,解决了由同构搜索、数据版本更新所带来的重搜索问题,提升通用搜索的检索效率,针对通用检索,从多维统一的量化度量指标、搜索模式、架构、算法等,提出一整套解决方案。
-
公开(公告)号:CN119204011B
公开(公告)日:2025-05-23
申请号:CN202411190945.4
申请日:2024-08-28
Applicant: 哈尔滨工业大学
IPC: G06F40/295 , G06F40/16 , G06F16/35 , G06N3/0455 , G06N3/045 , G06N3/08
Abstract: 本发明公开了一种基于预训练模型的网络安全命名实体识别数据增广方法,属于网络数据安全技术领域。解决了现有技术中传统的网络安全命名实体识别数据增广方法易导致识别文本语义错误的问题;本发明给定标注集合和输入序列,根据标注规则生成标注序列,对输入序列进行分句处理;对输入序列的文本片段的长度进行替换,得到片段集合;根据标注集合,对片段集合进行掩码操作,得到新片段集合,利用BERT模型对新片段集合进行预测,得到增广后的数据集;使用BERT模型计算得到连续概率并搜索相邻句子概率矩阵打乱句子顺序,得到最终增广后的数据集。本发明有效提升了所生成增广数据的质量,减少了过拟合现象,可以应用于数据增广。
-
-
-
-
-
-
-
-
-