一种文本识别脱敏方法及其系统
    11.
    发明公开

    公开(公告)号:CN114298035A

    公开(公告)日:2022-04-08

    申请号:CN202111640408.1

    申请日:2021-12-29

    Abstract: 本发明公开了一种文本识别脱敏方法及其系统,该方法包括:获取待识别文本,将待识别文本拆分为多个句子,再将句子分词为多个字词;将待识别文本的每个字词转换为对应的向量;将向量输入至Bert模型,Bert模型将向量转换为词表示向量,并对词表示向量进行分类标注;将标注后的词表示向量输入条件随机场,条件随机场基于标注之间的关联依赖关系进行计算,得到全局最优标注序列;对标注为敏感实体的字词进行脱敏操作。本发明能够做到并发执行,同时提取字词在句子中的关系特征,进而更全面反映句子语义,又能根据句子上下文获取词义,从而避免歧义出现,此外,能够针对不同类别的敏感实体进行不同的脱敏操作。

    一种云环境下数据隐私保护与安全搜索的方法

    公开(公告)号:CN114297714A

    公开(公告)日:2022-04-08

    申请号:CN202111654194.3

    申请日:2021-12-30

    Abstract: 本发明涉及数据安全技术领域,尤其是指一种云环境下数据隐私保护与安全搜索的方法,本发明在存在数据时对原始数据进行了多轮加细匿名算法处理,并将处理的数据通过云服务提供商进行二次加密储存,可防止原始数据的泄密,并且本发明采用授权用户访问制度,可防止数据的被盗,提供了数据的安全性,对原源数据属性进行的关联、聚合等操作,可能会产生潜在的融合隐私泄露风险,传统的数据隐私保护方案多是针对单源、静态数据提出的,无法抵御多源动态融合数据发布及搜索过程中面临的推理攻击,因此采用本发明数据储存与访问更加安全可靠。

    一种基于云端服务器的数据安全保护方法

    公开(公告)号:CN114297711A

    公开(公告)日:2022-04-08

    申请号:CN202111635134.7

    申请日:2021-12-27

    Abstract: 本发明涉及数据储存技术领域,尤其是指一种基于云端服务器的数据安全保护方法,包括以下步骤:步骤一、以DaaS承载平台作为混合云,混合云包括私有云和公有云,私有云通过分割策略将原数据划分为若干个数据块;步骤二、然后将数据块进行匿名分割化处理;步骤三、私有云将匿名分割化处理之后的数据块发送至公有云;步骤四、公有云将接受的数据按照数据块的个数和大小进行储存,并向私人用户进行授权查询权限;本发明在进行数据储存时对数据进行了匿名分割化处理,之后再将数据进行储存,保证了数据的安全性和可靠性,还有本发明能够减少信息损失,提高算法的执行效率,从而提高数据的隐私保护的可行性和实用性。

    一种基于安全网关的密文搜索方法、装置及其系统

    公开(公告)号:CN114417109A

    公开(公告)日:2022-04-29

    申请号:CN202111642128.4

    申请日:2021-12-29

    Abstract: 本发明公开了一种基于安全网关的密文搜索方法、装置及其系统,该方法包括:接收用户端的上传请求;对应用数据进行加密,由第一应用服务器存储加密密文,并返回加密密文标识符;提取应用数据的关键词,并构建对应的索引并进行加密,由第二应用服务器存储索引密文,并返回索引密文标识符;将索引与索引密文标识符以及加密密文标识符进行关联;接收用户端的查询请求,将搜索关键词变换为对应的索引密文,并向第二应用服务器发起查询请求;根据第二应用服务器返回对应的索引密文标识符,得到加密密文标识符;使用加密密文标识符向第一应用服务器发起请求,得到对应的加密密文,并将加密密文返回用户端。本发明解决了密文的可搜索性和安全性问题。

    一种基于安全网关的密文搜索方法、装置及其系统

    公开(公告)号:CN114417109B

    公开(公告)日:2024-05-17

    申请号:CN202111642128.4

    申请日:2021-12-29

    Abstract: 本发明公开了一种基于安全网关的密文搜索方法、装置及其系统,该方法包括:接收用户端的上传请求;对应用数据进行加密,由第一应用服务器存储加密密文,并返回加密密文标识符;提取应用数据的关键词,并构建对应的索引并进行加密,由第二应用服务器存储索引密文,并返回索引密文标识符;将索引与索引密文标识符以及加密密文标识符进行关联;接收用户端的查询请求,将搜索关键词变换为对应的索引密文,并向第二应用服务器发起查询请求;根据第二应用服务器返回对应的索引密文标识符,得到加密密文标识符;使用加密密文标识符向第一应用服务器发起请求,得到对应的加密密文,并将加密密文返回用户端。本发明解决了密文的可搜索性和安全性问题。

    一种基于预训练模型的网络安全命名实体识别数据增广方法

    公开(公告)号:CN119204011B

    公开(公告)日:2025-05-23

    申请号:CN202411190945.4

    申请日:2024-08-28

    Abstract: 本发明公开了一种基于预训练模型的网络安全命名实体识别数据增广方法,属于网络数据安全技术领域。解决了现有技术中传统的网络安全命名实体识别数据增广方法易导致识别文本语义错误的问题;本发明给定标注集合和输入序列,根据标注规则生成标注序列,对输入序列进行分句处理;对输入序列的文本片段的长度进行替换,得到片段集合;根据标注集合,对片段集合进行掩码操作,得到新片段集合,利用BERT模型对新片段集合进行预测,得到增广后的数据集;使用BERT模型计算得到连续概率并搜索相邻句子概率矩阵打乱句子顺序,得到最终增广后的数据集。本发明有效提升了所生成增广数据的质量,减少了过拟合现象,可以应用于数据增广。

Patent Agency Ranking