工业互联网数据处理系统及方法

    公开(公告)号:CN112671922B

    公开(公告)日:2022-05-27

    申请号:CN202011600683.6

    申请日:2020-12-29

    Abstract: 本发明实施例提供一种工业互联网数据处理系统及方法,其中系统包括:数据采集探针组件,用于获取包括工业互联网对应的网络流量数据和日志数据的数据集合并缓存,根据获取的网络负载状态和/或本地数据存储状态,将数据集合发送;数据存储装置,用于接收数据采集探针组件发送的数据集合并存储,基于预设数据标准对已存储的数据集合中的数据进行整合生成标准化数据源;数据传输总线,用于在接收到上层应用发送的数据请求的情况下,基于库直连同步、数据文件同步或者接口服务同步,在标准化数据源中获取数据请求对应的目标数据并传输至上层应用。本发明可以降低数据采集成本,降低网络负载,提高数据整合效率,为上层应用提供标准的数据服务。

    一种文件数据追溯方法、装置、设备及存储介质

    公开(公告)号:CN113449341A

    公开(公告)日:2021-09-28

    申请号:CN202110791648.5

    申请日:2021-07-13

    Abstract: 本申请提供了一种文件数据追溯方法、装置、设备及存储介质,涉及数据安全技术领域。能够快速准确查询到被泄漏到互联网中的文件数据。方法包括:对目标文件和与目标文件关联的候选文件按照同一尺度,分别进行文件划分,得到目标文件和候选文件各自的多层级划分结果;每层级划分结果包括对应每层级的多个文件块;每层级的多个文件块构成完整的文件,下一层级的文件划分在上一层级的划分结果上进行;从目标文件中获取属于目标层级的待比对文件块,以及从候选文件中获取属于目标层级的多个参照文件块;在待比对文件块与多个参照文件块中任意参照文件块相似度大于第一预设阈值时,确定候选文件为与目标文件关联的泄漏文件。

    一种数据分类分级模型的训练方法、装置及电子设备

    公开(公告)号:CN112966100A

    公开(公告)日:2021-06-15

    申请号:CN202011631556.2

    申请日:2020-12-30

    Abstract: 本发明提供了一种数据分类分级模型的训练方法、装置、及电子设备。所述方法包括:从预设语料库中挑选m份语料作为训练样本;根据预设的数据分类分级标准对m份语料进行预处理,将每份语料转换为对应的数据模型,并确定m份语料各自对应的数据类别和数据级别;对每份语料对应的数据模型进行编码,得到每份语料对应的特征矩阵;将m份语料对应的特征矩阵输入到预先建立的数据分类分级模型中,得到m份语料各自对应的预测类别和预测级别;确定数据分类分级模型对应的混淆矩阵;重复执行上述步骤,直至所述混淆矩阵满足预设条件,得到训练完成的分类分级模型。本发明能够根据预设的数据分类分级标准进行模型训练,提高了数据分类分级模型的准确度。

    借贷人借贷信息查询方法和系统

    公开(公告)号:CN112910635A

    公开(公告)日:2021-06-04

    申请号:CN202011569049.0

    申请日:2020-12-25

    Abstract: 本发明提供了一种借贷人借贷信息查询方法及系统,借贷人借贷信息查询方法包括:数据管理设备生成第一密钥和第一生成元;依据第一生成元和第一密钥生成第一数据,并将第一数据发送至数据查询设备;数据查询设备生成第二密钥和第二生成元,并确定待查询目标数据在数据列表中的位置序号并将第二生成元发送至数据管理设备;数据查询设备对第二密钥进行处理并将处理后的第二密钥发送至数据管理设备;数据管理设备基于预设的轮函数、处理后的第二密钥以及第二生成元,对数据列表中各借贷人的借贷信息进行加密后,发送至数据查询设备;数据查询设备依据第二密钥、第二生成元解密位置序号对应的借贷人的借贷信息,可有效避免数据查询设备用户的业务流失。

    一种数据探查系统、方法、设备及存储介质

    公开(公告)号:CN107480553B

    公开(公告)日:2020-11-06

    申请号:CN201710630781.6

    申请日:2017-07-28

    Abstract: 本发明实施例提供了一种数据探查系统、方法、电子设备方法及存储介质,涉及数据安全技术领域,该系统包括:探查模块、支撑引擎模块和探查管理模块;其中,探查模块,用于设置配置信息,并将配置信息发送给探查管理模块,配置信息包括依据业务需求确定的配置参数;探查管理模块,用于依据配置信息封装探查策略信息,并将探查策略信息发送给支撑引擎模块;支撑引擎模块,用于根据探查策略信息,对目标数据进行敏感数据探查,目标数据为依据配置参数确定的数据。本发明实施例的数据探查系统以独立的、专用的数据探查系统形式部署在数据网络中,能够为不同的数据安全管控系统中的各种敏感数据治理手段提供支撑,进而能够实现协同防御。

    训练实体识别和关系分类模型的方法、装置、设备及介质

    公开(公告)号:CN111159407A

    公开(公告)日:2020-05-15

    申请号:CN201911400682.4

    申请日:2019-12-30

    Abstract: 本申请提供了一种训练命名实体识别和关系分类模型的方法、装置、电子设备及存储介质,该方法包括:获得多个样本语料,每个样本语料携带命名实体标签和关系标签;将多个样本语料输入单词嵌入层,得到关系矩阵;将每个样本语料携带的命名实体标签的词向量输入LSTM编码层,得到每个样本语料携带的命名实体标签的上下文编码向量;将得到的上下文编码向量输入命名实体识别模块,对命名实体识别模块进行多次训练;将得到的上下文编码向量和词向量输入关系分类模块,对关系分类模块进行多次训练。通过训练得到的模型,可一次性提取命名实体和实体关系,有效整合命名实体和实体关系的信息,可实现命名实体之间的多关系重叠抽取,解决多对多关系抽取问题。

    跨领域语言模型训练方法、装置、电子设备及存储介质

    公开(公告)号:CN111143518A

    公开(公告)日:2020-05-12

    申请号:CN201911400691.3

    申请日:2019-12-30

    Abstract: 本申请提供了一种跨领域语言模型训练方法、装置、电子设备及存储介质,所述方法包括:获得多个领域的语料训练集;基于所述多个领域的语料训练集,对多个语言模型进行训练,得到多个语言模型各自的输出,其中,所述多个语言模型与所述多个领域的语料训练集一一对应;根据所述多个语言模型各自的输出,以及所述多个语言模型预设的插值系数,对所述多个语言模型进行插值,得到所述跨领域语言模型。本申请提供了一种跨领域语言模型训练方法,通过基于线性插值的语言模型混合方法,将多个领域的语言模型混合为一个模型,有效解决了语言模型跨领域的脆弱性,提高了语言模型性能指标以及降低了语言模型的困惑度。

    一种数据安全集中管控方法和系统

    公开(公告)号:CN109388949B

    公开(公告)日:2020-05-08

    申请号:CN201710681542.3

    申请日:2017-08-10

    Abstract: 本发明实施例提供了一种数据安全集中管控方法和系统,涉及数据安全技术领域,该方法应用于数据安全集中管控系统,该数据安全集中管控系统接入有至少一个安全管控系统,该方法包括:从数据资产中选取特定的数据作为目标数据并进行感知,得到所述目标数据的数据安全状态,其中,所述目标数据依据数据安全防护需求选取;对所述数据安全状态进行分析评估,生成分析评估结果;依据所述分析评估结果匹配特定策略,并依据所述特定策略触发接入的至少一个安全管控系统对所述目标数据进行安全管控。本发明实施例不仅支持攻击和恶意行为发生时和发生后的防护,还可以在攻击和恶意行为发生前进行预测和告警。

Patent Agency Ranking