一种对结构化数据进行安全标识实时动态处理的方法

    公开(公告)号:CN118551412A

    公开(公告)日:2024-08-27

    申请号:CN202410759716.3

    申请日:2024-06-13

    摘要: 本发明提供一种对结构化数据进行安全标识实时动态处理的方法,涉及数据处理技术领域,所述方法包括:数据连接安全组件调用敏感数据识别引擎,对获取的各项数据内容进行扫描,敏感数据识别引擎对数据内容进行自然语义提取,并与策略管理服务提供的密点进行语义相似度比对,对于相似度达到指定阈值的,返回相应密点的安全级别及相关安全属性,完成数据的密级自动判定;数据库连接安全组件调用敏感数据处理组件,根据密级判定的结果,按抽象语法标记对密级及其相关安全属性进行编码生成数据安全标识;敏感数据处理组件将生成的数据安全标识与相应数据项进行绑定。本发明能提升数据安全性、实现敏感数据的自动识别与保护、精细化的数据安全管理。

    一种基于预训练语言模型的文本分类方法及装置

    公开(公告)号:CN118113873B

    公开(公告)日:2024-08-06

    申请号:CN202410297295.7

    申请日:2024-03-15

    摘要: 本发明提供一种基于预训练语言模型的文本分类方法及装置,涉及内容理解技术领域,所述方法包括:获取文本分类类别和待分类文本,并使用预训练语言模型进行预测,以得到每个分类的关键词;对待分类文本进行分词,并使用预训练语言模型进行预测,以得到分类指示性词;使用分类指示性词训练分类模型,以得到训练后分类模型;使用训练后分类模型进行文本分类,以得到分类结果。本发明提供一种基于预训练语言模型的文本分类方法及装置,解决数据治理过程中,用户在对文本进行分类时无法提供所有文档类别,同时也无法提供每个类别的足够样本用于机器训练的问题。

    一种基于预训练语言模型的文本分类方法及装置

    公开(公告)号:CN118113873A

    公开(公告)日:2024-05-31

    申请号:CN202410297295.7

    申请日:2024-03-15

    摘要: 本发明提供一种基于预训练语言模型的文本分类方法及装置,涉及内容理解技术领域,所述方法包括:获取文本分类类别和待分类文本,并使用预训练语言模型进行预测,以得到每个分类的关键词;对待分类文本进行分词,并使用预训练语言模型进行预测,以得到分类指示性词;使用分类指示性词训练分类模型,以得到训练后分类模型;使用训练后分类模型进行文本分类,以得到分类结果。本发明提供一种基于预训练语言模型的文本分类方法及装置,解决数据治理过程中,用户在对文本进行分类时无法提供所有文档类别,同时也无法提供每个类别的足够样本用于机器训练的问题。

    基于空间知识地图的煤矿安全知识图谱构建方法及装置

    公开(公告)号:CN115858801A

    公开(公告)日:2023-03-28

    申请号:CN202211121888.5

    申请日:2022-09-15

    摘要: 本发明公开了一种基于空间知识地图的煤矿安全知识图谱构建方法及装置,其中,该方法包括:获取煤矿安全大数据集;基于所述煤矿安全大数据集,获取任务目标向量、需求特征向量和客观时空知识表;基于所述任务目标向量、所述需求特征向量和所述客观时空知识表,构建基于空间知识地图的煤矿安全知识图谱。本发明公开的基于空间知识地图的煤矿安全知识图谱构建方法及装置,在总结煤矿安全地图知识分析概念的基础上,构建基于空间知识地图的煤矿安全知识图谱,能够提高煤矿安全管理过程中信息处理加工能力和信息认知效率,能将多源异构信息和知识,智能集成为不确定性更少、更精确、可理解性更好的知识本体/图谱,能够在感知层更好的理解感知态势。