-
公开(公告)号:CN119377792A
公开(公告)日:2025-01-28
申请号:CN202411960028.X
申请日:2024-12-30
Applicant: 中电科大数据研究院有限公司 , 太极计算机股份有限公司
IPC: G06F18/2413 , G06F18/213 , G06F18/243
Abstract: 本申请公开了一种数据分级方法、系统及相关装置,用于对数据进行快速且准确的分级。本申请方法包括:获取数据来源信息,基于所述数据来源信息得到数据清单;根据所述数据清单,通过预设分类模型提取目标数据;获取定性要素和定量要素,基于所述定性要素和所述分类模型对所述目标数据进行分级得到初始级别;判断已得到所述初始级别后的所述目标数据是否包含敏感信息;若是,则设定要素权重,基于所述定量要素和所述要素权重对目标数据得到所述目标数据的二次定级,在得到所述目标数据的所述二次定级后,结合所述初始级别对所述二次定级进行调整,最终得到目标数据的目标级别;若否,则将所述目标数据的所述初始级别确定为所述目标级别。
-
公开(公告)号:CN116150405A
公开(公告)日:2023-05-23
申请号:CN202310416643.3
申请日:2023-04-19
Applicant: 中电科大数据研究院有限公司 , 太极计算机股份有限公司
Abstract: 本发明提供一种多场景的异构数据处理方法,包括:从不同场景下的第一知识图谱和第二知识图谱中各个文本实体的邻居子图中提取图结构信息,获取文本实体的结构拓扑特征;从第一知识图谱和第二知识图谱的各三元组中获取连接各个文本实体的实体关系的关系特征;融合第一知识图谱和第二知识图谱中各个文本实体的结构拓扑特征和连接对应文本实体的实体关系的关系特征,得到各个文本实体的第一实体表示;基于第一知识图谱中任一文本实体的第一实体表示与第二知识图谱中任一文本实体的第一实体表示之间的相似度,构建第一实体对齐概率矩阵;基于第一实体对齐概率矩阵,确定第一知识图谱和第二知识图谱的对齐实体对。本发明提升了异构数据融合的准确性。
-
公开(公告)号:CN119227120B
公开(公告)日:2025-04-04
申请号:CN202411779051.9
申请日:2024-12-05
Applicant: 中电科大数据研究院有限公司 , 太极计算机股份有限公司
IPC: G06F21/60 , G06F16/22 , G06F16/245 , G06F16/28
Abstract: 本申请公开了一种基于可信空间的可信数据交换方法、装置及存储介质。本申请方法包括:数据提供方将数据上传至可信数据空间;数据供给平台生成合约,合约包含签约时间戳、数据标识符、数据提供方标识符、数据使用方标识符、使用权限、使用期限、数据修改限制和控制策略;对合约信息进行哈希加密,并将合约信息存储于目标区块链中;将摩斯码中的“点”、“横”及“间隔”分别映射为零宽度非连接符、零宽度连接符及零宽度空格符,将加密后的合约标识符转换为摩斯码格式;在上传的数据信息的随机位置嵌入零宽度非连接符、零宽度连接符及零宽度空格符,加密秘钥基于预设的加密算法生成;使用加密密钥对上传的数据信息进行加密。
-
公开(公告)号:CN119377410B
公开(公告)日:2025-04-11
申请号:CN202411960482.5
申请日:2024-12-30
Applicant: 中电科大数据研究院有限公司 , 太极计算机股份有限公司
IPC: G06F16/35 , G06F16/36 , G06F18/2415
Abstract: 本申请公开了一种数据分类方法、系统及相关装置,用于对数据进行快速且准确的分类。本申请方法包括:获取数据来源信息,对数据来源信息进行数据提取,得到目标数据;获取全量主题词库和部门主题词库;基于全量主题词库判断目标数据是否存在主题;若是,则从全量主题词库中提取主题;若否,则通过预设学习模型对目标数据进行分类,得到数据分类结果;当目标数据存在主题时,判断主题是否唯一;若是,则将主题作为数据分类结果;若否,则基于部门主题词库确定目标数据的部门主题;当主题不唯一时,判断主题与部门主题是否重叠;若是,则将主题或部门主题作为数据分类结果;若否,则通过预设学习模型对主题与部门主题进行分类,得到数据分类结果。
-
公开(公告)号:CN119377410A
公开(公告)日:2025-01-28
申请号:CN202411960482.5
申请日:2024-12-30
Applicant: 中电科大数据研究院有限公司 , 太极计算机股份有限公司
IPC: G06F16/35 , G06F16/36 , G06F18/2415
Abstract: 本申请公开了一种数据分类方法、系统及相关装置,用于对数据进行快速且准确的分类。本申请方法包括:获取数据来源信息,对数据来源信息进行数据提取,得到目标数据;获取全量主题词库和部门主题词库;基于全量主题词库判断目标数据是否存在主题;若是,则从全量主题词库中提取主题;若否,则通过预设学习模型对目标数据进行分类,得到数据分类结果;当目标数据存在主题时,判断主题是否唯一;若是,则将主题作为数据分类结果;若否,则基于部门主题词库确定目标数据的部门主题;当主题不唯一时,判断主题与部门主题是否重叠;若是,则将主题或部门主题作为数据分类结果;若否,则通过预设学习模型对主题与部门主题进行分类,得到数据分类结果。
-
公开(公告)号:CN119377409A
公开(公告)日:2025-01-28
申请号:CN202411943469.9
申请日:2024-12-27
Applicant: 中电科大数据研究院有限公司 , 太极计算机股份有限公司
IPC: G06F16/35 , G06F16/36 , G06F40/242 , G06N3/08
Abstract: 本申请公开了一种基于关键词与深度学习的信息识别方法、系统及装置。本申请方法包括:获取个人数据集和公开数据集;基于个人数据集和公开数据集构建专用词典库;基于公开数据集提取关键字、特定符号以及主题;判断个人数据集与关键字或特定符号是否匹配;若否,则利用主题和专用词典库确定匹配词典;当确定匹配字典后,判断匹配词典与个人数据集是否匹配;若否,则基于个人数据集,通过语言表示模型训练得到嵌入向量;当得到嵌入向量后,将嵌入向量输入至序列神经网络模型中进行建模,得到隐状态序列;将隐状态序列的维度映射至目标维度中,并将已映射至目标维度后的隐状态序列输入至条件随机场算法中,得到个人信息识别结果。
-
公开(公告)号:CN119227120A
公开(公告)日:2024-12-31
申请号:CN202411779051.9
申请日:2024-12-05
Applicant: 中电科大数据研究院有限公司 , 太极计算机股份有限公司
IPC: G06F21/60 , G06F16/22 , G06F16/245 , G06F16/28
Abstract: 本申请公开了一种基于可信空间的可信数据交换方法、装置及存储介质。本申请方法包括:数据提供方将数据上传至可信数据空间;数据供给平台生成合约,合约包含签约时间戳、数据标识符、数据提供方标识符、数据使用方标识符、使用权限、使用期限、数据修改限制和控制策略;对合约信息进行哈希加密,并将合约信息存储于目标区块链中;将摩斯码中的“点”、“横”及“间隔”分别映射为零宽度非连接符、零宽度连接符及零宽度空格符,将加密后的合约标识符转换为摩斯码格式;在上传的数据信息的随机位置嵌入零宽度非连接符、零宽度连接符及零宽度空格符,加密秘钥基于预设的加密算法生成;使用加密密钥对上传的数据信息进行加密。
-
公开(公告)号:CN116150405B
公开(公告)日:2023-06-27
申请号:CN202310416643.3
申请日:2023-04-19
Applicant: 中电科大数据研究院有限公司 , 太极计算机股份有限公司
Abstract: 本发明提供一种多场景的异构数据处理方法,包括:从不同场景下的第一知识图谱和第二知识图谱中各个文本实体的邻居子图中提取图结构信息,获取文本实体的结构拓扑特征;从第一知识图谱和第二知识图谱的各三元组中获取连接各个文本实体的实体关系的关系特征;融合第一知识图谱和第二知识图谱中各个文本实体的结构拓扑特征和连接对应文本实体的实体关系的关系特征,得到各个文本实体的第一实体表示;基于第一知识图谱中任一文本实体的第一实体表示与第二知识图谱中任一文本实体的第一实体表示之间的相似度,构建第一实体对齐概率矩阵;基于第一实体对齐概率矩阵,确定第一知识图谱和第二知识图谱的对齐实体对。本发明提升了异构数据融合的准确性。
-
公开(公告)号:CN119402191A
公开(公告)日:2025-02-07
申请号:CN202411658625.7
申请日:2024-11-19
Applicant: 太极计算机股份有限公司
Abstract: 本发明涉及数据安全技术领域,重新定义了一种基于区块链的可信数据空间的管理系统及方法,包括:根据区块链智能分析得出初始信用结果在可信数据空间创建初始数据信用模块,再对初始数据信用模块内的需加密数据进行安全分级,根据安全分级对需加密数据执行不同的加密策略进行加密;存储模块,用于根据边缘计算节点的计算能力将加密后的需上链数据存储至区块链;访问模块,用于对用户访问、应用需访问数据及策略的权限进行管理并释放相应访问、应用权限;匹配模块,用于对用户释放匹配加密数据的访问权限。本发明的可信数据空间的架构基于可信计算3.0建立,且初始数据信用模块是基于区块链技术的分布式,保证了加密数据的安全性与可信度。
-
公开(公告)号:CN115186654B
公开(公告)日:2022-11-22
申请号:CN202211091542.5
申请日:2022-09-07
Applicant: 太极计算机股份有限公司
IPC: G06F40/253 , G06F40/211 , G06F40/186 , G06F40/30 , G06K9/62
Abstract: 本申请提供一种公文文本摘要生成方法,所述方法包括:对目标公文文本进行分句处理得到多个分句;根据所述目标公文文本的类型得到各个分句对应的分句权重;将所述目标公文文本的多个分句以及对应的分句权重输入摘要生成模型,得到所述摘要生成模型输出的公文文本摘要;其中,训练所述摘要生成模型使用的损失函数包括目标审批关键词命中函数。本发明提供的公文文本摘要生成方法,考虑到了不同类型的公文文本的结构特征,将目标审批关键词命中函数、审批时长调整函数等适用于公文文本自动审批场景的内容设计到了损失函数中,不但使得所生成的公文文本摘要准确性更高,还能使得公文文本摘要生成的长度自适应地根据审批需求进行调整。
-
-
-
-
-
-
-
-
-