-
公开(公告)号:CN116150405A
公开(公告)日:2023-05-23
申请号:CN202310416643.3
申请日:2023-04-19
Applicant: 中电科大数据研究院有限公司 , 太极计算机股份有限公司
Abstract: 本发明提供一种多场景的异构数据处理方法,包括:从不同场景下的第一知识图谱和第二知识图谱中各个文本实体的邻居子图中提取图结构信息,获取文本实体的结构拓扑特征;从第一知识图谱和第二知识图谱的各三元组中获取连接各个文本实体的实体关系的关系特征;融合第一知识图谱和第二知识图谱中各个文本实体的结构拓扑特征和连接对应文本实体的实体关系的关系特征,得到各个文本实体的第一实体表示;基于第一知识图谱中任一文本实体的第一实体表示与第二知识图谱中任一文本实体的第一实体表示之间的相似度,构建第一实体对齐概率矩阵;基于第一实体对齐概率矩阵,确定第一知识图谱和第二知识图谱的对齐实体对。本发明提升了异构数据融合的准确性。
-
公开(公告)号:CN119377410B
公开(公告)日:2025-04-11
申请号:CN202411960482.5
申请日:2024-12-30
Applicant: 中电科大数据研究院有限公司 , 太极计算机股份有限公司
IPC: G06F16/35 , G06F16/36 , G06F18/2415
Abstract: 本申请公开了一种数据分类方法、系统及相关装置,用于对数据进行快速且准确的分类。本申请方法包括:获取数据来源信息,对数据来源信息进行数据提取,得到目标数据;获取全量主题词库和部门主题词库;基于全量主题词库判断目标数据是否存在主题;若是,则从全量主题词库中提取主题;若否,则通过预设学习模型对目标数据进行分类,得到数据分类结果;当目标数据存在主题时,判断主题是否唯一;若是,则将主题作为数据分类结果;若否,则基于部门主题词库确定目标数据的部门主题;当主题不唯一时,判断主题与部门主题是否重叠;若是,则将主题或部门主题作为数据分类结果;若否,则通过预设学习模型对主题与部门主题进行分类,得到数据分类结果。
-
公开(公告)号:CN119377410A
公开(公告)日:2025-01-28
申请号:CN202411960482.5
申请日:2024-12-30
Applicant: 中电科大数据研究院有限公司 , 太极计算机股份有限公司
IPC: G06F16/35 , G06F16/36 , G06F18/2415
Abstract: 本申请公开了一种数据分类方法、系统及相关装置,用于对数据进行快速且准确的分类。本申请方法包括:获取数据来源信息,对数据来源信息进行数据提取,得到目标数据;获取全量主题词库和部门主题词库;基于全量主题词库判断目标数据是否存在主题;若是,则从全量主题词库中提取主题;若否,则通过预设学习模型对目标数据进行分类,得到数据分类结果;当目标数据存在主题时,判断主题是否唯一;若是,则将主题作为数据分类结果;若否,则基于部门主题词库确定目标数据的部门主题;当主题不唯一时,判断主题与部门主题是否重叠;若是,则将主题或部门主题作为数据分类结果;若否,则通过预设学习模型对主题与部门主题进行分类,得到数据分类结果。
-
公开(公告)号:CN119377409A
公开(公告)日:2025-01-28
申请号:CN202411943469.9
申请日:2024-12-27
Applicant: 中电科大数据研究院有限公司 , 太极计算机股份有限公司
IPC: G06F16/35 , G06F16/36 , G06F40/242 , G06N3/08
Abstract: 本申请公开了一种基于关键词与深度学习的信息识别方法、系统及装置。本申请方法包括:获取个人数据集和公开数据集;基于个人数据集和公开数据集构建专用词典库;基于公开数据集提取关键字、特定符号以及主题;判断个人数据集与关键字或特定符号是否匹配;若否,则利用主题和专用词典库确定匹配词典;当确定匹配字典后,判断匹配词典与个人数据集是否匹配;若否,则基于个人数据集,通过语言表示模型训练得到嵌入向量;当得到嵌入向量后,将嵌入向量输入至序列神经网络模型中进行建模,得到隐状态序列;将隐状态序列的维度映射至目标维度中,并将已映射至目标维度后的隐状态序列输入至条件随机场算法中,得到个人信息识别结果。
-
公开(公告)号:CN119227120A
公开(公告)日:2024-12-31
申请号:CN202411779051.9
申请日:2024-12-05
Applicant: 中电科大数据研究院有限公司 , 太极计算机股份有限公司
IPC: G06F21/60 , G06F16/22 , G06F16/245 , G06F16/28
Abstract: 本申请公开了一种基于可信空间的可信数据交换方法、装置及存储介质。本申请方法包括:数据提供方将数据上传至可信数据空间;数据供给平台生成合约,合约包含签约时间戳、数据标识符、数据提供方标识符、数据使用方标识符、使用权限、使用期限、数据修改限制和控制策略;对合约信息进行哈希加密,并将合约信息存储于目标区块链中;将摩斯码中的“点”、“横”及“间隔”分别映射为零宽度非连接符、零宽度连接符及零宽度空格符,将加密后的合约标识符转换为摩斯码格式;在上传的数据信息的随机位置嵌入零宽度非连接符、零宽度连接符及零宽度空格符,加密秘钥基于预设的加密算法生成;使用加密密钥对上传的数据信息进行加密。
-
公开(公告)号:CN116150405B
公开(公告)日:2023-06-27
申请号:CN202310416643.3
申请日:2023-04-19
Applicant: 中电科大数据研究院有限公司 , 太极计算机股份有限公司
Abstract: 本发明提供一种多场景的异构数据处理方法,包括:从不同场景下的第一知识图谱和第二知识图谱中各个文本实体的邻居子图中提取图结构信息,获取文本实体的结构拓扑特征;从第一知识图谱和第二知识图谱的各三元组中获取连接各个文本实体的实体关系的关系特征;融合第一知识图谱和第二知识图谱中各个文本实体的结构拓扑特征和连接对应文本实体的实体关系的关系特征,得到各个文本实体的第一实体表示;基于第一知识图谱中任一文本实体的第一实体表示与第二知识图谱中任一文本实体的第一实体表示之间的相似度,构建第一实体对齐概率矩阵;基于第一实体对齐概率矩阵,确定第一知识图谱和第二知识图谱的对齐实体对。本发明提升了异构数据融合的准确性。
-
公开(公告)号:CN119227120B
公开(公告)日:2025-04-04
申请号:CN202411779051.9
申请日:2024-12-05
Applicant: 中电科大数据研究院有限公司 , 太极计算机股份有限公司
IPC: G06F21/60 , G06F16/22 , G06F16/245 , G06F16/28
Abstract: 本申请公开了一种基于可信空间的可信数据交换方法、装置及存储介质。本申请方法包括:数据提供方将数据上传至可信数据空间;数据供给平台生成合约,合约包含签约时间戳、数据标识符、数据提供方标识符、数据使用方标识符、使用权限、使用期限、数据修改限制和控制策略;对合约信息进行哈希加密,并将合约信息存储于目标区块链中;将摩斯码中的“点”、“横”及“间隔”分别映射为零宽度非连接符、零宽度连接符及零宽度空格符,将加密后的合约标识符转换为摩斯码格式;在上传的数据信息的随机位置嵌入零宽度非连接符、零宽度连接符及零宽度空格符,加密秘钥基于预设的加密算法生成;使用加密密钥对上传的数据信息进行加密。
-
公开(公告)号:CN119357177A
公开(公告)日:2025-01-24
申请号:CN202411920739.4
申请日:2024-12-25
Applicant: 中电科大数据研究院有限公司 , 中国电子科技集团公司第十五研究所
IPC: G06F16/215 , G06F18/2433 , G06F18/15 , G06N5/04
Abstract: 本申请公开了一种基于大模型的数据质量分析报告生成方法、系统、装置及存储介质,生成的质量报告具有深入分析和标准化建议,使得报告内容较为丰富,从而可满足复杂多变的业务需求。本申请方法包括:获取输入数据;对输入的数据进行缺失值、重复数据和异常值处理,以得到预处理数据;将所述预处理数据进行分类,以获取日志类型数据和原始数据;将目标知识库RAG集成于垂直大模型,并对所述垂直大模型进行微调,以获取垂直微调大模型;将所述日志类型数据和所述原始数据输入所述垂直微调大模型;获取所述垂直微调大模型生成的校验规则;在确定所述校验规则符合规则符合要求之后,根据所述校验规则生成高质量分析报告。
-
公开(公告)号:CN119003920A
公开(公告)日:2024-11-22
申请号:CN202411481452.6
申请日:2024-10-23
Applicant: 中电科大数据研究院有限公司
IPC: G06F16/958 , G06F16/951 , G06N3/042 , G06N3/0464
Abstract: 本申请公开了一种网页信息分类方法、装置及存储介质,用于信息分类领域。本申请方法包括:使用Python的Scrapy库从目标网页获取网页中的静态数据;使用Selenium自动化工具从目标网页获取网页的动态数据;基于所述静态数据和所述动态数据构建DOM树形结构;使用XLM‑RoBERTa预训练语言模型对已构建DOM树形结构的所述静态数据和所述动态数据进行向量化,转化为数值向量;将DOM树形结构转换为图结构,并将数值向量输入卷积图神经网络模型中,通过卷积图神经网络模型对图结构进行编码,生成特征向量;将所述特征向量输入预配置的分类模型中进行计算,通过预配置的分类模型对所述静态数据和所述动态数据进行分类。
-
公开(公告)号:CN118211840B
公开(公告)日:2024-08-23
申请号:CN202410639487.1
申请日:2024-05-22
Applicant: 中电科大数据研究院有限公司
Abstract: 本申请公开了一种智慧管网的区域管网安全评估方法及系统,用于降低地下管线的维修成本。本申请区域管网安全评估方法包括:采集管辖区域内的地下管线的空间位置数据;向预定范围内的次智能井盖发送采集指令;接收次智能井盖在各自管辖区域内采集的空间位置数据;根据空间位置数据进行立体绘制,生成地下管线分布地图;采集目标区域内地下管线的井下传感器数据;将井下传感器数据和地下管线历史运行数据进行对比,生成对比结果;根据对比结果显示确定在目标区域中存在异常波动的异常管线;根据地下管线分布地图确定异常管线的相邻管线;根据异常管线的异常波动的状态和相邻管线的井下传感器数据确定的受损管线。
-
-
-
-
-
-
-
-
-