-
公开(公告)号:CN117173592A
公开(公告)日:2023-12-05
申请号:CN202311213745.1
申请日:2023-09-20
Applicant: 中电科大数据研究院有限公司
IPC: G06V20/13 , G06V10/24 , G06V10/764 , G06V10/44 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种面向岸线空间管控的智能遥感监测方法及系统,所述方法包括:预先构建基于深度学习的目标检测模型;获取待检测区域遥感影像;利用所述目标检测模型对所述待检测区域遥感影像进行目标检测,得到检测结果;根据所述检测结果进行基于空间分析的对象评估与筛选,确定岸线边界指定辐射范围内的疑似目标。利用本发明方案,可以实现对河湖水域岸线生态环境的智能化监管。
-
公开(公告)号:CN116911289A
公开(公告)日:2023-10-20
申请号:CN202311176752.9
申请日:2023-09-13
Applicant: 中电科大数据研究院有限公司
IPC: G06F40/279 , G06F40/216 , G06F40/30 , G06F18/214
Abstract: 本申请公开了一种政务领域大模型可信文本生成方法、装置及存储介质。本申请方法包括:构建问题数据以及对应的知识数据;将问题数据以及知识数据构建成可控Prompt模板;将问题数据插入至预先配置的空白Prompt模板中,得到语义近似Prompt模板;将语义近似Prompt模板输入至目标大模型中,得到语义近似问题数据,语义近似问题数据与问题数据语义近似;将可控Prompt模板、问题数据、知识数据以及语义近似问题数据按照不同的组合方式构建映射数据集;以映射数据集作为目标大模型的输入,对目标大模型进行微调;在使用微调后的目标大模型时,将目标大模型输出的实时答案输入至预先构建的判别过滤器中执行负面判别,并将判别后的内容向用户输出。
-
公开(公告)号:CN116821712A
公开(公告)日:2023-09-29
申请号:CN202311076294.1
申请日:2023-08-25
Applicant: 中电科大数据研究院有限公司
Inventor: 蔡惠民
IPC: G06F18/22 , G06F40/284 , G06F40/30 , G06N3/092 , G06N3/0985 , G06N3/0442 , G06N3/045 , G06N3/047 , G06N3/048 , G06F16/36
Abstract: 本发明公开了一种非结构化文本与知识图谱的语义匹配方法及装置,该方法包括:获取非结构化文本;对非结构化文本进行实体和位置的协同抽取,得到各实体及所述实体在文本中的开始和结束位置;利用所述非结构化文本、所述实体及所述实体在文本中的开始和结束位置,确定所述实体的文本特征向量;依次将知识图谱中各实体作为候选实体,根据所述实体的文本特征向量依次计算所述实体与所述候选实体的匹配度;根据所述匹配度确定匹配实体。利用本发明方案,可以实现非结构化文本与知识图谱的语义融合需求,降低人工标注成本,并保证实体匹配准确率。
-
公开(公告)号:CN116108165A
公开(公告)日:2023-05-12
申请号:CN202310347275.1
申请日:2023-04-04
Applicant: 中电科大数据研究院有限公司
IPC: G06F16/34 , G06F40/211 , G06F40/289 , G06F40/284
Abstract: 本发明提供了一种文本摘要生成方法、装置、存储介质及电子设备,其中,该方法包括:提取目标文本中的关键词;基于具有关键词的原始词序列中的关键词的重要程度对相应的关键词进行数量扩展,得到目标句子的有效词序列;根据有效词序列确定目标句子与其他目标句子之间的相关度;根据该相关度确定目标句子的影响权重;基于影响权重最高的多个目标句子形成目标文本的文本摘要。本发明实施例提供的技术方案,先提取出关键词,进而确定关键词数量扩展后的有效词序列,基于该有效词序列可以更准确地表示在需要提取文本摘要时所需的目标句子之间的相关度,从而可以更准确地确定目标句子的影响权重,进而能够更准确地提取出文本摘要。
-
公开(公告)号:CN115168367B
公开(公告)日:2022-11-25
申请号:CN202211091952.X
申请日:2022-09-07
Applicant: 太极计算机股份有限公司 , 中电科大数据研究院有限公司
IPC: G06F16/22 , G06F16/2457 , G06F16/27 , G06F11/14
Abstract: 本发明涉及信息处理领域,具体公开了一种大数据的数据配置方法和系统,所述方法包括配置名称节点,数据节点和用户端,其中,所述名称节点被配置为中心管理服务器,在数据节点设置为存储节点时,在其存储的主、副分片上通过确认消息的交互完成主、副分片的数据同步,同时设置日志事件信息,满足用户主、副分片数据不一致时信息的传输处理需求,在通过日志事件信息追平情形下,提高了数据处理效率。
-
公开(公告)号:CN119338029B
公开(公告)日:2025-03-18
申请号:CN202411884166.4
申请日:2024-12-20
Applicant: 中电科大数据研究院有限公司
Abstract: 本发明提供一种去中心化分层联邦学习方法及系统、边缘服务器,该方法包括:多个边缘服务器分别接收不同参与方客户端发送的梯度密文;多个边缘服务器基于安全多方计算协议聚合接收到的梯度密文,得到聚合模型密文;安全多方计算协议是指在一个互不信任的多用户网络中,多个分别持有不同梯度密文的边缘服务器共同计算出基于这些梯度密文的聚合模型密文,每个边缘服务器只得到聚合模型密文中的部分数据,而且不泄露自己持有的梯度密文给其它边缘服务器;边缘服务器将聚合模型密文下发至参与方客户端。利用本发明方案,可以提高模型聚合的安全性。
-
公开(公告)号:CN119377409A
公开(公告)日:2025-01-28
申请号:CN202411943469.9
申请日:2024-12-27
Applicant: 中电科大数据研究院有限公司 , 太极计算机股份有限公司
IPC: G06F16/35 , G06F16/36 , G06F40/242 , G06N3/08
Abstract: 本申请公开了一种基于关键词与深度学习的信息识别方法、系统及装置。本申请方法包括:获取个人数据集和公开数据集;基于个人数据集和公开数据集构建专用词典库;基于公开数据集提取关键字、特定符号以及主题;判断个人数据集与关键字或特定符号是否匹配;若否,则利用主题和专用词典库确定匹配词典;当确定匹配字典后,判断匹配词典与个人数据集是否匹配;若否,则基于个人数据集,通过语言表示模型训练得到嵌入向量;当得到嵌入向量后,将嵌入向量输入至序列神经网络模型中进行建模,得到隐状态序列;将隐状态序列的维度映射至目标维度中,并将已映射至目标维度后的隐状态序列输入至条件随机场算法中,得到个人信息识别结果。
-
公开(公告)号:CN119338029A
公开(公告)日:2025-01-21
申请号:CN202411884166.4
申请日:2024-12-20
Applicant: 中电科大数据研究院有限公司
Abstract: 本发明提供一种去中心化分层联邦学习方法及系统、边缘服务器,该方法包括:多个边缘服务器分别接收不同参与方客户端发送的梯度密文;多个边缘服务器基于安全多方计算协议聚合接收到的梯度密文,得到聚合模型密文;安全多方计算协议是指在一个互不信任的多用户网络中,多个分别持有不同梯度密文的边缘服务器共同计算出基于这些梯度密文的聚合模型密文,每个边缘服务器只得到聚合模型密文中的部分数据,而且不泄露自己持有的梯度密文给其它边缘服务器;边缘服务器将聚合模型密文下发至参与方客户端。利用本发明方案,可以提高模型聚合的安全性。
-
公开(公告)号:CN118211038B
公开(公告)日:2024-08-23
申请号:CN202410632459.7
申请日:2024-05-21
Applicant: 中电科大数据研究院有限公司
IPC: G06F18/20 , G06F18/213 , G06F18/26 , G06F16/31 , G06F16/35 , G06F40/216 , G06F40/289 , G06F40/284 , G06F18/2135 , G06F18/23213
Abstract: 本申请公开了一种多维数据处理分析方法、装置、系统及存储介质。本申请方法包括:通过预先配置的数据接口获取多源异构的业务数据;对非结构化业务数据中进行特征提取,形成文本数据集;遍历文本数据集,构建出TF‑IDF向量矩阵;构建球树索引空间;对所有的数据点执行基于密度的聚类,得到多个聚类簇;以一个聚类簇为一个项构建候选1‑项集;筛选出不小于第一支持度阈值的项,得到频繁1‑项集,频繁1‑项集中的每一项由一个聚类簇构成;基于上述方式,构建频繁n‑项集,直至无法构建出n+1的频繁项集;基于所生成的所有频繁项集,确定出符合预设置信度的项,并输出关联规则。
-
公开(公告)号:CN118211038A
公开(公告)日:2024-06-18
申请号:CN202410632459.7
申请日:2024-05-21
Applicant: 中电科大数据研究院有限公司
IPC: G06F18/20 , G06F18/213 , G06F18/26 , G06F16/31 , G06F16/35 , G06F40/216 , G06F40/289 , G06F40/284 , G06F18/2135 , G06F18/23213
Abstract: 本申请公开了一种多维数据处理分析方法、装置、系统及存储介质。本申请方法包括:通过预先配置的数据接口获取多源异构的业务数据;对非结构化业务数据中进行特征提取,形成文本数据集;遍历文本数据集,构建出TF‑IDF向量矩阵;构建球树索引空间;对所有的数据点执行基于密度的聚类,得到多个聚类簇;以一个聚类簇为一个项构建候选1‑项集;筛选出不小于第一支持度阈值的项,得到频繁1‑项集,频繁1‑项集中的每一项由一个聚类簇构成;基于上述方式,构建频繁n‑项集,直至无法构建出n+1的频繁项集;基于所生成的所有频繁项集,确定出符合预设置信度的项,并输出关联规则。
-
-
-
-
-
-
-
-
-