-
公开(公告)号:CN117315379B
公开(公告)日:2024-03-12
申请号:CN202311612473.2
申请日:2023-11-29
Applicant: 中电科大数据研究院有限公司
IPC: G06V10/764 , G06V10/774 , G06V10/778
Abstract: 本发明公开了一种面向深度学习的医学影像分类模型公平性评估方法及装置,该方法包括:采集患者X光影像,所述患者X光影像中包括一个或多个标签;构造单标签二分类数据集,并将所述单标签二分类数据集分为训练数据集和测试数据集;所述单标签二分类数据集中的数据样本包括患者身份信息;利用所述训练数据集训练得到基于深度学习的患病预测模型;利用所述测试数据集对所述患病预测模型进行测试,得到测试结果;根据所述测试结果确定模型的公平性。利用本发明方案,可以有效地评估模型的公平性。
-
公开(公告)号:CN117370673B
公开(公告)日:2024-02-06
申请号:CN202311678732.1
申请日:2023-12-08
Applicant: 中电科大数据研究院有限公司
IPC: G06F16/9535 , G06F16/901 , G06F21/62 , G06F21/60
Abstract: 本发明提供一种算法推荐服务的数据管理方法及装置,属于数据处理技术领域,本发明的算法推荐服务的数据管理方法,通过哈希算法将不同的个人基本信息进行加密以实现对个人基本信息的脱敏处理,得到个人信息特征数据,进一步地将个人信息特征数据进行打乱顺序并加密传输至推荐算法应用平台,使用第二区块链来保存索引顺序表并生成目标公钥,可以保证只有推荐算法应用平台能安全地获取索引顺序表以及目标公钥对应的目标私钥来进行数据解密,防止数据在传输过程中被劫持利用,损伤用户利益,降低了数据泄露的风险,保证了数据的安全性。
-
公开(公告)号:CN117350268A
公开(公告)日:2024-01-05
申请号:CN202311253317.1
申请日:2023-09-26
Applicant: 中电科大数据研究院有限公司
IPC: G06F40/194 , G06F40/205 , G06F40/169 , G06N3/0464 , G06N3/08 , G06F40/242
Abstract: 本发明公开了一种政策公文脉络分析方法及装置,该方法包括:采集政府网站公文;利用预先建立的实体抽取模型对各公文进行实体抽取,得到各公文包含的实体;根据各公文包含的实体计算不同公文的相似度;对于相似度大于设定阈值的两公文,确定所述两公文间的关联关系;根据所述关联关系生成并展示公文脉络。利用本发明方案,可以为政策执行的监管机构提供有效辅助信息,进而帮助相关机构对各级政府对政策的执行情况进行有效监督。
-
公开(公告)号:CN116911289B
公开(公告)日:2024-01-02
申请号:CN202311176752.9
申请日:2023-09-13
Applicant: 中电科大数据研究院有限公司
IPC: G06F40/279 , G06F40/216 , G06F40/30 , G06F18/214
Abstract: 本申请公开了一种政务领域大模型可信文本生成方法、装置及存储介质。本申请方法包括:构建问题数据以及对应的知识数据;将问题数据以及知识数据构建成可控Prompt模板;将问题数据插入至预先配置的空白Prompt模板中,得到语义近似Prompt模板;将语义近似Prompt模板输入至目标大模型中,得到语义近似问题数据,语义近似问题数据与问题数据语义近似;将可控Prompt模板、问题数据、知识数据以及语义近似问题数据按照不同的组合方式构建映射数据集;以映射数据集作为目标大模型的输入,对目标大模型进行微调;在使用微调后的目标大模型时,将目标大模型输出的实时答案输入至预先构建
-
公开(公告)号:CN116775578A
公开(公告)日:2023-09-19
申请号:CN202311070192.9
申请日:2023-08-24
Applicant: 中电科大数据研究院有限公司
Abstract: 本发明公开了一种政策血缘网络构建方法及装置、政策分析方法及装置,所述方法包括:收集政策文件,并对所述政策文件进行分类编码管理;根据所述政策文件,构建不同粒度的文本向量;对所述文本向量进行聚类,得到各聚类中心点及该中心点对应的向量簇,所述向量簇包括多个文本向量、以及与所述文本向量相关的政策集合;构建对应各中心点的政策谱系树,由所述政策谱系树组成政策森林;根据所述政策森林中的所有政策谱系树构建政策血缘网络。利用本发明方案,可以高效地构建政策血缘网络,而且构建的政策血缘网络可以全面地呈现不同政策间的显性血缘关系和隐性血缘关系,为政策传播的分析提供有效支撑。
-
公开(公告)号:CN116501875A
公开(公告)日:2023-07-28
申请号:CN202310486869.0
申请日:2023-04-28
Applicant: 中电科大数据研究院有限公司
IPC: G06F16/35 , G06F16/31 , G06F16/34 , G06F40/289 , G06F40/216 , G06F40/253 , G06F40/186 , G06F16/28 , G06F16/901 , G06F18/23213 , G06N3/0442
Abstract: 本发明涉及信息处理领域,特别是一种基于自然语言和知识图谱的文档处理方法和系统,通过对主题关键词属性信息聚类分类处理;借助于权重值信息的赋值抽取出文档中的关键信息,对文档文本进行自动分词、自动分类、自动聚类处理,配置知识图谱获取到特定的语法与结构,形成自动填充模板,对法律文档配置填充格式,生成文档数据信息的自动摘要,能够快捷高效地向用户推送文档主题信息,提升了现有文档信息的处理效率。
-
公开(公告)号:CN116108165B
公开(公告)日:2023-06-13
申请号:CN202310347275.1
申请日:2023-04-04
Applicant: 中电科大数据研究院有限公司
IPC: G06F16/34 , G06F40/211 , G06F40/289 , G06F40/284
Abstract: 本发明提供了一种文本摘要生成方法、装置、存储介质及电子设备,其中,该方法包括:提取目标文本中的关键词;基于具有关键词的原始词序列中的关键词的重要程度对相应的关键词进行数量扩展,得到目标句子的有效词序列;根据有效词序列确定目标句子与其他目标句子之间的相关度;根据该相关度确定目标句子的影响权重;基于影响权重最高的多个目标句子形成目标文本的文本摘要。本发明实施例提供的技术方案,先提取出关键词,进而确定关键词数量扩展后的有效词序列,基于该有效词序列可以更准确地表示在需要提取文本摘要时所需的目标句子之间的相关度,从而可以更准确地确定目标句子的影响权重,进而能够更准确地提取出文本摘要。
-
公开(公告)号:CN119338029B
公开(公告)日:2025-03-18
申请号:CN202411884166.4
申请日:2024-12-20
Applicant: 中电科大数据研究院有限公司
Abstract: 本发明提供一种去中心化分层联邦学习方法及系统、边缘服务器,该方法包括:多个边缘服务器分别接收不同参与方客户端发送的梯度密文;多个边缘服务器基于安全多方计算协议聚合接收到的梯度密文,得到聚合模型密文;安全多方计算协议是指在一个互不信任的多用户网络中,多个分别持有不同梯度密文的边缘服务器共同计算出基于这些梯度密文的聚合模型密文,每个边缘服务器只得到聚合模型密文中的部分数据,而且不泄露自己持有的梯度密文给其它边缘服务器;边缘服务器将聚合模型密文下发至参与方客户端。利用本发明方案,可以提高模型聚合的安全性。
-
公开(公告)号:CN119338029A
公开(公告)日:2025-01-21
申请号:CN202411884166.4
申请日:2024-12-20
Applicant: 中电科大数据研究院有限公司
Abstract: 本发明提供一种去中心化分层联邦学习方法及系统、边缘服务器,该方法包括:多个边缘服务器分别接收不同参与方客户端发送的梯度密文;多个边缘服务器基于安全多方计算协议聚合接收到的梯度密文,得到聚合模型密文;安全多方计算协议是指在一个互不信任的多用户网络中,多个分别持有不同梯度密文的边缘服务器共同计算出基于这些梯度密文的聚合模型密文,每个边缘服务器只得到聚合模型密文中的部分数据,而且不泄露自己持有的梯度密文给其它边缘服务器;边缘服务器将聚合模型密文下发至参与方客户端。利用本发明方案,可以提高模型聚合的安全性。
-
公开(公告)号:CN118211038B
公开(公告)日:2024-08-23
申请号:CN202410632459.7
申请日:2024-05-21
Applicant: 中电科大数据研究院有限公司
IPC: G06F18/20 , G06F18/213 , G06F18/26 , G06F16/31 , G06F16/35 , G06F40/216 , G06F40/289 , G06F40/284 , G06F18/2135 , G06F18/23213
Abstract: 本申请公开了一种多维数据处理分析方法、装置、系统及存储介质。本申请方法包括:通过预先配置的数据接口获取多源异构的业务数据;对非结构化业务数据中进行特征提取,形成文本数据集;遍历文本数据集,构建出TF‑IDF向量矩阵;构建球树索引空间;对所有的数据点执行基于密度的聚类,得到多个聚类簇;以一个聚类簇为一个项构建候选1‑项集;筛选出不小于第一支持度阈值的项,得到频繁1‑项集,频繁1‑项集中的每一项由一个聚类簇构成;基于上述方式,构建频繁n‑项集,直至无法构建出n+1的频繁项集;基于所生成的所有频繁项集,确定出符合预设置信度的项,并输出关联规则。
-
-
-
-
-
-
-
-
-