-
公开(公告)号:CN116775578A
公开(公告)日:2023-09-19
申请号:CN202311070192.9
申请日:2023-08-24
Applicant: 中电科大数据研究院有限公司
Abstract: 本发明公开了一种政策血缘网络构建方法及装置、政策分析方法及装置,所述方法包括:收集政策文件,并对所述政策文件进行分类编码管理;根据所述政策文件,构建不同粒度的文本向量;对所述文本向量进行聚类,得到各聚类中心点及该中心点对应的向量簇,所述向量簇包括多个文本向量、以及与所述文本向量相关的政策集合;构建对应各中心点的政策谱系树,由所述政策谱系树组成政策森林;根据所述政策森林中的所有政策谱系树构建政策血缘网络。利用本发明方案,可以高效地构建政策血缘网络,而且构建的政策血缘网络可以全面地呈现不同政策间的显性血缘关系和隐性血缘关系,为政策传播的分析提供有效支撑。
-
公开(公告)号:CN116501875A
公开(公告)日:2023-07-28
申请号:CN202310486869.0
申请日:2023-04-28
Applicant: 中电科大数据研究院有限公司
IPC: G06F16/35 , G06F16/31 , G06F16/34 , G06F40/289 , G06F40/216 , G06F40/253 , G06F40/186 , G06F16/28 , G06F16/901 , G06F18/23213 , G06N3/0442
Abstract: 本发明涉及信息处理领域,特别是一种基于自然语言和知识图谱的文档处理方法和系统,通过对主题关键词属性信息聚类分类处理;借助于权重值信息的赋值抽取出文档中的关键信息,对文档文本进行自动分词、自动分类、自动聚类处理,配置知识图谱获取到特定的语法与结构,形成自动填充模板,对法律文档配置填充格式,生成文档数据信息的自动摘要,能够快捷高效地向用户推送文档主题信息,提升了现有文档信息的处理效率。
-
公开(公告)号:CN116108165B
公开(公告)日:2023-06-13
申请号:CN202310347275.1
申请日:2023-04-04
Applicant: 中电科大数据研究院有限公司
IPC: G06F16/34 , G06F40/211 , G06F40/289 , G06F40/284
Abstract: 本发明提供了一种文本摘要生成方法、装置、存储介质及电子设备,其中,该方法包括:提取目标文本中的关键词;基于具有关键词的原始词序列中的关键词的重要程度对相应的关键词进行数量扩展,得到目标句子的有效词序列;根据有效词序列确定目标句子与其他目标句子之间的相关度;根据该相关度确定目标句子的影响权重;基于影响权重最高的多个目标句子形成目标文本的文本摘要。本发明实施例提供的技术方案,先提取出关键词,进而确定关键词数量扩展后的有效词序列,基于该有效词序列可以更准确地表示在需要提取文本摘要时所需的目标句子之间的相关度,从而可以更准确地确定目标句子的影响权重,进而能够更准确地提取出文本摘要。
-
公开(公告)号:CN119513674A
公开(公告)日:2025-02-25
申请号:CN202510089450.0
申请日:2025-01-21
Applicant: 中电科大数据研究院有限公司 , 中电科新型智慧城市研究院有限公司
IPC: G06F18/24 , G06F18/213 , G06F18/22
Abstract: 本申请公开了一种基于特征向量匹配的数据识别方法、装置及存储介质。包括:获取待检测数据,分词生成特征向量;通过矩阵运算计算待匹配特征向量与预定义核心数据特征向量的欧氏距离,统计匹配数量;根据描述信息、表描述信息和字段描述信息的权重(分别为0.2、0.5、0.3),计算数据权重值;结合匹配结果和数据规模,通过加权计算得到待检测数据属于核心或重要数据的概率值;判断概率值是否超过阈值,若超过,则识别为核心或重要数据。本方法依托可信执行环境TEE实现特征向量的提取、匹配及计算,避免待检测数据和核心数据特征库暴露。确保计算过程的真实性和可信性。TEE相对其他隐私计算技术,具有额外计算少的优点,可以提升算法匹配效率。
-
公开(公告)号:CN118381600B
公开(公告)日:2024-09-10
申请号:CN202410837475.X
申请日:2024-06-26
Applicant: 中电科大数据研究院有限公司
IPC: H04L9/00 , H04L9/08 , H04L9/32 , H04L67/1095 , H04L67/1097 , G06N3/098 , G06N3/084 , G06F21/60 , G06F21/62
Abstract: 本发明提供一种联邦学习隐私保护方法及系统,该方法包括:中央服务器接收各参与方发送的基于同态加密的梯度密文;对接收的各参与方的梯度密文进行聚合及解密,得到聚合梯度信息;对聚合梯度信息进行数字签名,得到签名组;将签名组发送给共识节点;共识节点对签名组中的签名信息进行共识验证,验证通过后将签名组中的聚合梯度信息上传至区块链网络。利用本发明方案,可以有效地保护各参与方私有数据的安全性,并降低了参与方的计算开销,而且实现了对模型数据的全生命周期维护。
-
公开(公告)号:CN118484584A
公开(公告)日:2024-08-13
申请号:CN202410682374.X
申请日:2024-05-29
Applicant: 中电科大数据研究院有限公司
IPC: G06F16/953 , G06F16/2458 , G06F16/951 , G06F16/9538 , G06F18/15 , G06F18/241 , G06Q50/26
Abstract: 一种基于E‑OEM模型的政务数据精准挖掘方法,涉及计算机网络数据处理技术领域,解决现有政务数据挖掘方法存在获取相关政务数据精准度不高的问题,本方法通过政务数据采集、预处理,构建Kirkpatrick模型进行数据挖掘实施效果评价,基于E‑OEM模型的政务数据模式归一化及标准化处理,设定相应的数据挖掘算法,获得精准的政务数据以及对挖掘结果的显示及评估等步骤实现。本发明方法评价指标选取范围大,且与实验样本差异度较小,因此,本方法的指标选取结果与实验样本的相似度较高,可有效保证对实验对象评价的全面性与精准度。
-
公开(公告)号:CN117994719A
公开(公告)日:2024-05-07
申请号:CN202410026176.8
申请日:2024-01-08
Applicant: 中电科大数据研究院有限公司
Abstract: 本申请实施例公开了一种识别人群聚集的方法、装置及计算机可读存储介质,用于提高效率。本申请实施例方法包括:获取目标摄像头拍摄的视频流数据;将所述视频流数据输入预先训练完成的人头识别模型,得到标注人头框后的待检测图像序列,所述人头识别模型用于标注图像中的人头;获取所述待检测图像序列中的人头框的中心点坐标;计算所述待检测图像序列中各个人头框的面积;将所述中心点坐标和所述各个人头框的面积输入预先训练好的聚类模型,利用所述聚类模型对所述待检测图像序列逐张进行关于人头框的中心点的聚类,得到聚类结果;根据所述聚类结果确定是否发生人群聚集。
-
公开(公告)号:CN116431788B
公开(公告)日:2024-03-29
申请号:CN202310403521.0
申请日:2023-04-14
Applicant: 中电科大数据研究院有限公司
IPC: G06F16/332 , G06F16/33 , G06F40/289 , G06F40/30 , G06N20/00
Abstract: 本发明提供一种面向跨模态数据的语义检索方法,通过在检索学生模型的每一轮训练过程中,基于第一样本对检索教师模型进行当前轮训练,并基于当前轮训练后的检索教师模型对第二样本进行图文匹配,得到第二样本的匹配标签,再基于第二样本的匹配标签对检索学生模型进行当前轮训练,使得检索学生模型在训练过程中可以克服第二样本中的大量噪声带来的干扰;同时通过提供第二样本的匹配标签作为检索学生模型的训练目标,可以将各个第二样本中包含的多对多关系传达给检索学生模型,使得检索学生模型可以学习到上述多对多的关联关系,从而给出更优的跨模态检索结果,提升了检索学生模型在复杂的网络数据中的跨模态检索精度。
-
公开(公告)号:CN117390191A
公开(公告)日:2024-01-12
申请号:CN202311472903.5
申请日:2023-11-07
Applicant: 中电科大数据研究院有限公司
IPC: G06F16/35 , G06F18/214 , G06F40/56 , G06F18/2415
Abstract: 本发明公开了一种政策文本主题分类方法及装置,该方法包括:获取待预测的政策文本;将所述政策文本输入预训练得到的分类模型,根据所述分类模型的输出得到所述政策文本对应的主题标签;所述分类模型采用Albert模型;输出所述主题标签。利用本发明方案,可以提升政策主题分类的效果。
-
公开(公告)号:CN117370673A
公开(公告)日:2024-01-09
申请号:CN202311678732.1
申请日:2023-12-08
Applicant: 中电科大数据研究院有限公司
IPC: G06F16/9535 , G06F16/901 , G06F21/62 , G06F21/60
Abstract: 本发明提供一种算法推荐服务的数据管理方法及装置,属于数据处理技术领域,本发明的算法推荐服务的数据管理方法,通过哈希算法将不同的个人基本信息进行加密以实现对个人基本信息的脱敏处理,得到个人信息特征数据,进一步地将个人信息特征数据进行打乱顺序并加密传输至推荐算法应用平台,使用第二区块链来保存索引顺序表并生成目标公钥,可以保证只有推荐算法应用平台能安全地获取索引顺序表以及目标公钥对应的目标私钥来进行数据解密,防止数据在传输过程中被劫持利用,损伤用户利益,降低了数据泄露的风险,保证了数据的安全性。
-
-
-
-
-
-
-
-
-