-
公开(公告)号:CN107622121B
公开(公告)日:2020-06-23
申请号:CN201710872848.7
申请日:2017-09-25
Applicant: 北京邮电大学
IPC: G06F16/2458
Abstract: 本发明实施例提供了一种基于位图数据结构的数据分析方法及装置,该方法包括:获得主节点分配的第一事务子集合;获得总数目及排序;根据排序确定每一目标项目的位图数据;统计每一目标项目的位图数据中第一数据与总数目之间的比例,根据统计的比例确定目标项目中的频繁1项集;将为频繁1项集的目标项目和为频繁1项集的目标项目的位图数据,广播至主节点和其他分布式子节点;接收统计项目和统计项目的位图数据;基于接收到的统计项目、统计项目的位图数据和为频繁1项集的目标项目的位图数据,计算目标项集是否为频繁项集;若目标项集为频繁项集,确定目标项集中各个项目之间的关联规则。这样,可以快速地得到关联规则以及项目之间的关联关系。
-
公开(公告)号:CN115660953A
公开(公告)日:2023-01-31
申请号:CN202211230898.2
申请日:2022-09-30
Applicant: 国网山东省电力公司电力科学研究院 , 国家电网有限公司 , 北京邮电大学 , 沈阳工业大学
Inventor: 林颖 , 师伟 , 孙景文 , 李杰 , 秦佳峰 , 王江伟 , 张丕沛 , 汪鹏 , 孙承海 , 张峰达 , 李壮壮 , 刘萌 , 白德盟 , 郑文杰 , 熊永平 , 吕晓兵 , 刘碧云 , 李晓龙 , 李程启 , 张围围 , 刘辉 , 周超
IPC: G06T3/40 , G06V10/42 , G06V10/54 , G06V10/774
Abstract: 本发明属于图像处理技术领域,公开一种面向目标检测的JPEG图像压缩方法、装置、介质、设备,包括对公开的目标检测数据集进行处理,得到回归样本集;在回归样本集中选取与JPEG图像压缩关联的图像特征,计算得到图像特征向量;基于得到的回归样本集和图像特征向量,对最优质量因子进行回归,训练回归模型,得到回归参数,通过回归模型对输入的图像进行压缩。本发明在不降低下游视觉任务计算指标的前提下基于JPEG压缩回归算法计算最优质量因子,以自适应地压缩图像从而减少在传输过程中的资源消耗。
-
公开(公告)号:CN107992597B
公开(公告)日:2020-08-18
申请号:CN201711325919.8
申请日:2017-12-13
Applicant: 国网山东省电力公司电力科学研究院 , 北京邮电大学 , 国家电网公司
IPC: G06F16/25 , G06F16/36 , G06F40/295 , G06Q10/00 , G06Q50/06
Abstract: 本发明公开了一种面向电网故障案例的文本结构化方法;对非结构化文本进行命名实体识别,并构建面向电网领域的实体字典来辅助实体识别和文本分词;提取属性值以及描述各属性的状态量,状态量按照类型分为数字型状态量和非数字型状态量,基于规则的方法来提取并对数字型状态量修饰属性进行匹配;将非数字型状态量进行细化,划分为基于词组形式的状态量和基于句子形式的状态量,分别提取其修饰的属性;根据识别出的属性以及对应的状态量,最终生成若干由属性和对应状态量形成的二元组,完成文本结构化。
-
公开(公告)号:CN107622121A
公开(公告)日:2018-01-23
申请号:CN201710872848.7
申请日:2017-09-25
Applicant: 北京邮电大学
IPC: G06F17/30
Abstract: 本发明实施例提供了一种基于位图数据结构的数据分析方法及装置,该方法包括:获得主节点分配的第一事务子集合;获得总数目及排序;根据排序确定每一目标项目的位图数据;统计每一目标项目的位图数据中第一数据与总数目之间的比例,根据统计的比例确定目标项目中的频繁1项集;将为频繁1项集的目标项目和为频繁1项集的目标项目的位图数据,广播至主节点和其他分布式子节点;接收统计项目和统计项目的位图数据;基于接收到的统计项目、统计项目的位图数据和为频繁1项集的目标项目的位图数据,计算目标项集是否为频繁项集;若目标项集为频繁项集,确定目标项集中各个项目之间的关联规则。这样,可以快速地得到关联规则以及项目之间的关联关系。
-
公开(公告)号:CN115375565A
公开(公告)日:2022-11-22
申请号:CN202210941085.8
申请日:2022-08-05
Applicant: 国网山东省电力公司电力科学研究院 , 国家电网有限公司 , 北京邮电大学 , 中国电力科学研究院有限公司
Inventor: 师伟 , 林颖 , 李杰 , 秦佳峰 , 孙景文 , 王江伟 , 张丕沛 , 汪鹏 , 孙承海 , 张峰达 , 李壮壮 , 刘萌 , 白德盟 , 郑文杰 , 熊永平 , 吕晓兵 , 刘碧云 , 杜非 , 常文治 , 李程启 , 张围围 , 刘辉 , 周超
Abstract: 本申请涉及一种图像中特定形状噪声去除方法,包括以下步骤:根据图像中特定形状噪声的特性,生成包含特定形状噪声的图像数据集;训练并保存对图像进行特定形状噪声分割的图像分割网络,利用所述图像分割网络对图像数据集中的图像进行分割处理;训练并保存去除特定形状噪声的生成对抗网络,将利用图像分割网络分割后的图像输入生成对抗网络,利用所述生成对抗网络去除图像中的特定形状噪声。本申请可以有效地去除图形中特定形状的噪声。
-
公开(公告)号:CN112732934B
公开(公告)日:2022-05-27
申请号:CN202110029159.6
申请日:2021-01-11
Applicant: 国网山东省电力公司电力科学研究院 , 北京邮电大学 , 国家电网有限公司
IPC: G06F16/36 , G06F16/35 , G06F16/33 , G06F40/211 , G06F40/242 , G06F40/247 , G06F40/295 , G06N3/04 , G06N3/08
Abstract: 一种电网设备分词词典和故障案例库构建方法,构建了电网领域分词词典,然后对故障案例数据进行格式转换、分词等预处理,然后运用多种技术手段,从文本数据中分析生成结构化电网设备故障案例、特征标签、关键词云、关联规则等信息。为上述信息设计关系型数据库Schema,以报告为主键,将上述文本信息和预处理中保留的图片、作者等信息一起入库,形成电网设备故障案例库。提升了电网领域文本的分词准确性,结构化的案例数据库使根据案例内容的检索更为准确,将故障案例数据库中的特征标签作为项集,整理挖掘故障的有效关联规则,可用于故障预警,填补了电网领域文本分析技术应用的空白。提升了电网领域语料的应用价值,降低了查阅成本。
-
公开(公告)号:CN112732934A
公开(公告)日:2021-04-30
申请号:CN202110029159.6
申请日:2021-01-11
Applicant: 国网山东省电力公司电力科学研究院 , 北京邮电大学 , 国家电网有限公司
IPC: G06F16/36 , G06F16/35 , G06F16/33 , G06F40/211 , G06F40/242 , G06F40/247 , G06F40/295 , G06N3/04 , G06N3/08
Abstract: 一种电网设备分词词典和故障案例库构建方法,构建了电网领域分词词典,然后对故障案例数据进行格式转换、分词等预处理,然后运用多种技术手段,从文本数据中分析生成结构化电网设备故障案例、特征标签、关键词云、关联规则等信息。为上述信息设计关系型数据库Schema,以报告为主键,将上述文本信息和预处理中保留的图片、作者等信息一起入库,形成电网设备故障案例库。提升了电网领域文本的分词准确性,结构化的案例数据库使根据案例内容的检索更为准确,将故障案例数据库中的特征标签作为项集,整理挖掘故障的有效关联规则,可用于故障预警,填补了电网领域文本分析技术应用的空白。提升了电网领域语料的应用价值,降低了查阅成本。
-
公开(公告)号:CN108021679A
公开(公告)日:2018-05-11
申请号:CN201711288010.X
申请日:2017-12-07
Applicant: 国网山东省电力公司电力科学研究院 , 北京邮电大学 , 国家电网公司
Abstract: 本发明公开了一种并行化的电力设备缺陷文本分类方法,将领域词库加入到用户词典中,对缺陷案例进行预处理,进行分词和去停用词;利用爬虫算法,收集电网故障案例的文本语料,利用Spark的word2vec进行训练,获取该领域的词向量表示;将获取的缺陷案例和词向量进行向量化表示,将缺陷案例进行文本表示,形成矩阵;将矩阵输入到SVM多分类器中,进行训练与分类,得到分类结果。
-
公开(公告)号:CN107992597A
公开(公告)日:2018-05-04
申请号:CN201711325919.8
申请日:2017-12-13
Applicant: 国网山东省电力公司电力科学研究院 , 北京邮电大学 , 国家电网公司
Abstract: 本发明公开了一种面向电网故障案例的文本结构化方法;对非结构化文本进行命名实体识别,并构建面向电网领域的实体字典来辅助实体识别和文本分词;提取属性值以及描述各属性的状态量,状态量按照类型分为数字型状态量和非数字型状态量,基于规则的方法来提取并对数字型状态量修饰属性进行匹配;将非数字型状态量进行细化,划分为基于词组形式的状态量和基于句子形式的状态量,分别提取其修饰的属性;根据识别出的属性以及对应的状态量,最终生成若干由属性和对应状态量形成的二元组,完成文本结构化。
-
-
-
-
-
-
-
-