-
公开(公告)号:CN107622121A
公开(公告)日:2018-01-23
申请号:CN201710872848.7
申请日:2017-09-25
Applicant: 北京邮电大学
IPC: G06F17/30
Abstract: 本发明实施例提供了一种基于位图数据结构的数据分析方法及装置,该方法包括:获得主节点分配的第一事务子集合;获得总数目及排序;根据排序确定每一目标项目的位图数据;统计每一目标项目的位图数据中第一数据与总数目之间的比例,根据统计的比例确定目标项目中的频繁1项集;将为频繁1项集的目标项目和为频繁1项集的目标项目的位图数据,广播至主节点和其他分布式子节点;接收统计项目和统计项目的位图数据;基于接收到的统计项目、统计项目的位图数据和为频繁1项集的目标项目的位图数据,计算目标项集是否为频繁项集;若目标项集为频繁项集,确定目标项集中各个项目之间的关联规则。这样,可以快速地得到关联规则以及项目之间的关联关系。
-
公开(公告)号:CN107622121B
公开(公告)日:2020-06-23
申请号:CN201710872848.7
申请日:2017-09-25
Applicant: 北京邮电大学
IPC: G06F16/2458
Abstract: 本发明实施例提供了一种基于位图数据结构的数据分析方法及装置,该方法包括:获得主节点分配的第一事务子集合;获得总数目及排序;根据排序确定每一目标项目的位图数据;统计每一目标项目的位图数据中第一数据与总数目之间的比例,根据统计的比例确定目标项目中的频繁1项集;将为频繁1项集的目标项目和为频繁1项集的目标项目的位图数据,广播至主节点和其他分布式子节点;接收统计项目和统计项目的位图数据;基于接收到的统计项目、统计项目的位图数据和为频繁1项集的目标项目的位图数据,计算目标项集是否为频繁项集;若目标项集为频繁项集,确定目标项集中各个项目之间的关联规则。这样,可以快速地得到关联规则以及项目之间的关联关系。
-
公开(公告)号:CN107423344B
公开(公告)日:2020-03-13
申请号:CN201710344719.0
申请日:2017-05-16
Abstract: 本发明实施例提供了一种输变电设备状态数据的可视化方法及装置,应用于终端设备,方法包括:获取输变电设备状态数据中的文本数据、多维数据和地理数据;确定文本数据中的关键词,并确定各关键词的权重值,根据权重值的大小对各关键词进行可视化;确定多维数据的第一维度数N,将多维数据排列成N维队列,对N维队列中的数据进行可视化;确定地理数据的第二维度数M,确定M维属性信息一一对应的M个视图,在目标视图中对地理数据中的目标属性信息的数据进行可视化。本发明实施例按照数据属性信息的关联性对输变电设备状态数据分类,得到文本数据、多维数据和地理数据,然后分别对三者进行可视化,能够具体、全面的描述输变电设备的运行状态。
-
公开(公告)号:CN107992597B
公开(公告)日:2020-08-18
申请号:CN201711325919.8
申请日:2017-12-13
Applicant: 国网山东省电力公司电力科学研究院 , 北京邮电大学 , 国家电网公司
IPC: G06F16/25 , G06F16/36 , G06F40/295 , G06Q10/00 , G06Q50/06
Abstract: 本发明公开了一种面向电网故障案例的文本结构化方法;对非结构化文本进行命名实体识别,并构建面向电网领域的实体字典来辅助实体识别和文本分词;提取属性值以及描述各属性的状态量,状态量按照类型分为数字型状态量和非数字型状态量,基于规则的方法来提取并对数字型状态量修饰属性进行匹配;将非数字型状态量进行细化,划分为基于词组形式的状态量和基于句子形式的状态量,分别提取其修饰的属性;根据识别出的属性以及对应的状态量,最终生成若干由属性和对应状态量形成的二元组,完成文本结构化。
-
公开(公告)号:CN112732934B
公开(公告)日:2022-05-27
申请号:CN202110029159.6
申请日:2021-01-11
Applicant: 国网山东省电力公司电力科学研究院 , 北京邮电大学 , 国家电网有限公司
IPC: G06F16/36 , G06F16/35 , G06F16/33 , G06F40/211 , G06F40/242 , G06F40/247 , G06F40/295 , G06N3/04 , G06N3/08
Abstract: 一种电网设备分词词典和故障案例库构建方法,构建了电网领域分词词典,然后对故障案例数据进行格式转换、分词等预处理,然后运用多种技术手段,从文本数据中分析生成结构化电网设备故障案例、特征标签、关键词云、关联规则等信息。为上述信息设计关系型数据库Schema,以报告为主键,将上述文本信息和预处理中保留的图片、作者等信息一起入库,形成电网设备故障案例库。提升了电网领域文本的分词准确性,结构化的案例数据库使根据案例内容的检索更为准确,将故障案例数据库中的特征标签作为项集,整理挖掘故障的有效关联规则,可用于故障预警,填补了电网领域文本分析技术应用的空白。提升了电网领域语料的应用价值,降低了查阅成本。
-
公开(公告)号:CN112732934A
公开(公告)日:2021-04-30
申请号:CN202110029159.6
申请日:2021-01-11
Applicant: 国网山东省电力公司电力科学研究院 , 北京邮电大学 , 国家电网有限公司
IPC: G06F16/36 , G06F16/35 , G06F16/33 , G06F40/211 , G06F40/242 , G06F40/247 , G06F40/295 , G06N3/04 , G06N3/08
Abstract: 一种电网设备分词词典和故障案例库构建方法,构建了电网领域分词词典,然后对故障案例数据进行格式转换、分词等预处理,然后运用多种技术手段,从文本数据中分析生成结构化电网设备故障案例、特征标签、关键词云、关联规则等信息。为上述信息设计关系型数据库Schema,以报告为主键,将上述文本信息和预处理中保留的图片、作者等信息一起入库,形成电网设备故障案例库。提升了电网领域文本的分词准确性,结构化的案例数据库使根据案例内容的检索更为准确,将故障案例数据库中的特征标签作为项集,整理挖掘故障的有效关联规则,可用于故障预警,填补了电网领域文本分析技术应用的空白。提升了电网领域语料的应用价值,降低了查阅成本。
-
公开(公告)号:CN108021679A
公开(公告)日:2018-05-11
申请号:CN201711288010.X
申请日:2017-12-07
Applicant: 国网山东省电力公司电力科学研究院 , 北京邮电大学 , 国家电网公司
Abstract: 本发明公开了一种并行化的电力设备缺陷文本分类方法,将领域词库加入到用户词典中,对缺陷案例进行预处理,进行分词和去停用词;利用爬虫算法,收集电网故障案例的文本语料,利用Spark的word2vec进行训练,获取该领域的词向量表示;将获取的缺陷案例和词向量进行向量化表示,将缺陷案例进行文本表示,形成矩阵;将矩阵输入到SVM多分类器中,进行训练与分类,得到分类结果。
-
公开(公告)号:CN107992597A
公开(公告)日:2018-05-04
申请号:CN201711325919.8
申请日:2017-12-13
Applicant: 国网山东省电力公司电力科学研究院 , 北京邮电大学 , 国家电网公司
Abstract: 本发明公开了一种面向电网故障案例的文本结构化方法;对非结构化文本进行命名实体识别,并构建面向电网领域的实体字典来辅助实体识别和文本分词;提取属性值以及描述各属性的状态量,状态量按照类型分为数字型状态量和非数字型状态量,基于规则的方法来提取并对数字型状态量修饰属性进行匹配;将非数字型状态量进行细化,划分为基于词组形式的状态量和基于句子形式的状态量,分别提取其修饰的属性;根据识别出的属性以及对应的状态量,最终生成若干由属性和对应状态量形成的二元组,完成文本结构化。
-
公开(公告)号:CN107423344A
公开(公告)日:2017-12-01
申请号:CN201710344719.0
申请日:2017-05-16
Abstract: 本发明实施例提供了一种输变电设备状态数据的可视化方法及装置,应用于终端设备,方法包括:获取输变电设备状态数据中的文本数据、多维数据和地理数据;确定文本数据中的关键词,并确定各关键词的权重值,根据权重值的大小对各关键词进行可视化;确定多维数据的第一维度数N,将多维数据排列成N维队列,对N维队列中的数据进行可视化;确定地理数据的第二维度数M,确定M维属性信息一一对应的M个视图,在目标视图中对地理数据中的目标属性信息的数据进行可视化。本发明实施例按照数据属性信息的关联性对输变电设备状态数据分类,得到文本数据、多维数据和地理数据,然后分别对三者进行可视化,能够具体、全面的描述输变电设备的运行状态。
-
公开(公告)号:CN117250687A
公开(公告)日:2023-12-19
申请号:CN202311117186.4
申请日:2023-08-31
Applicant: 国网山东省电力公司电力科学研究院 , 国家电网有限公司 , 北京邮电大学 , 沈阳工业大学
IPC: G02B6/06
Abstract: 本发明涉及光纤像束制备术领域,公开一种光纤像束固定模具及光纤像束制备方法,该方法包括:获取光纤像束的光纤分布形状及大小,根据光纤分布形状及大小选择对应的光纤像束固定模具;将第一光纤的一端安放于光纤像束固定模具的固定槽内并使端部对齐,对第一光纤施加压力,使得第一光纤与固定槽内的光纤放置槽紧密贴合;在所有的第一光纤均安放于固定槽内后,在相邻两第一光纤之间的缝隙处安放第二光纤;在第二光纤安放完成后,通过光注胶孔注入胶水,并在胶水凝固后取下光纤像束固定模具,得到光纤像束。本发明大大增加对光纤像束组合的效率,同时减少了使用的人力资源,提高了光纤像束制备的速度,并保证了光纤像束的稳定性和合格率。
-
-
-
-
-
-
-
-
-