-
公开(公告)号:CN110968693A
公开(公告)日:2020-04-07
申请号:CN201911085655.2
申请日:2019-11-08
申请人: 华北电力大学 , 国家电网有限公司信息通信分公司 , 国网山东省电力公司信息通信公司 , 国家电网有限公司
IPC分类号: G06F16/35
摘要: 本发明属于计算机文本分类技术领域,尤其涉及一种基于集成学习的多标签文本分类计算方法,包括:步骤1:对原始数据集进行预处理,将句子分段成为一个个独立的单词,删除非关键词;步骤2:采用词频-逆文本频率的方式对文本进行特征提取向量化处理;步骤3:采用二元关联法将多标签学习问题分解为多个独立的二元分类问题,每个二元分类问题对应于标签空间中的一个标签;步骤4:采用集成学习算法对标签进行分类。本发明降低了时间复杂度,提高了训练速度,提高了弱学习器的泛化能力,降低了过拟合的风险,增加模型的鲁棒性。
-
公开(公告)号:CN114706883A
公开(公告)日:2022-07-05
申请号:CN202210350911.1
申请日:2022-04-02
申请人: 华北电力大学
IPC分类号: G06F16/2453 , G06F16/242 , G06F16/27 , G06F16/901
摘要: 本发明公开了一种基于摘要图垂直划分和预连接的复杂图查询优化方法,采用基于结点聚合的图摘要产生大图数据图摘要,然后对于摘要图进行垂直划分构建二元表,进而基于采用预连接技术构建三元表来表示图查询可能存在的连接方式,从而建立大图数据查询的索引;最后通过使用生成的查询统计信息对查询图进行排序和组合,来最小化查询阶段生成的中间结果,减少网络数据交换开销。本发明能够在Spark平台上实现,并进行实验验证,且结果表明针对复杂RDF查询性能优越,优于当前的一些主流RDF查询方法。
-
公开(公告)号:CN106919700B
公开(公告)日:2020-05-22
申请号:CN201710135699.6
申请日:2017-03-09
申请人: 华北电力大学
IPC分类号: G06F16/9535 , G06F16/33
摘要: 本发明公开了Web信息实时推荐领域中的基于并行化CEP处理的语义驱动犯罪线索实时推荐方法,包括:爬取指定深度的网页文本;提取爬取网页文本的正文,提取正文关键词;依据某一具体犯罪类别的术语构建语义树,将语义树与提取的关键词匹配;根据语义树编写计算总权值的CEP的事件模式;多个CEP引擎并行处理事件模式,同时对总权值进行归一化和降序排序,将排在前面的网页实时推荐给用户。本发明通过基于并行化CEP处理的语义驱动犯罪线索实时推荐方法,能够使得推荐的结果更加准确同时能够适应大数据的场景。
-
公开(公告)号:CN103020283B
公开(公告)日:2015-12-09
申请号:CN201210580666.X
申请日:2012-12-27
申请人: 华北电力大学
IPC分类号: G06F17/30
摘要: 本发明公开了信息检索技术领域中的一种基于背景知识的动态重构的语义检索方法。包括:先采用二维表给出通用领域的背景知识,利用FCA方法将其构建为概念格模型。然后把用户输入的搜索关键词作为检索属性,分析其与原有形式背景属性集的关系;如果所有检索属性属于形式背景属性集,则直接基于概念格模型进行语义检索;否则,则对领域知识的形式背景进行动态重构;进一步通过相似度计算从属性集中找出与每一个检索属性最为相似的对应替换属性,更新检索属性集;最后,利用重构后的形式背景构建新的概念格结构,并利用此结构完成基于检索属性集的语义检索。本发明通过基于背景知识的动态重构的语义检索方法,能够确保检索结果满足用户的检索要求。
-
公开(公告)号:CN109508372B
公开(公告)日:2023-05-09
申请号:CN201811223782.X
申请日:2018-10-19
申请人: 华北电力大学
IPC分类号: G06F16/35 , G06F16/36 , G06F40/289 , G06F40/30 , G06Q50/18 , G06F40/151 , G06F18/22
摘要: 本发明提供了一种基于司法领域知识抽取的高效司法文档分类方法,包括建立司法文书领域知识模型、自动化知识抽取和基于WMD的司法文档分类三个阶段;其中,自动化知识抽取包括:(a)关键词抽取;(b)关键词优先级;(c)提取出判决结果;(d)审判结果的标准化;(e)带标签的数据集;基于WMD的司法文档分类:(f)词向量表示,形成一个中文分词包;(g)词袋模型(nBOW)表示文档;(h)构建两个词之间的距离;(i)计算文档之间的距离,最后采用kNN算法进行司法文档分类。本发明的司法文档分类方法,分类准确、效率高,通过司法文书的相似性分析,实现类案推送,为司法人员提供智能辅助办案服务,可以显著提高办案的质量和效率。
-
公开(公告)号:CN104156412B
公开(公告)日:2017-10-10
申请号:CN201410368179.6
申请日:2014-07-30
申请人: 华北电力大学
IPC分类号: G06F17/30
摘要: 本发明公开了属于电能质量监测技术领域中的一种基于复杂事件处理的电能质量扰动事件分类监测方法。包括:提取原始信号的特征值并对提取的特征值进行筛选;根据筛选后的特征值确定原子事件;采用原子事件的组合形式描述复杂事件;确定复杂事件模式;采用复杂事件处理引擎检测复杂事件模式,得到复杂事件模式对应的复杂事件;根据复杂事件与分类输出结果的映射关系,确定复杂事件的分类输出结果。本发明可以对电能质量扰动事件的类型进行有效的分类,更快速、准确地监测出电能质量扰动信号。
-
公开(公告)号:CN106919700A
公开(公告)日:2017-07-04
申请号:CN201710135699.6
申请日:2017-03-09
申请人: 华北电力大学
IPC分类号: G06F17/30
摘要: 本发明公开了Web信息实时推荐领域中的基于并行化CEP处理的语义驱动犯罪线索实时推荐方法,包括:爬取指定深度的网页文本;提取爬取网页文本的正文,提取正文关键词;依据某一具体犯罪类别的术语构建语义树,将语义树与提取的关键词匹配;根据语义树编写计算总权值的CEP的事件模式;多个CEP引擎并行处理事件模式,同时对总权值进行归一化和降序排序,将排在前面的网页实时推荐给用户。本发明通过基于并行化CEP处理的语义驱动犯罪线索实时推荐方法,能够使得推荐的结果更加准确同时能够适应大数据的场景。
-
公开(公告)号:CN104156412A
公开(公告)日:2014-11-19
申请号:CN201410368179.6
申请日:2014-07-30
申请人: 华北电力大学
IPC分类号: G06F17/30
摘要: 本发明公开了属于电能质量监测技术领域中的一种基于复杂事件处理的电能质量扰动事件分类监测方法。包括:提取原始信号的特征值并对提取的特征值进行筛选;根据筛选后的特征值确定原子事件;采用原子事件的组合形式描述复杂事件;确定复杂事件模式;采用复杂事件处理引擎检测复杂事件模式,得到复杂事件模式对应的复杂事件;根据复杂事件与分类输出结果的映射关系,确定复杂事件的分类输出结果。本发明可以对电能质量扰动事件的类型进行有效的分类,更快速、准确地监测出电能质量扰动信号。
-
公开(公告)号:CN103020283A
公开(公告)日:2013-04-03
申请号:CN201210580666.X
申请日:2012-12-27
申请人: 华北电力大学
IPC分类号: G06F17/30
摘要: 本发明公开了信息检索技术领域中的一种基于背景知识的动态重构的语义检索方法。包括:先采用二维表给出通用领域的背景知识,利用FCA方法将其构建为概念格模型。然后把用户输入的搜索关键词作为检索属性,分析其与原有形式背景属性集的关系;如果所有检索属性属于形式背景属性集,则直接基于概念格模型进行语义检索;否则,则对领域知识的形式背景进行动态重构;进一步通过相似度计算从属性集中找出与每一个检索属性最为相似的对应替换属性,更新检索属性集;最后,利用重构后的形式背景构建新的概念格结构,并利用此结构完成基于检索属性集的语义检索。本发明通过基于背景知识的动态重构的语义检索方法,能够确保检索结果满足用户的检索要求。
-
公开(公告)号:CN110597983B
公开(公告)日:2023-09-15
申请号:CN201910675336.0
申请日:2019-07-25
申请人: 华北电力大学
IPC分类号: G06F16/35
摘要: 本发明属于计算机文本分类技术领域,尤其涉及一种基于类别嵌入的层次化文本分类计算方法,包括:步骤1:采用图嵌入算法SDNE对文本类别层次树中每个节点进行编码得到类别嵌入向量;步骤2:采用对前向GRU与后向GRU的最后一个隐藏状态进行拼接的方式来对文本进行编码,得到文本向量;步骤3:将文本向量表示与类别嵌入向量进行拼接,得到新的文本表示;步骤4:采用多层感知器和SoftMax层基于文本表示对文本进行分类,输出分类结果。实验证明本发明大大的降低了子模型的数量,同时提高分类准确率。
-
-
-
-
-
-
-
-
-