-
公开(公告)号:CN106886567B
公开(公告)日:2019-11-08
申请号:CN201710022500.9
申请日:2017-01-12
Applicant: 北京航空航天大学
IPC: G06F16/33 , G06F16/35 , G06F16/335
Abstract: 本发明提供一种基于语义扩展的微博突发事件检测方法及装置,本发明提供的基于语义扩展的微博突发事件检测方法包括:获取与待检测的微博突发事件对应的第一关键词;根据第一关键词和第一关键词关联的词向量文件,得到微博突发事件;其中,第一关键词关联的词向量文件是采用word2vec方法对训练集中的训练词语进行训练得到的,词向量文件包括第一关键词与其它训练词语之间的语义相似度。本发明的基于语义扩展的微博突发事件检测方法及装置,通过考虑文本的语义信息来扩展事件的关键词,并通过扩展后的关键词进行微博突发事件的检测,可以准确的检测微博突发事件,避免了将同一事件分成两个微博事件,并可以进行在线检测。
-
公开(公告)号:CN105740400B
公开(公告)日:2019-08-06
申请号:CN201610059390.9
申请日:2016-01-27
Applicant: 北京航空航天大学
IPC: G06F16/903
Abstract: 本发明提供一种动态调整多模匹配自动机的方法和装置,其中,动态调整多模匹配自动机的方法包括:根据模式集合建立多模匹配自动机;若所述模式集合发生变化,则根据所述模式集合中发生变化的模式在所述多模匹配自动机中删除或者增添与所述发生变化的模式相对应的节点,根据发生变化的模式集合更新所述多模匹配自动机中剩余的节点。本发明提供的动态调整多模匹配自动机的方法,当模式集合发生变化时,可以通过对原有自动机进行调整获得新的自动机,提高了模式匹配的效率。
-
公开(公告)号:CN110008967A
公开(公告)日:2019-07-12
申请号:CN201910276931.7
申请日:2019-04-08
Applicant: 北京航空航天大学
Abstract: 本申请公开了一种融合结构和语义模态的行为表征方法和系统,所述方法包括:对原始数据进行处理,得到多个子图;对所述多个子图分别进行数据结构化处理,将处理得到的结构化数据输入神经网络中进行训练,得到每个子图的输出结果;对所述每个子图的输出结果进行合并。
-
公开(公告)号:CN109977219A
公开(公告)日:2019-07-05
申请号:CN201910207415.9
申请日:2019-03-19
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
Abstract: 本发明公开了基于启发式规则的文本摘要自动生成方法,包括:S1、以文本的段落、句子顺序作为启发式语序,将新闻正文分为开始段落、中间段落和结尾段落,并以句子和片段为粒度对各段落进行启发式分割;S2、先以句子为粒度,分别抽取各段落的目标句子,得到各段落的句子摘要集合,再以所述句子摘要集合中的片段为粒度,分别抽取各段落的目标片段,得到各段落的片段摘要集合;S3、去除所述片段摘要集合中的冗余片段,将筛选出的片段按照片段出现的顺序组合,生成文本摘要。以及,基于启发式规则的文本摘要自动生成装置。采用本发明的方法生成的文本摘要的句子组织连贯性好,可读性强。
-
-
公开(公告)号:CN109902183A
公开(公告)日:2019-06-18
申请号:CN201910116419.6
申请日:2019-02-13
Applicant: 北京航空航天大学
IPC: G06F16/36
Abstract: 本发明提出一种基于多样图注意力机制的知识图谱嵌入方法,包括以下步骤:步骤1,知识图谱数据预处理,将传统知识图谱根据模型需求预处理为结构化数据;步骤2,建立实体注意力机制,所述建立实体注意力机制方式为通过使用多样图注意力机制,利用n个注意力头与自注意力在邻接图上来学习实体的向量表示;步骤3,建立关系注意力机制,所述建立关系注意力机制通过使用多样图注意力机制,利用n个注意力头与自注意力在关系图上学习实体的向量表示;步骤4,在关系图谱中进行多关系数据的建模;步骤5,模型训练,获得知识图谱中所有关系的向量化表示。
-
公开(公告)号:CN109885673A
公开(公告)日:2019-06-14
申请号:CN201910112890.8
申请日:2019-02-13
Applicant: 北京航空航天大学
Abstract: 本发明提出了一种基于预训练语言模型的自动文本摘要方法,所述方法使用超大规模无监督中文语料训练复杂的深层语言模型,该模型低层网络结构可以提取保留文本的语法和结构信息,高层网络结构可以提取保留文本的语义和上下文信息,从而为自动文本摘要任务提供更加丰富的文本特征和语义信息;将预训练语言模型与编码器(Encoder)结合起来实现,充分利用预训练语言模型中的文本特征和语义信息,提供更好的语义压缩效果,提升自动文本摘要的性能;将预训练语言模型与解码器(Decoder)结合起来,在文本生成过程中不仅考虑原文中的语义,还考虑到词汇本身的语义信息,提升生成文本的可读性和与原文的关联性,提升自动文本摘要的性能。
-
公开(公告)号:CN109885670A
公开(公告)日:2019-06-14
申请号:CN201910112764.2
申请日:2019-02-13
Applicant: 北京航空航天大学
IPC: G06F16/332 , G06F16/36
Abstract: 本发明提出一种面向话题文本的交互注意力编码情感分析方法,步骤1,对话题文本进行预处理;步骤2,进行话题文本编码;步骤3,话题对象与话题文本的交互式注意力机制编码;步骤4,情感分类模型训练;步骤5,情感预测,对话题对象进行情感分析,得到适应模型装置参数的最佳情感类别。
-
公开(公告)号:CN106815644B
公开(公告)日:2019-05-03
申请号:CN201710061671.2
申请日:2017-01-26
Applicant: 北京航空航天大学
IPC: G06N20/00
Abstract: 本发明提供一种机器学习方法和系统。本发明提供的机器学习方法,应用于机器学习系统,所述机器学习系统包括分布式共享内存的参数服务器、主节点和多个从节点;所述参数服务器用于存储全局模型参数和全局训练数据;所述主节点用于根据全局数据处理任务,确定每个从节点的数据处理任务,所述方法包括:从节点从所述参数服务器中获取所述从节点的数据处理任务对应的第一训练数据块,并按照所述从节点的数据处理任务对所述第一训练数据块进行处理,得到第一处理数据块。本发明提供的机器学习方法和从节点,无需借助外部其他设备,就可以对训练数据进行全局数据处理。
-
公开(公告)号:CN105491117B
公开(公告)日:2018-12-21
申请号:CN201510844913.6
申请日:2015-11-26
Applicant: 北京航空航天大学
Abstract: 本发明提供一种面向实时数据分析的流式图数据处理系统及方法。该系统包括:原始数据分析器、热点检测器、热点负载均衡器、协同调度器和N个计算分区。本发明提供的面向实时数据分析的流式图数据处理系统及方法,由于对图更新数据进行了热点检测与热点数据迁移,避免了不同计算分区的计算倾斜,因此保证了数据处理的高效性。
-
-
-
-
-
-
-
-
-