基于语义扩展的微博突发事件检测方法及装置

    公开(公告)号:CN106886567B

    公开(公告)日:2019-11-08

    申请号:CN201710022500.9

    申请日:2017-01-12

    Abstract: 本发明提供一种基于语义扩展的微博突发事件检测方法及装置,本发明提供的基于语义扩展的微博突发事件检测方法包括:获取与待检测的微博突发事件对应的第一关键词;根据第一关键词和第一关键词关联的词向量文件,得到微博突发事件;其中,第一关键词关联的词向量文件是采用word2vec方法对训练集中的训练词语进行训练得到的,词向量文件包括第一关键词与其它训练词语之间的语义相似度。本发明的基于语义扩展的微博突发事件检测方法及装置,通过考虑文本的语义信息来扩展事件的关键词,并通过扩展后的关键词进行微博突发事件的检测,可以准确的检测微博突发事件,避免了将同一事件分成两个微博事件,并可以进行在线检测。

    动态调整多模匹配自动机的方法和装置

    公开(公告)号:CN105740400B

    公开(公告)日:2019-08-06

    申请号:CN201610059390.9

    申请日:2016-01-27

    Abstract: 本发明提供一种动态调整多模匹配自动机的方法和装置,其中,动态调整多模匹配自动机的方法包括:根据模式集合建立多模匹配自动机;若所述模式集合发生变化,则根据所述模式集合中发生变化的模式在所述多模匹配自动机中删除或者增添与所述发生变化的模式相对应的节点,根据发生变化的模式集合更新所述多模匹配自动机中剩余的节点。本发明提供的动态调整多模匹配自动机的方法,当模式集合发生变化时,可以通过对原有自动机进行调整获得新的自动机,提高了模式匹配的效率。

    一种融合时间注意力机制的时间序列预测系统

    公开(公告)号:CN109902862A

    公开(公告)日:2019-06-18

    申请号:CN201910112901.2

    申请日:2019-02-13

    Abstract: 本发明提出一种融合时间注意力机制的时间序列预测系统,包括预处理模块,预测模块;其中预处理模块对原始记录和数据进行处理组成时序序列,所述预测模块使用编码-解码结构对时序序列进行编码并对该时间序列蕴含的所需信息和数据进行预测;所述预测模块中包括角度正则化模块,所述角度正则化模块对所述时间序列中每一个时间点数据得到的编码信息所获得的影响力权重进行调整。

    一种基于多样图注意力机制的知识图谱嵌入方法

    公开(公告)号:CN109902183A

    公开(公告)日:2019-06-18

    申请号:CN201910116419.6

    申请日:2019-02-13

    Abstract: 本发明提出一种基于多样图注意力机制的知识图谱嵌入方法,包括以下步骤:步骤1,知识图谱数据预处理,将传统知识图谱根据模型需求预处理为结构化数据;步骤2,建立实体注意力机制,所述建立实体注意力机制方式为通过使用多样图注意力机制,利用n个注意力头与自注意力在邻接图上来学习实体的向量表示;步骤3,建立关系注意力机制,所述建立关系注意力机制通过使用多样图注意力机制,利用n个注意力头与自注意力在关系图上学习实体的向量表示;步骤4,在关系图谱中进行多关系数据的建模;步骤5,模型训练,获得知识图谱中所有关系的向量化表示。

    一种基于预训练语言模型的自动文本摘要方法

    公开(公告)号:CN109885673A

    公开(公告)日:2019-06-14

    申请号:CN201910112890.8

    申请日:2019-02-13

    Abstract: 本发明提出了一种基于预训练语言模型的自动文本摘要方法,所述方法使用超大规模无监督中文语料训练复杂的深层语言模型,该模型低层网络结构可以提取保留文本的语法和结构信息,高层网络结构可以提取保留文本的语义和上下文信息,从而为自动文本摘要任务提供更加丰富的文本特征和语义信息;将预训练语言模型与编码器(Encoder)结合起来实现,充分利用预训练语言模型中的文本特征和语义信息,提供更好的语义压缩效果,提升自动文本摘要的性能;将预训练语言模型与解码器(Decoder)结合起来,在文本生成过程中不仅考虑原文中的语义,还考虑到词汇本身的语义信息,提升生成文本的可读性和与原文的关联性,提升自动文本摘要的性能。

    机器学习方法和系统
    89.
    发明授权

    公开(公告)号:CN106815644B

    公开(公告)日:2019-05-03

    申请号:CN201710061671.2

    申请日:2017-01-26

    Abstract: 本发明提供一种机器学习方法和系统。本发明提供的机器学习方法,应用于机器学习系统,所述机器学习系统包括分布式共享内存的参数服务器、主节点和多个从节点;所述参数服务器用于存储全局模型参数和全局训练数据;所述主节点用于根据全局数据处理任务,确定每个从节点的数据处理任务,所述方法包括:从节点从所述参数服务器中获取所述从节点的数据处理任务对应的第一训练数据块,并按照所述从节点的数据处理任务对所述第一训练数据块进行处理,得到第一处理数据块。本发明提供的机器学习方法和从节点,无需借助外部其他设备,就可以对训练数据进行全局数据处理。

Patent Agency Ranking