一种事件类型识别方法及装置

    公开(公告)号:CN106095928A

    公开(公告)日:2016-11-09

    申请号:CN201610409465.1

    申请日:2016-06-12

    Abstract: 本发明公开了一种事件类型识别方法及装置。该方法包括以下步骤:对训练集中所有文本进行分词、提取词性处理后训练词向量空间模型,提取文本的特征,将文本表示为特征向量;对于训练集进行事件类型聚类,训练带有类型聚类正则化项的神经网络模型;对于测试样本同样进行分析、提取词性处理,并利用已经训练好的词向量模型,得到特征表示;利用类型聚类正则化项的神经网络模型进行事件类别识别。借助于本发明的技术方案,能够利用同一群组中的类型共享信息来减轻标注数据不平衡带来的问题。

    一种网页主题的标注方法和装置

    公开(公告)号:CN104881458A

    公开(公告)日:2015-09-02

    申请号:CN201510266108.X

    申请日:2015-05-22

    CPC classification number: G06F16/374 G06F16/35

    Abstract: 本发明公开了一种网页主题的标注方法和装置。所述方法包括:基于网页的标题和正文,获得所述网页的主题特征向量;利用预先训练获得的分类器,对所述主题特征向量进行分类处理;判断是否存在所述主题特征向量所属的类型;若是,则将所述网页标注为所述主题特征向量所属的类型;若否,则将所述网页标记为待标注网页;进一步地,对多个待标注网页进行聚类处理;分析出每个聚类集合的类型;将待标注网页标注为其所属的聚类集合的类型。本发明采用有监督的分类方法和无监督的聚类方法级联的方式,自动的从网页中获取主题并标注网页,有效提高了网页主题标注的效率和准确性。

    一种微博团体的发现方法及装置

    公开(公告)号:CN104850647A

    公开(公告)日:2015-08-19

    申请号:CN201510284124.1

    申请日:2015-05-28

    CPC classification number: G06F16/951 G06Q50/01

    Abstract: 本发明公开了一种微博团体的发现方法及装置,其中,该方法包括:根据微博用户的元信息及微博内容,构建相互独立的特征信息词典;从预定时间段内用户的元信息和微博内容中分词,并基于特征信息词典和提取到的词语确定用户的兴趣特征向量;采用无监督学习方式从兴趣特征向量中确定用户团体信息。本发明实施例为不同种类的信息建立各自独立的特征信息词典,从用户一定时间段内更新的信息中分词,来与特征信息词典中的词语进行比对,进而确定用户的兴趣特征向量,再通过无监督学习方式来确定用户团体信息,通过此过程确定的用户团体信息是具有相同或相似兴趣爱好的团体,具有更准确的推广意义,传播力度大大提高,解决了现有问题。

    一种视频分类方法及装置
    80.
    发明授权

    公开(公告)号:CN109902202B

    公开(公告)日:2021-06-22

    申请号:CN201910015462.3

    申请日:2019-01-08

    Abstract: 本发明提供一种视频分类方法及装置,用以解决相关技术中基于显著性引导的分类模型的分类性能较低的问题。该方法包括:提取待分类视频的关键帧;将所述关键帧输入预先根据训练集训练得到的双路神经网络模型,得到所述视频的分类结果以及所述视频的显著图,所述训练集中包括按照视频类型进行分类的视频以及视频显著图,所述双路神经网络模型包括一路用于对所述视频进行分类的第一子神经网络以及一路用于确定所述视频的显著图的第二子神经网络;将得到的所述显著图中置信度高于第一阈值的显著图加入所述训练集;使用所述训练集中的视频显著图重新训练所述第二子神经网络,得到更新后的双路神经网络模型。本发明有效提高了视频分类的性能。

Patent Agency Ranking