-
公开(公告)号:CN104881458A
公开(公告)日:2015-09-02
申请号:CN201510266108.X
申请日:2015-05-22
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F17/30
CPC classification number: G06F16/374 , G06F16/35
Abstract: 本发明公开了一种网页主题的标注方法和装置。所述方法包括:基于网页的标题和正文,获得所述网页的主题特征向量;利用预先训练获得的分类器,对所述主题特征向量进行分类处理;判断是否存在所述主题特征向量所属的类型;若是,则将所述网页标注为所述主题特征向量所属的类型;若否,则将所述网页标记为待标注网页;进一步地,对多个待标注网页进行聚类处理;分析出每个聚类集合的类型;将待标注网页标注为其所属的聚类集合的类型。本发明采用有监督的分类方法和无监督的聚类方法级联的方式,自动的从网页中获取主题并标注网页,有效提高了网页主题标注的效率和准确性。
-
公开(公告)号:CN104850947A
公开(公告)日:2015-08-19
申请号:CN201510229723.3
申请日:2015-05-07
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06Q10/06
Abstract: 本发明公开了一种网格化多业务流程统一管理方法及装置,包括:基于待处理的业务建立相应的业务处理流程,并通过业务处理流程触发与多个业务系统进行信息交互,实现业务处理流程自动与外部系统交互,从而在业务流程管理中实现与多个业务系统的自动化交互操作。
-
公开(公告)号:CN104850647A
公开(公告)日:2015-08-19
申请号:CN201510284124.1
申请日:2015-05-28
Applicant: 国家计算机网络与信息安全管理中心
CPC classification number: G06F16/951 , G06Q50/01
Abstract: 本发明公开了一种微博团体的发现方法及装置,其中,该方法包括:根据微博用户的元信息及微博内容,构建相互独立的特征信息词典;从预定时间段内用户的元信息和微博内容中分词,并基于特征信息词典和提取到的词语确定用户的兴趣特征向量;采用无监督学习方式从兴趣特征向量中确定用户团体信息。本发明实施例为不同种类的信息建立各自独立的特征信息词典,从用户一定时间段内更新的信息中分词,来与特征信息词典中的词语进行比对,进而确定用户的兴趣特征向量,再通过无监督学习方式来确定用户团体信息,通过此过程确定的用户团体信息是具有相同或相似兴趣爱好的团体,具有更准确的推广意义,传播力度大大提高,解决了现有问题。
-
-