-
公开(公告)号:CN106959967B
公开(公告)日:2019-11-19
申请号:CN201610018320.9
申请日:2016-01-12
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: G06F16/953 , H04L12/24 , H04L12/751
Abstract: 本发明提供了一种链路预测模型的训练方法,所述方法包括:步骤S1)对抓取网络数据进行预处理,将预处理后的网络数据提取训练集;步骤S2)对训练集构造的网络进行特征提取,将提取的特征组成特征集;所述特征包括:基于邻居的特征和基于网络游走的特征;步骤S3)对所述特征集用梯度迭代树模型进行特征转换,得到新的多维特征集;步骤S4)将特征集和新的多维特征集进行融合输入链路预测模型,训练得到所述链路预测模型的参数,从而得到训练完毕的链路预测模型。本发明的方法只需要从现有的特征集入手就能扩展特征集的数量;不需要再从网络中提取新的特征,极大地减少了特征提取难度;而且提升了模型的预测性能和鲁棒性。
-
公开(公告)号:CN107688576A
公开(公告)日:2018-02-13
申请号:CN201610633439.7
申请日:2016-08-04
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
CPC classification number: G06F16/35 , G06K9/6269 , G06K9/6273 , G06N3/0454 , G06N3/08
Abstract: 本发明公开了一种CNN-SVM模型的构建方法,所述方法包括:从社交媒体上抓取基于某一事件的所有评论和转发信息,构建训练样本集;建立包含卷积层、采样层和分类层的CNN模型,利用训练样本集训练CNN模型的各层参数;将训练好参数的CNN模型中的卷积层、采样层与SVM分类器联合在一起,构成CNN-SVM模型;将训练样本集输入CNN-SVM模型,训练SVM分类器的参数;所述CNN-SVM模型构建完成。基于CNN-SVM模型,本发明还提供了一种倾向性分类方法,并构建转发树,能够对含有转发文本的待分类评论进行准确分类。本发明的倾向性分类方法可以提高分类的正确率。
-
公开(公告)号:CN106959967A
公开(公告)日:2017-07-18
申请号:CN201610018320.9
申请日:2016-01-12
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: G06F17/30 , H04L12/24 , H04L12/751
Abstract: 本发明提供了一种链路预测模型的训练方法,所述方法包括:步骤S1)对抓取网络数据进行预处理,将预处理后的网络数据提取训练集;步骤S2)对训练集构造的网络进行特征提取,将提取的特征组成特征集;所述特征包括:基于邻居的特征和基于网络游走的特征;步骤S3)对所述特征集用梯度迭代树模型进行特征转换,得到新的多维特征集;步骤S4)将特征集和新的多维特征集进行融合输入链路预测模型,训练得到所述链路预测模型的参数,从而得到训练完毕的链路预测模型。本发明的方法只需要从现有的特征集入手就能扩展特征集的数量;不需要再从网络中提取新的特征,极大地减少了特征提取难度;而且提升了模型的预测性能和鲁棒性。
-
公开(公告)号:CN108270608B
公开(公告)日:2020-04-03
申请号:CN201710004638.6
申请日:2017-01-04
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: H04L12/24
Abstract: 本发明提供了一种链路预测模型的建立方法,所述链路预测模型包括:时序受限玻尔兹曼机模型和梯度提升决策树模型;所述方法包括:从互联网或其它多媒体中抓取大量的网络数据,对网络数据进行预处理,将网络数据划分为历史数据和现有数据,输入时序受限玻尔兹曼机模型,训练出模型参数;提取网络数据节点对的网络拓扑特征,形成特征集并输入梯度提升决策树模型,训练出模型参数;所述链路预测模型包括训练好的时序受限玻尔兹曼机模型和梯度提升决策树模型。基于该方法建立的链路预测模型,本发明还提供了一种链路预测方法,该方法能够预测网络下一状态的所有链接。
-
公开(公告)号:CN105335446A
公开(公告)日:2016-02-17
申请号:CN201410398780.X
申请日:2014-08-13
Applicant: 中国科学院声学研究所 , 北京中科信利技术有限公司
IPC: G06F17/30
Abstract: 本发明涉及一种基于词矢量的短文本分类模型生成方法,包括:采集数据,并对所采集的数据进行领域标注,将这些已标注的数据作为训练数据;对训练数据做预处理;查询词矢量词典,将训练数据中所包含的文本数据转化为向量数据,并且将所述向量数据按照领域进行分隔;对每一个领域内的向量数据采用高斯模型进行模型训练,得到高斯模型参数的最优值,从而得到该领域所对应的高斯模型;所有训练数据的各个领域所对应的高斯模型组成分类模型。
-
-
-
-