一种基于话题的网络表示学习方法

    公开(公告)号:CN110245682B

    公开(公告)日:2021-07-27

    申请号:CN201910393542.2

    申请日:2019-05-13

    Abstract: 本发明公开了一种基于话题的网络表示学习方法,属于网络表示学习技术领域。本发明方法包括:设计一种自编码器模型,定义模型结构、输入输出数据的形式,以保留网络拓扑结构所表示的结构特征;利用网络中的结点信息对该自编码器网络模型进行扩展,提取网络中结点所包含的信息,将话题因素融入其中,以保留其所表示的语义特征,同时保留全局网络的结构特征;通过自编码器将两类特征融合到网络结点低维特征表示中,得到基于话题的网络表示学习。本发明方法结合大规模信息网络的特点和深度学习算法,从信息网络结构和结点所包含的信息特点出发,以获得更加有效的网络结点的嵌入表示。

    一种基于新闻舆情的时间序列预测方法

    公开(公告)号:CN110222149B

    公开(公告)日:2021-07-27

    申请号:CN201910412987.0

    申请日:2019-05-17

    Abstract: 本发明公开了一种基于新闻舆情的时间序列预测方法,包括:根据时序数据的时间片信息获取包含目标关键词的新闻,计算每个时间片对应新闻的舆情向量;时间序列数据和计算得到的舆情向量构成新数据集,利用卷积神经网络获取新数据集的历史长期依赖特征和历史短期依赖特征;将新数据集和获取到的历史长期依赖特征、历史短期依赖特征作为训练集,输入搭建好的LSTM网络中进行训练,训练完成后得到时间序列预测模型;将待预测的时间序列数据和对应的新闻输入到所述时间序列预测模型中进行预测,得到预测的目标信息。本发明融合实时性强的新闻来解决突发情况对时序数据的影响,同时发掘时序数据的长短期依赖特征,使得预测效果更加稳定和精确。

    一种安卓应用恶意性、恶意种族检测模型构建方法及应用

    公开(公告)号:CN111832020A

    公开(公告)日:2020-10-27

    申请号:CN202010575613.3

    申请日:2020-06-22

    Abstract: 本发明属于移动恶意应用检测领域,具体涉及一种安卓应用恶意性、恶意种族检测模型构建方法及应用,针对不同混淆技术,提取不同粒度的操作码特征,计算各种粒度下的各特征权重,以从各种操作码特征中选取对加强原始样本集检测效果和降低混淆前后样本差异性最有利的操作码特征,构建各种粒度的抗混淆特征集,以抵抗主流混淆技术,各种粒度的抗混淆特征集提取应用样本的操作码特征序列并将其转换为灰度图,基于灰度图,根据不同的标签值,训练深度学习网络模型,实现安卓应用的恶意性分类及恶意家族分类,并在移动端设备上实现检测功能集成。本发明在支持应用恶意性及恶意家族检测的同时,有效抵抗安卓应用混淆技术对检测结果的干扰,检测可靠性高。

    一种基于共现图的兴趣点推荐方法及系统

    公开(公告)号:CN107220312B

    公开(公告)日:2020-08-14

    申请号:CN201710332672.6

    申请日:2017-05-12

    Abstract: 本发明公开了一种基于共现图的兴趣点推荐方法及系统,推荐方法包含了数据收集与处理,共现图构建,相似度计算,位置因素建模,以及用户推荐五个过程。基于共现图的兴趣点推荐方法,其特征在于利用用户的签到数据构建兴趣点之间的共现图,之后基于共现图计算节点之间的两种相似性,进而根据图中节点间的相似性对用户进行兴趣点推荐。本发明使用基于兴趣点之间的相似性这一新的角度进行推荐,推荐方法充分挖掘了已有数据中的信息,解决了兴趣点推荐过程中的稀疏性,以及大规模社交网络中推荐方法的可伸缩性问题。

    一种电影票房预测模型的构建方法及电影票房预测方法

    公开(公告)号:CN111523943A

    公开(公告)日:2020-08-11

    申请号:CN202010334504.2

    申请日:2020-04-24

    Abstract: 本发明属于电影票房时间序列预测领域,具体涉及一种电影票房预测模型的构建方法及电影票房预测方法,包括:采用自注意力机制,提取历史每天对待预测电影所有评论信息的特征矩阵并将其转换为评论特征向量;对历史每天的评论特征向量和票房实际数据进行向量拼接,构建训练样本集,并采用双向编码器,得到训练样本集对应的历史票房事件特征;采用解码器,基于历史票房事件特征计算每个样本的注意力分,并基于每个样本的注意力分,计算该样本的事件特征;基于每个样本的事件特征,预测得到该样本内每天的票房预测值。本发明使用了短评论的自注意力机制以及编码器解码器模型,提取更具相关性的数据特征,有效提高电影票房预测精度。

    一种基于量化社会影响力的社交网络用户行为预测方法

    公开(公告)号:CN107341571B

    公开(公告)日:2020-05-19

    申请号:CN201710497921.7

    申请日:2017-06-27

    Abstract: 本发明公开了一种基于量化社会影响力的社交网络用户行为预测方法,该方法包括数据爬取、数据预处理、构建网络图、用户兴趣提取、用户间影响力量化、预测建模、模型训练评估。主要用于在大规模社交网络中实现对用户行为,例如社交网络如Twitter上的转推行为进行预测。同现有技术相比,本发明首先考虑量化社交网络中用户间的社会影响力,并将该量化的影响力引入到预测模型中来,使得预测模型能够充分考量一个给定用户周围的其他用户对该用户行为的影响,并且本发明从用户兴趣这一角度出发来进行用户行为的预测,通过量化的社会影响力来计算用户的兴趣,并最终由用户兴趣来推测用户的行为,具有更高的准确度。

    一种基于深度学习的用户情感分析方法

    公开(公告)号:CN107341145B

    公开(公告)日:2019-11-12

    申请号:CN201710473195.5

    申请日:2017-06-21

    Abstract: 本发明公开了一种基于深度学习的用户情感分析方法,其中,方法的实现包括数据预处理、词向量学习、文本向量学习、用户特征向量表示、用户情感分析以及模型更新。本发明方法使用用户发表的文本信息提取用户的特征向量,并基于该用户特征向量及词向量信息实现基于用户特征的文本情感分析,基于本发明不仅优化了用户特征学习的复杂程度、而且得到的用户特征向量具有更丰富的用户画像信息,使得基于该用户特征向量及词向量对文本进行情感分析时提升了情感分析的准确度及效率。

    一种感知网络流量的YARN调度方法及系统

    公开(公告)号:CN107241752B

    公开(公告)日:2019-10-25

    申请号:CN201710383829.8

    申请日:2017-05-26

    Abstract: 本发明公开了一种感知网络流量的YARN调度方法及系统,包括:节点检测节点的网络流量,周期性地将网络流量发送给资源管理器,由资源管理器记录每个节点当前的网络流量信息,收到节点汇报的网络流量信息时,对这个值进行更新,在节点移除时,删掉该节点的网络流量信息;在应用向资源管理器申请容器时,为容器设置类型,以便资源管理器能识别容器的类型;在调度方面,根据当前节点与整个集群的网络流量信息,判断出当前节点的网络流量负载情况,选择合适的应用程序分配资源。本发明提供的调度方法能均衡集群中节点的网络负载,减少MapReduce应用的执行时间。

    一种基于融合词性和语义信息的Skip-gram模型的情感分析方法

    公开(公告)号:CN108733653A

    公开(公告)日:2018-11-02

    申请号:CN201810481860.X

    申请日:2018-05-18

    Abstract: 本发明公开了一种基于融合词性和语义信息的Skip-gram模型的情感分析方法,包括:数据预处理、词性信息建模、词向量表示、语义信息建模、情感分析五个步骤。其中数据预处理包括过滤、分词、词性标注;词性信息建模包含基于上下文对词性信息建模;词向量表示模块在融合词性信息的Skip-gram模型上进行向量训练;语义信息建模模块包括融合情感语义信息的文本表示。同现有技术相比,本发明考虑了单词的词性信息及情感语义信息,且在对单词的词性信息建模和融合语义信息的基础上,充分利用单词的词性信息帮助词向量训练以及情感语义先验信息帮助文本向量的学习,使得表示的文本向量更加符合语言学特征,对于情感分析有很好的结果。

    一种基于深度学习的用户情感分析方法

    公开(公告)号:CN107341145A

    公开(公告)日:2017-11-10

    申请号:CN201710473195.5

    申请日:2017-06-21

    Abstract: 本发明公开了一种基于深度学习的用户情感分析方法,其中,方法的实现包括数据预处理、词向量学习、文本向量学习、用户特征向量表示、用户情感分析以及模型更新。本发明方法使用用户发表的文本信息提取用户的特征向量,并基于该用户特征向量及词向量信息实现基于用户特征的文本情感分析,基于本发明不仅优化了用户特征学习的复杂程度、而且得到的用户特征向量具有更丰富的用户画像信息,使得基于该用户特征向量及词向量对文本进行情感分析时提升了情感分析的准确度及效率。

Patent Agency Ranking