一种基于隐式关联的多标签传播方法及系统

    公开(公告)号:CN110136016B

    公开(公告)日:2021-06-29

    申请号:CN201910270828.1

    申请日:2019-04-04

    Abstract: 本发明涉及一种基于隐式关联的多标签传播方法及系统。该方法包括:对给定的网络构建局部网络结构图,其中部分节点的标签信息已知,并计算概率转移矩阵;基于标签共现方法挖掘多标签之间的隐式关联信息;生成节点‑标签矩阵并初始化未知节点的标签信息;根据概率转移矩阵以及隐式关联信息对每一个未知节点的标签进行更新;基于节点‑标签矩阵计算更新停止条件;反复执行上述更新步骤直到满足更新停止条件或者达到给定的迭代次数;根据节点‑标签矩阵生成网络中未知标签信息的节点的标签信息。本发明能够更好的挖掘标签之间的关联关系,加速方法的收敛速度,从而更准确全面的分析大型网络用户的标签信息。

    一种面向深度学习训练任务的GPU内存优化方法及系统

    公开(公告)号:CN109919310B

    公开(公告)日:2021-05-18

    申请号:CN201910035753.9

    申请日:2019-01-15

    Abstract: 本发明涉及一种面向深度学习训练任务的GPU内存优化方法及系统。该方法包括:(1)设计基本换入换出操作;(2)在训练开始前首先进行静态数据采集;(3)不采取换入换出策略,先训练若干个epoches,在此期间进行动态数据采集;(4)建立换入换出策略的性能模型,并明确GPU计算、内存、PCIe通信三者之间的制约关系;(5)根据性能模型确定最优策略;(6)剩余的epoch采用最优minibatch size及其匹配的换入换出策略继续训练直至结束。本发明解决了超深神经网络模型无法训练或可训练minibatch size太小引起训练效率低的问题,能够充分利用GPU资源提升超深神经网络模型训练效率。

    一种基于注意力机制的实体关系联合抽取方法和系统

    公开(公告)号:CN109902145B

    公开(公告)日:2021-04-20

    申请号:CN201910048837.6

    申请日:2019-01-18

    Abstract: 本发明涉及一种基于注意力机制的实体关系联合抽取方法和系统。该方法的步骤包括:将训练数据中标注的实体和关系的三元组,转化为每个词对应一个预定义类型的标签的形式;将训练数据的句子中的每个词映射成对应的词向量,输入基于注意力机制的神经网络模型,并通过反向传播算法进行训练,得到标签预测模型;将需进行实体关系抽取的句子输入训练完成的标签预测模型,预测出每个词对应的标签,根据标签和三元组中每个词的对应关系,得到句子中存在的实体关系三元组。该系统包括预处理模块、模型训练模块和结果处理模块。本发明通过更有效的利用句子中的关键信息,提升了关系实体联合抽取的性能,具有良好的实用性。

    一种精确检测数据中心能效的方法及系统

    公开(公告)号:CN112070353A

    公开(公告)日:2020-12-11

    申请号:CN202010771847.5

    申请日:2020-08-04

    Abstract: 本发明公开了一种精确检测数据中心能效的方法及系统。本方法步骤包括:1)集目标数据中心在一设定测量时间范围内各设定测量时间点的数据中心总功率;2)采集该目标数据中心在该各设定测量时间点的IT设备总动态功率;所述IT设备总动态功率是指该目标数据中心的IT设备总功率中随IT设备负载动态波动的功率;3)根据公式计算该目标数据中心在每一所述设定测量时间点的有用功率比UPR;4)将各所述设定测量时间点的有用功率比UPR的平均值作为该目标数据中心在该设定测量时间范围内的能效评估值。本发明可以为数据中心能效状况提供更可靠的评估。

    基于相似子图匹配的在线马甲检测方法

    公开(公告)号:CN110458182A

    公开(公告)日:2019-11-15

    申请号:CN201910548779.3

    申请日:2019-06-24

    Abstract: 本发明提出一种基于相似子图匹配的在线马甲检测方法,包括以下步骤:利用训练数据训练分类算法,建立检测模型;根据所有被封禁账号的社交活动,构建交互网络图和兴趣网络图;将对于待检测账号,根据其社交活动,构建交互网络图和兴趣网络图;将该待检测账号与所有被封禁账号分别进行配对,组成账号对;根据相似子图匹配方法,计算每个账号对的交互网络相似度和兴趣网络相似度;将交互网络相似度和兴趣网络相似度组成特征矩阵,输入到检测模型,判断该待检测账号和封禁账号之间是否匹配,如果匹配,则该待检测账号判定为马甲账号,否则判定为正常账号。

    一种基于规则和统计学习的变形实体识别方法和装置

    公开(公告)号:CN110008307A

    公开(公告)日:2019-07-12

    申请号:CN201910048233.1

    申请日:2019-01-18

    Abstract: 本发明涉及一种基于规则和统计学习的变形实体识别方法和装置。该方法定义目标实体生成变形实体的规则,并且通过这些规则定义演绎生成算法,为每个目标实体生成大量的候选变形实体集合;利用目标实体和变形实体所在文本的上下文语义相似性,提出基于统计学习的方法来识别出上面候选变形实体集合中真正对应于目标实体的变形实体。本发明既可以找到尽可能多的变形实体,又通过识别模型保证了最终识别出的变形实体的准确性,具有良好的实用性。

    一种面向深度学习训练任务的GPU内存优化方法及系统

    公开(公告)号:CN109919310A

    公开(公告)日:2019-06-21

    申请号:CN201910035753.9

    申请日:2019-01-15

    Abstract: 本发明涉及一种面向深度学习训练任务的GPU内存优化方法及系统。该方法包括:(1)设计基本换入换出操作;(2)在训练开始前首先进行静态数据采集;(3)不采取换入换出策略,先训练若干个epoches,在此期间进行动态数据采集;(4)建立换入换出策略的性能模型,并明确GPU计算、内存、PCIe通信三者之间的制约关系;(5)根据性能模型确定最优策略;(6)剩余的epoch采用最优minibatch size及其匹配的换入换出策略继续训练直至结束。本发明解决了超深神经网络模型无法训练或可训练minibatch size太小引起训练效率低的问题,能够充分利用GPU资源提升超深神经网络模型训练效率。

    一种面向深度学习训练任务的分布式加速方法及系统

    公开(公告)号:CN109902818A

    公开(公告)日:2019-06-18

    申请号:CN201910035752.4

    申请日:2019-01-15

    Abstract: 本发明涉及一种面向深度学习训练任务的分布式加速方法及系统。该方法的步骤包括:(1)搭建分布式GPU训练集群;(2)采用换入换出策略,调节分布式GPU训练集群中单个GPU工作节点上的minibatch size;(3)根据步骤2)确定的minibatch size调整学习率;(4)采用步骤(2)和(3)确定的超参数minibatch size和学习率进行深度学习训练。本发明在不影响训练准确率的前提下,简单高效地通过减少集群间参数更新通信的次数大幅度地压缩通信时间,相较于单GPU模式,在多GPU模式下能够充分提高集群扩展效率,对超深神经网络模型的训练过程实现加速。

    一种基于多模态信息特征的不良内容过滤方法

    公开(公告)号:CN109902223A

    公开(公告)日:2019-06-18

    申请号:CN201910032064.2

    申请日:2019-01-14

    Abstract: 本发明提出了一种基于多模态信息特征的不良内容过滤方法,将本文集划分为训练集与测试集,将分词结果和关键词输入到分类算法,提取文本特征,训练分类器;将训练好的分类器用于预测测试集,得到文本分类结果;将文本集和关键词集转为图像数据,将数据图像集与文本集相对应,划分为对应的训练集与测试集,进行相似度计算,得到相似度最大值集合以及最大值对应的关键词集合,如果该关键词集合的关键词满足阈值约束,则匹配成功,则该关键词为相似度最大值对应的关键词,作为图像分类结果;对比文本分类结果与图像分类结果,根据判别条件得到最终的类别预测结果,以过滤该不良内容。

Patent Agency Ranking