-
公开(公告)号:CN105095275B
公开(公告)日:2019-04-05
申请号:CN201410200769.8
申请日:2014-05-13
Applicant: 中国科学院自动化研究所 , 腾讯科技(深圳)有限公司
IPC: G06F16/35
Abstract: 本发明公开了一种文档聚类的方法及装置,属于统计技术领域。方法包括:根据检索词‑文档矩阵、非负检索词‑主题矩阵、非负主题‑文档矩阵、正则化的非负检索词‑主题矩阵及正则化的非负主题‑文档矩阵确定目标函数;根据使目标函数最小化的非负检索词‑主题矩阵及非负主题‑文档矩阵对待聚类的文档进行聚类。本发明通过根据检索词‑文档矩阵、非负检索词‑主题矩阵、非负主题‑文档矩阵、正则化的非负检索词‑主题矩阵及正则化的非负主题‑文档矩阵确定目标函数,并根据使目标函数最小化的非负检索词‑主题矩阵及非负主题‑文档矩阵对待聚类的文档进行聚类,由于检索词‑主题矩阵及主题‑文档矩阵均非负,使得文档聚类的效率较高。
-
公开(公告)号:CN104199829B
公开(公告)日:2017-07-04
申请号:CN201410361587.9
申请日:2014-07-25
Applicant: 中国科学院自动化研究所 , 腾讯科技(深圳)有限公司
IPC: G06F17/30
Abstract: 本发明提供了一种情感数据分类方法和系统,所述方法包括:构造训练数据集对应的文档‑文档图和词‑词图,所述文档‑文档图中,节点表示所述训练数据集中的文档,边的几何信息表示文档之间的相关度,所述词‑词图中,节点表示所述训练数据集中的词,边的几何信息表示词之间的相关度;根据所述文档‑文档图和词‑词图的几何信息构造目标函数中的基于图的正则化项;对所述目标函数进行优化处理,输出文档‑情感矩阵;获取测试数据集中的文档,根据所述文档‑情感矩阵获取与所述测试数据集中的文档对应的情感倾向。采用该方法和系统,能够提高情感分类精度。
-
公开(公告)号:CN105046514B
公开(公告)日:2017-05-17
申请号:CN201510362231.1
申请日:2015-06-26
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F17/30
CPC classification number: G06Q30/0256 , G06Q30/0254 , G06Q30/0269 , G06Q50/01 , H04L65/403 , H04N21/252
Abstract: 本发明实施例公开了一种推广信息的处理方法、装置和系统;本发明实施例采用获取预置期间内所有推广信息的合约信息和曝光需求,根据该合约信息和曝光需求确定定向投放目标,并将该定向投放目标拆分为多个不相交的投放目标集合,然后根据该曝光需求将推广信息投放至相应的投放目标集合所对应的用户,在投放的过程中,实时统计该投放的推广信息的社交传播量,并根据该社交传播量对曝光参数进行校正,以对该推广信息的投放进行实时调整;该方案可以提高推广信息投放的有效性和准确性。
-
公开(公告)号:CN105095277A
公开(公告)日:2015-11-25
申请号:CN201410201027.7
申请日:2014-05-13
Applicant: 中国科学院自动化研究所 , 腾讯科技(深圳)有限公司
Abstract: 本发明公开了一种跨领域观点数据的分类方法和装置,属于互联网技术领域。方法包括:根据源领域和目标领域的共享话题获取共享话题矩阵,并根据源领域的领域特定话题和目标领域的特定话题分别获取源领域的领域特定话题矩阵和目标领域的领域特定话题矩阵;确定源领域的目标函数,并确定目标领域的目标函数;根据源领域的目标函数和目标领域的目标函数确定总目标函数;确定总目标函数中各个参数的收敛值,根据总目标函数中各个参数的收敛值获取分类函数;根据分类函数对目标领域的观点数据进行分类。本发明通过共享话题矩阵获取的分类函数对跨领域观点数据进行分类,由于共享话题矩阵可以减小不同领域的差距,因而提高了对跨领域观点数据分类的精度。
-
公开(公告)号:CN105046514A
公开(公告)日:2015-11-11
申请号:CN201510362231.1
申请日:2015-06-26
Applicant: 腾讯科技(深圳)有限公司
IPC: G06Q30/02
CPC classification number: G06Q30/0256 , G06Q30/0254 , G06Q30/0269 , G06Q50/01 , H04L65/403 , H04N21/252
Abstract: 本发明实施例公开了一种推广信息的处理方法、装置和系统;本发明实施例采用获取预置期间内所有推广信息的合约信息和曝光需求,根据该合约信息和曝光需求确定定向投放目标,并将该定向投放目标拆分为多个不相交的投放目标集合,然后根据该曝光需求将推广信息投放至相应的投放目标集合所对应的用户,在投放的过程中,实时统计该投放的推广信息的社交传播量,并根据该社交传播量对曝光参数进行校正,以对该推广信息的投放进行实时调整;该方案可以提高推广信息投放的有效性和准确性。
-
公开(公告)号:CN105046366A
公开(公告)日:2015-11-11
申请号:CN201510456763.1
申请日:2015-07-29
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本发明公开了一种模型训练方法及装置,属于计算机技术领域。所述方法包括:构造代价函数为非凸函数的模型;获取训练样本集,所述训练样本集包括用于训练所述模型的各个训练样本,每个训练样本包括用户特征、内容特征和用户对内容所采取的实际行为所对应的操作值;根据所述训练样本集对所述模型进行训练,得到n个候选模型,n为大于1的正整数;将所述n个候选模型中质量最好的候选模型确定为本次训练得到的预估模型。本发明解决了代价函数为非凸函数的预估模型的模型质量波动大的问题,达到了提高最终训练得到的预估模型的模型质量的效果。
-
公开(公告)号:CN104239402A
公开(公告)日:2014-12-24
申请号:CN201410353033.4
申请日:2014-07-23
Applicant: 中国科学院自动化研究所 , 腾讯科技(深圳)有限公司
IPC: G06F17/30
CPC classification number: G06F17/30675 , G06F17/30693
Abstract: 本发明公开了一种文档查询方法及装置,属于数据查询领域。所述方法包括:通过获取待查询的文档q和该文档q对应的类别Cp;通过与类别Cp对应的词-主题矩阵将该文档q变换到主题空间上的最优表示形式vq;根据vq在与类别Cp对应的主题-文档矩阵Vp中查询与该文档q相似的历史文档;其中,词-主题矩阵和主题-文档矩阵Vp是预先对各个历史文档按照不同类别进行组非负矩阵分解所得到的矩阵;本发明解决了目前查询方法所查询到的历史文档的结果不一定符合用户预期的问题;达到了通过词-主题矩阵和主题-文档矩阵Vp来进行文档查询,提高了查询的准确率,优化了文档查询的结果。
-
公开(公告)号:CN104199829A
公开(公告)日:2014-12-10
申请号:CN201410361587.9
申请日:2014-07-25
Applicant: 中国科学院自动化研究所 , 腾讯科技(深圳)有限公司
IPC: G06F17/30
CPC classification number: G06F17/30864 , G06K9/6267
Abstract: 本发明提供了一种情感数据分类方法和系统,所述方法包括:构造训练数据集对应的文档-文档图和词-词图,所述文档-文档图中,节点表示所述训练数据集中的文档,边的几何信息表示文档之间的相关度,所述词-词图中,节点表示所述训练数据集中的词,边的几何信息表示词之间的相关度;根据所述文档-文档图和词-词图的几何信息构造目标函数中的基于图的正则化项;对所述目标函数进行优化处理,输出文档-情感矩阵;获取测试数据集中的文档,根据所述文档-情感矩阵获取与所述测试数据集中的文档对应的情感倾向。采用该方法和系统,能够提高情感分类精度。
-
公开(公告)号:CN108304431B
公开(公告)日:2021-11-09
申请号:CN201710447392.X
申请日:2017-06-14
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/583 , G06F16/51
Abstract: 本发明公开了一种图像检索方法及装置、设备、存储介质,其中,所述方法包括:前台进程接收请求侧设备发送的图像检索请求;根据所述图像检索请求中的所述待审核图像的属性确定所述待审核图像的图像特征;加载后台进程建立和维护的图像索引库并根据所述图像特征查询所述图像索引库,得到检索结果,所述检索结果包括满足预设条件的图像的属性;将所述检索结果作为图像检索响应发送给业务请求侧设备。
-
公开(公告)号:CN108229687B
公开(公告)日:2021-08-24
申请号:CN201611155183.X
申请日:2016-12-14
Applicant: 腾讯科技(深圳)有限公司
IPC: G06N20/00
Abstract: 本发明公开一种数据处理方法,包括:分别加载不同的训练数据集合至多个GPU;控制多个GPU并行对接收到的训练数据集合进行训练,并将反向过程中产生的修正参数存储至各自的显存;在控制多个GPU并行对接收到的训练数据集合进行训练过程中,控制多个GPU对其训练产生且未经交换的修正参数进行交换处理。基于本发明公开的数据处理方法,当多个GPU完成针对训练数据集合的训练时,每个GPU训练产生的修正参数中的部分修正参数已经交换至其他的GPU,能够缩短多个GPU的等待时间,从而缩短每一轮训练所消耗的时间,进而缩短完成整个深度学习训练所消耗的时间,提高设备的加速比。本发明还公开了相应的数据处理装置及电子设备。
-
-
-
-
-
-
-
-
-