文档聚类的方法及装置
    1.
    发明授权

    公开(公告)号:CN105095275B

    公开(公告)日:2019-04-05

    申请号:CN201410200769.8

    申请日:2014-05-13

    Inventor: 周光有 薛伟 管刚

    Abstract: 本发明公开了一种文档聚类的方法及装置,属于统计技术领域。方法包括:根据检索词‑文档矩阵、非负检索词‑主题矩阵、非负主题‑文档矩阵、正则化的非负检索词‑主题矩阵及正则化的非负主题‑文档矩阵确定目标函数;根据使目标函数最小化的非负检索词‑主题矩阵及非负主题‑文档矩阵对待聚类的文档进行聚类。本发明通过根据检索词‑文档矩阵、非负检索词‑主题矩阵、非负主题‑文档矩阵、正则化的非负检索词‑主题矩阵及正则化的非负主题‑文档矩阵确定目标函数,并根据使目标函数最小化的非负检索词‑主题矩阵及非负主题‑文档矩阵对待聚类的文档进行聚类,由于检索词‑主题矩阵及主题‑文档矩阵均非负,使得文档聚类的效率较高。

    情感数据分类方法和系统

    公开(公告)号:CN104199829B

    公开(公告)日:2017-07-04

    申请号:CN201410361587.9

    申请日:2014-07-25

    Abstract: 本发明提供了一种情感数据分类方法和系统,所述方法包括:构造训练数据集对应的文档‑文档图和词‑词图,所述文档‑文档图中,节点表示所述训练数据集中的文档,边的几何信息表示文档之间的相关度,所述词‑词图中,节点表示所述训练数据集中的词,边的几何信息表示词之间的相关度;根据所述文档‑文档图和词‑词图的几何信息构造目标函数中的基于图的正则化项;对所述目标函数进行优化处理,输出文档‑情感矩阵;获取测试数据集中的文档,根据所述文档‑情感矩阵获取与所述测试数据集中的文档对应的情感倾向。采用该方法和系统,能够提高情感分类精度。

    跨领域观点数据的分类方法和装置

    公开(公告)号:CN105095277A

    公开(公告)日:2015-11-25

    申请号:CN201410201027.7

    申请日:2014-05-13

    Abstract: 本发明公开了一种跨领域观点数据的分类方法和装置,属于互联网技术领域。方法包括:根据源领域和目标领域的共享话题获取共享话题矩阵,并根据源领域的领域特定话题和目标领域的特定话题分别获取源领域的领域特定话题矩阵和目标领域的领域特定话题矩阵;确定源领域的目标函数,并确定目标领域的目标函数;根据源领域的目标函数和目标领域的目标函数确定总目标函数;确定总目标函数中各个参数的收敛值,根据总目标函数中各个参数的收敛值获取分类函数;根据分类函数对目标领域的观点数据进行分类。本发明通过共享话题矩阵获取的分类函数对跨领域观点数据进行分类,由于共享话题矩阵可以减小不同领域的差距,因而提高了对跨领域观点数据分类的精度。

    模型训练方法及装置
    6.
    发明公开

    公开(公告)号:CN105046366A

    公开(公告)日:2015-11-11

    申请号:CN201510456763.1

    申请日:2015-07-29

    Abstract: 本发明公开了一种模型训练方法及装置,属于计算机技术领域。所述方法包括:构造代价函数为非凸函数的模型;获取训练样本集,所述训练样本集包括用于训练所述模型的各个训练样本,每个训练样本包括用户特征、内容特征和用户对内容所采取的实际行为所对应的操作值;根据所述训练样本集对所述模型进行训练,得到n个候选模型,n为大于1的正整数;将所述n个候选模型中质量最好的候选模型确定为本次训练得到的预估模型。本发明解决了代价函数为非凸函数的预估模型的模型质量波动大的问题,达到了提高最终训练得到的预估模型的模型质量的效果。

    文档查询方法及装置
    7.
    发明公开

    公开(公告)号:CN104239402A

    公开(公告)日:2014-12-24

    申请号:CN201410353033.4

    申请日:2014-07-23

    CPC classification number: G06F17/30675 G06F17/30693

    Abstract: 本发明公开了一种文档查询方法及装置,属于数据查询领域。所述方法包括:通过获取待查询的文档q和该文档q对应的类别Cp;通过与类别Cp对应的词-主题矩阵将该文档q变换到主题空间上的最优表示形式vq;根据vq在与类别Cp对应的主题-文档矩阵Vp中查询与该文档q相似的历史文档;其中,词-主题矩阵和主题-文档矩阵Vp是预先对各个历史文档按照不同类别进行组非负矩阵分解所得到的矩阵;本发明解决了目前查询方法所查询到的历史文档的结果不一定符合用户预期的问题;达到了通过词-主题矩阵和主题-文档矩阵Vp来进行文档查询,提高了查询的准确率,优化了文档查询的结果。

    情感数据分类方法和系统

    公开(公告)号:CN104199829A

    公开(公告)日:2014-12-10

    申请号:CN201410361587.9

    申请日:2014-07-25

    CPC classification number: G06F17/30864 G06K9/6267

    Abstract: 本发明提供了一种情感数据分类方法和系统,所述方法包括:构造训练数据集对应的文档-文档图和词-词图,所述文档-文档图中,节点表示所述训练数据集中的文档,边的几何信息表示文档之间的相关度,所述词-词图中,节点表示所述训练数据集中的词,边的几何信息表示词之间的相关度;根据所述文档-文档图和词-词图的几何信息构造目标函数中的基于图的正则化项;对所述目标函数进行优化处理,输出文档-情感矩阵;获取测试数据集中的文档,根据所述文档-情感矩阵获取与所述测试数据集中的文档对应的情感倾向。采用该方法和系统,能够提高情感分类精度。

    一种图像检索方法及装置、设备、存储介质

    公开(公告)号:CN108304431B

    公开(公告)日:2021-11-09

    申请号:CN201710447392.X

    申请日:2017-06-14

    Abstract: 本发明公开了一种图像检索方法及装置、设备、存储介质,其中,所述方法包括:前台进程接收请求侧设备发送的图像检索请求;根据所述图像检索请求中的所述待审核图像的属性确定所述待审核图像的图像特征;加载后台进程建立和维护的图像索引库并根据所述图像特征查询所述图像索引库,得到检索结果,所述检索结果包括满足预设条件的图像的属性;将所述检索结果作为图像检索响应发送给业务请求侧设备。

    数据处理方法、数据处理装置及电子设备

    公开(公告)号:CN108229687B

    公开(公告)日:2021-08-24

    申请号:CN201611155183.X

    申请日:2016-12-14

    Abstract: 本发明公开一种数据处理方法,包括:分别加载不同的训练数据集合至多个GPU;控制多个GPU并行对接收到的训练数据集合进行训练,并将反向过程中产生的修正参数存储至各自的显存;在控制多个GPU并行对接收到的训练数据集合进行训练过程中,控制多个GPU对其训练产生且未经交换的修正参数进行交换处理。基于本发明公开的数据处理方法,当多个GPU完成针对训练数据集合的训练时,每个GPU训练产生的修正参数中的部分修正参数已经交换至其他的GPU,能够缩短多个GPU的等待时间,从而缩短每一轮训练所消耗的时间,进而缩短完成整个深度学习训练所消耗的时间,提高设备的加速比。本发明还公开了相应的数据处理装置及电子设备。

Patent Agency Ranking