基于电影字幕信息提升电影推荐系统性能的方法

    公开(公告)号:CN109902169B

    公开(公告)日:2021-03-30

    申请号:CN201910076649.4

    申请日:2019-01-26

    Abstract: 本发明公开了基于电影字幕信息提升电影推荐系统性能的方法,该方法的步骤如下:步骤(1)获取电影推荐数据集MovieLens‑Latest;步骤(2)建立字幕数据集;步骤(3)字幕主题提取;步骤(4)推荐模型训练;步骤(5)电影评分预测本方法在矩阵分解的方法的基础之上,利用电影字幕文本提取电影的主题分布,使用电影主题分布向量作为电影的特征信息来解决稀疏性以及冷启动问题。实验结果表明,使用了电影字幕信息的电影推荐系统性能相比于原来的推荐系统性能提升明显。

    基于背景知识的讽刺检测方法

    公开(公告)号:CN111159405A

    公开(公告)日:2020-05-15

    申请号:CN201911387640.1

    申请日:2019-12-27

    Inventor: 杜宇 李童 杨震

    Abstract: 本发明公开了一种基于背景知识的讽刺检测方法,该方法步骤如下:步骤(1)获取讽刺文本数据集SARC;步骤(2)数据预处理;步骤(3)提取目标文本中的实体并构建实体列表;步骤(4)构建背景知识并获取背景知识的句向量;步骤(5)训练讽刺检测模型;步骤(6)预测讽刺文本。本方法利用百科搜索引擎构建与数据集文本相关的背景知识,通过加入相关的背景知识来解决文本是否为讽刺的二分类问题。采用深度学习方法对文本进行分类。实验结果表明,加入相关的背景知识对文本的讽刺检测性能有明显的提升。

    基于稀疏学习的突发事件摘要抽取方法

    公开(公告)号:CN106484797B

    公开(公告)日:2020-01-10

    申请号:CN201610841942.1

    申请日:2016-09-22

    Inventor: 杨震 姚应哲

    Abstract: 本发明公开一种基于稀疏学习理论的突发事件摘要抽取方法,包括:获取突发事件话题,对每个突发事件话题进行查询扩展,得到事件话题的扩展话题词项集合;根据每个事件查询扩展后的扩展话题词项对每个事件进行检索,获得与每个事件话题相关的文档集合;利用非负矩阵分解的方法依次对每个话题的文档集合进行特征选取和语义聚类,得到每个事件的话题聚类结果;根据最大边缘相关性方法(MMR),从聚类结果中抽取具有代表性的句子作为最终的摘要结果。采用本发明的技术方案,在突发事件爆发时,面对海量冗余的新闻报道流,为用户提供事件发展的最新状况信息。

    一种基于非负矩阵分解的智能电网数据分解方法

    公开(公告)号:CN108197425B

    公开(公告)日:2019-09-03

    申请号:CN201810052322.9

    申请日:2018-01-19

    Inventor: 杨震 何通海

    Abstract: 本发明公开一种基于非负矩阵分解的智能电网数据分解的方法,在非负矩阵分解算法的基础上,引入了用户间相似性的特征,提高算法的性能,使分解结果更加接近用户的实际用电信息,为用户提供更加精准的反馈。实验结果辨明,该方法与已有的方法对比,性能有明显的提升。

    基于电影字幕信息提升电影推荐系统性能的方法

    公开(公告)号:CN109902169A

    公开(公告)日:2019-06-18

    申请号:CN201910076649.4

    申请日:2019-01-26

    Abstract: 本发明公开了基于电影字幕信息提升电影推荐系统性能的方法,该方法的步骤如下:步骤(1)获取电影推荐数据集MovieLens-Latest;步骤(2)建立字幕数据集;步骤(3)字幕主题提取;步骤(4)推荐模型训练;步骤(5)电影评分预测本方法在矩阵分解的方法的基础之上,利用电影字幕文本提取电影的主题分布,使用电影主题分布向量作为电影的特征信息来解决稀疏性以及冷启动问题。实验结果表明,使用了电影字幕信息的电影推荐系统性能相比于原来的推荐系统性能提升明显。

    一种基于超限学习机的相关反馈方法

    公开(公告)号:CN105426447B

    公开(公告)日:2019-02-01

    申请号:CN201510757225.6

    申请日:2015-11-09

    Abstract: 一种基于超限学习机的相关反馈方法,本发明输入一副查询图像;对图像进行检索,得到检索结果,让用户对结果进行标记;对标记过的图像分别提取SIFT特征,Color特征,和LBP特征;利用三种特征训练三个基础分类器;将检索图库的图像分别放入三个基分类器当中,根据预测结果进行投票,对每一副未标记图片进行自动标记;重新训练更新分类器;对图库图片进行分类;返回结果。本发明建立在超限学习机的基础上,通过引入人类的查询意图,进行人机交互,有效的利用未标记图库图像来丰富学习数据,可以使图像反馈的精度大大提高,并且处理速度得到很好的控制,使图像在计算机中的表达更符合人类对图像语义的理解,使本发明具有良好的反馈效果。

    基于聚类信息的高相关微博检索方法

    公开(公告)号:CN108334573A

    公开(公告)日:2018-07-27

    申请号:CN201810057738.X

    申请日:2018-01-22

    Inventor: 杨震 王凯

    CPC classification number: G06F16/3338 G06F16/3331 G06F16/35 G06F16/9032

    Abstract: 基于聚类信息的高相关微博检索方法,属于数据挖掘领域。微博检索旨在找出相关,有价值且及时的内容。但微博的检索受到短文本问题的影响,导致模型不可靠。为解决这一问题,本文提出了一种新的方法。人们认为,短文本和查询之间的语言鸿沟使分类任务不满意。在此基础上,提出了一种基于聚类信息的检索模型。我们进行了一系列的实验,以评估提出的框架在语料库中的有效性。实验结果表明,与基线标准相比,该方法在微博检索中是有效的。

    基于超限学习机自编码的运动想象脑电信号特征的提取方法

    公开(公告)号:CN104799852B

    公开(公告)日:2018-05-08

    申请号:CN201510256463.9

    申请日:2015-05-19

    Abstract: 本发明公开了基于超限学习机自编码的运动想象脑电信号特征的提取方法,包括:筛选训练数据集和测试数据集;利用训练数据集训练多个超限学习机模型;从多个经训练数据集训练后的超限学习机模型中,筛选出对测试数据集的分类正确率最高的超限学习机模型;利用筛选出的超限学习机计算待测脑电信号数据的输出权重矩阵;计算待测脑电信号数据的输出权重矩阵的奇异值,该奇异值即为待测脑电信号数据的数据特征。在使用相同分类器的前提下,本发明公开的方法提取的脑电信号特征数据的分类准确率高达86.69%,比利用传统的分类方法高出10.24%。

    一种基于深度学习的图像哈希索引构建方法

    公开(公告)号:CN106503106A

    公开(公告)日:2017-03-15

    申请号:CN201610905518.9

    申请日:2016-10-17

    Abstract: 本发明公开了一种基于深度学习的图像哈希索引构建方法,属于图像检索技术领域。该方法首先划分图像数据集得到测试样本集、训练样本集和图像库,然后充分利用深度学习模型提取出的深度特征对图像语义具有很好表达能力这一特点,构建出两个深度卷积网络结构不同的深度哈希网络模型,然后将测试样本集合图像库中的每幅图像分别经两个模型的前向传播计算出对应的两组初始哈希码,再对同一幅图像的两组初始哈希码拼接融合后作为该图的融合哈希码,通过计算查询图像和图像库中每幅图像的融合哈希码间的汉明距离,并将距离按从小到大的顺序排列,得到相似图像检索结果。本发明使得对大规模图像的检索更准确有效。

Patent Agency Ranking