-
公开(公告)号:CN107122411B
公开(公告)日:2020-08-14
申请号:CN201710199300.0
申请日:2017-03-29
Applicant: 浙江大学
IPC: G06F16/9535 , G06K9/62
Abstract: 本发明公开了一种基于离散多视图哈希的协同过滤推荐方法,包括如下步骤:1)根据不同视图下的数据构建数据的多视图锚点图表示;2)结合协同过滤和锚点图,得到学习模型;3)对得到的学习模型进行求解,得到用户与物品对应的二进制哈希编码;4)利用得到的哈希编码进行最邻近搜索,计算特定用户对候选物品的偏好程度,返回偏好程度最大的若干个物品作为推荐结果。本发明将不同视图下的数据进行了整合,在求解的时候始终保持编码的离散特性,提高了推荐结果的质量。同时利用哈希编码实现了相似用户的快速搜索,提高了推荐结果计算的效率。
-
公开(公告)号:CN110377903A
公开(公告)日:2019-10-25
申请号:CN201910549585.5
申请日:2019-06-24
Applicant: 浙江大学
Abstract: 本发明公开了一种基于神经网络的实体和关系的联合抽取技术。该技术包含如下步骤:1)将句子作为输入,获取每个单词的表示向量,该表示向量由词嵌入表示和字符级别词嵌入表示拼接而成;2)使用膨胀卷积神经网络对每个单词的上下文信息进行编码,为每个单词提取包含上下文信息的特征;3)把实体识别作为序列标注问题,并使用线性链CRF来对实体标记序列联合建模;预测时,使用维特比算法计算概率最大的实体标记序列,实现实体识别;4)从组成实体的单词的特征表示中来获得实体的特征表示,通过对实体两两排列来构造关系候选,使用双仿射变换判断每个关系候选的关系,实现关系抽取。
-
公开(公告)号:CN109710736A
公开(公告)日:2019-05-03
申请号:CN201811566627.8
申请日:2018-12-19
Applicant: 浙江大学
IPC: G06F16/332
Abstract: 本发明公开了一种面向搜索排序的主动众包任务生成方法,属于数据处理方法领域。本发明利用了主动学习,在众包任务生成过程中考虑用户输入的查询词与排序模型的结果,不仅使得生成的众包任务适合当前工人,还提高了任务对模型的针对性,能更高效地提升排序学习模型的训练效率,大大节约了众包的人力与时间成本。
-
公开(公告)号:CN108647226A
公开(公告)日:2018-10-12
申请号:CN201810253803.6
申请日:2018-03-26
Applicant: 浙江大学
Abstract: 本发明公开了一种基于变分自动编码器的混合推荐方法。方法通过使用变分自动编码器对用户和物品的评分特征和内容特征进行建模,通过因子分解机对稀疏特征进行编码,自动进行特征高阶组合;同时,将用户和物品的多视图数据特征融合到变分自动编码器的架构里,以解决冷启动问题;并且通过用户和物品的隐向量编码的变分推断分析,为自动编码器生成隐向量编码提供了解释性;通过输入用户和物品相对应的特征,能够获取到用户对候选物品集合的偏好值,根据偏好值进行排序得到推荐结果。本发明相对于传统推荐方法能够有更好的推荐效果。
-
公开(公告)号:CN104915388B
公开(公告)日:2018-03-16
申请号:CN201510270676.7
申请日:2015-05-26
Applicant: 浙江大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于谱聚类和众包技术的图书标签推荐方法,该方法应用于数字图书馆系统,通过使用用户的检索点击日志构建Laplacian矩阵,并利用谱聚类对检索词进行聚类,之后通过使用众包技术,对聚类的结果进行持续的优化,最后将优化的结果应用于推荐系统中。本发明将用户的检索词作为标签,通过谱聚类和众包技术的结合提升检索词聚类的准确度,从而提高系统在标签推荐方面的准确性。
-
公开(公告)号:CN104679835B
公开(公告)日:2017-10-31
申请号:CN201510065111.5
申请日:2015-02-09
Applicant: 浙江大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于多视图哈希的图书推荐方法,包括如下步骤:1)从日志收集系统中筛选出用户在两个视图上的行为数据,包括图书点击数据和搜索数据;2)构建用户在点击和搜索视图上的用户特征向量;3)利用两个视图的行为数据,通过多视图哈希算法得到用户哈希编码、哈希函数以及两个视图的权重;4)利用得到的用户哈希编码为目标用户寻找相似用户;5)得到相似用户点击的图书集合,作为推荐候选列表,计算目标用户对图书的偏好程度,返回目标用户偏好程度最大的前N本图书。本发明可以将用户在两个视图的行为数据整合到哈希编码中,提高图书推荐准确性;另一方面,哈希编码的汉明距离计算速度很快,可以提高图书推荐的效率。
-
公开(公告)号:CN103886048B
公开(公告)日:2017-04-26
申请号:CN201410090123.9
申请日:2014-03-13
Applicant: 浙江大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于聚类的增量数字图书推荐方法。它包括以下步骤:(1)从用户的网站访问日志获取用户阅读书籍的信息,然后生成用户表示向量;(2)使用维度数组来选择需要计算的簇集,然后计算用户与簇集之间的余弦相似度形成候选集;(3)从候选集中找出与目标用户相似度最高的簇,然后根据合并结果进行聚类,并增量式地更新簇心、簇直径;(4)使用簇心值作为排序函数将簇内项目进行排序,将排序高的项目作为推荐结果。本发明可以通过从用户的图书访问日志挖掘用户对书籍的喜好信息,然后为用户进行推荐,提高了推荐方法的扩展性和实时性,增强了数字图书资源利用率和用户的阅读体验。
-
公开(公告)号:CN101916376B
公开(公告)日:2012-08-29
申请号:CN201010220132.7
申请日:2010-07-06
Applicant: 浙江大学
IPC: G06K9/62
Abstract: 本发明公开了一种基于局部样条嵌入的正交半监督子空间图像分类方法。包括如下步骤:1)对图像数据集选取n个样本作为训练集,包括有标注数据和未标注数据,其余作为测试集;2)利用有标注数据构造类间散度矩阵和类内散度矩阵;3)利用整体训练数据特征空间分布,通过局部样条嵌入方式构造拉普拉斯矩阵;4)根据局部样条嵌入正交半监督子空间模型,寻找投影矩阵对原始高维特征向量进行降维;5)采用支持向量机对降维后训练样本建立分类器;6)利用投影矩阵对测试集进行降维,再通过分类器对降维后的测试集进行分类。本发明充分利用了图像样本标注和特征空间分布等信息,能挖掘图像数据之间潜在语义关联,对图像语义进行了较好的分析与表达。
-
公开(公告)号:CN101826102B
公开(公告)日:2012-07-25
申请号:CN201010133153.5
申请日:2010-03-26
Applicant: 浙江大学
IPC: G06F17/30
Abstract: 本发明公开了一种图书关键字自动生成方法。确定图书与作者的关系,从互联网上抓取书评,将其分词并标注词性,留下名词作候补关键词;通过谷歌检索候补关键词在维基百科中出现的文档数目以初步评定重要性,过滤语气词、错别字;将作者、图书、评论和候补关键词作为四种节点,将其互相间的关系作为边,构建四部图;基于四部图,运用以图书为中心的吸收态随机行走算法挑选出最重要的候补关键词作为图书关键字。本发明考虑了同一作者著作的主题一致性、内容相关性及读者反馈,关键词正确率高;充分覆盖读者不同角度的书评,关键词多样化;数据来自互联网,书评数量庞大、涵盖面广,方法覆盖面广。
-
公开(公告)号:CN101853470A
公开(公告)日:2010-10-06
申请号:CN201010185859.6
申请日:2010-05-28
Applicant: 浙江大学
Abstract: 本发明公开了一种基于社会化标签的协同过滤方法。包括如下步骤:1)首先使用三部图对用户,物品,社会化标签这三种不同结点进行建模,并应用随机游走(random walk)算法为每个用户个性化推荐top-N个物品;2)为了解决社会化标签稀疏性问题(即物品往往只被很少一部分标签标注)以及由用户主观性因素所带来的噪音,本发明提出使用lasso logistic regression模型去对物品进行标签的扩展,即对每个物品,增加与其语义相关的标签,并且除去那些有噪音的标签;3)调节标签在推荐过程中的权重。本发明所提出的基于社会化标签的协同过滤方法有机结合社会化标签对于物品描述的语义信息,并使用lasso logistic regression模型去对物品进行标签的扩展,解决社会化标签的稀疏性与噪音问题,从而大幅提升个性化推荐系统的精确度和性能。
-
-
-
-
-
-
-
-
-