-
公开(公告)号:CN112257441A
公开(公告)日:2021-01-22
申请号:CN202010967301.7
申请日:2020-09-15
Applicant: 浙江大学
IPC: G06F40/295 , G06F16/35 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于反事实生成的命名实体识别增强方法,所述方法包含如下步骤:1)从已有标注数据中获取本地实体集合,并按照实体类型进行分类;2)针对已有标注数据中的每一个样本,用实体集合中的实体随机替换样本中的任一个实体,替换后的样本为反事实样本;3)利用判别器对反事实样本进行判别,如果是合理的则用于增强原有的标注数据。与现有的方法相比,本发明有如下益处:1)无需额外的标注资源,如相似领域的数据集或者实体字典;2)无需大量的未标注数据,可解决某些领域缺乏数据的难题;3)能够打破输出特征与输出标签之间部分的伪相关,从而提高模型的泛化能力。
-
公开(公告)号:CN108596335B
公开(公告)日:2020-04-17
申请号:CN201810362557.8
申请日:2018-04-20
Applicant: 浙江大学
Abstract: 本发明公开了一种基于深度强化学习的自适应众包方法。方法具体为:1)首先从众包系统中采样需要分配的任务和候选的众包工人;2)通过深度学习方法获得待分配任务和候选工人的低维特征表示;3)通过强化学习方法确定任务分配策略;4)众包系统根据分配策略分配任务,根据任务完成结果评估本次分配获得的收益,将该收益反馈给强化学习方法,更新强化学习参数;5)从1)开始继续下一轮的任务分配。和现有技术相比,本发明结合了深度强化学习方法,系统地对任务分配问题进行建模,针对不同任务本身的特征选择合适的众包工人,形成了自适应的智能众包方法,创造性地提升了众包的工作效率和效果。
-
公开(公告)号:CN110390399A
公开(公告)日:2019-10-29
申请号:CN201910549586.X
申请日:2019-06-24
Applicant: 浙江大学
IPC: G06N20/00
Abstract: 本发明公开了一种强化学习的高效探索方法,该方法的步骤如下:1)预训练计数估计函数;2)利用预训练的计数估计函数进行强化学习的高效探索。本发明主要针对强化学习中探索与利用的平衡问题,在连续空间任务中,通过预训练计数估计函数估计智能体所遇到的状态的出现次数,利用状态的出现次数计算奖赏,通过奖赏引导智能体探索那些较少遇到的状态从而实现高效探索。本发明通过使用独立的探索策略处理奖赏信号,避免了奖赏信号对智能体行动策略的影响,使得探索过程更稳定。
-
公开(公告)号:CN108596335A
公开(公告)日:2018-09-28
申请号:CN201810362557.8
申请日:2018-04-20
Applicant: 浙江大学
Abstract: 本发明公开了一种基于深度强化学习的自适应众包方法。方法具体为:1)首先从众包系统中采样需要分配的任务和候选的众包工人;2)通过深度学习方法获得待分配任务和候选工人的低维特征表示;3)通过强化学习方法确定任务分配策略;4)众包系统根据分配策略分配任务,根据任务完成结果评估本次分配获得的收益,将该收益反馈给强化学习方法,更新强化学习参数;5)从1)开始继续下一轮的任务分配。和现有技术相比,本发明结合了深度强化学习方法,系统地对任务分配问题进行建模,针对不同任务本身的特征选择合适的众包工人,形成了自适应的智能众包方法,创造性地提升了众包的工作效率和效果。
-
公开(公告)号:CN107122411A
公开(公告)日:2017-09-01
申请号:CN201710199300.0
申请日:2017-03-29
Applicant: 浙江大学
Abstract: 本发明公开了一种基于离散多视图哈希的协同过滤推荐方法,包括如下步骤:1)根据不同视图下的数据构建数据的多视图锚点图表示;2)结合协同过滤和锚点图,得到学习模型;3)对得到的学习模型进行求解,得到用户与物品对应的二进制哈希编码;4)利用得到的哈希编码进行最邻近搜索,计算特定用户对候选物品的偏好程度,返回偏好程度最大的若干个物品作为推荐结果。本发明将不同视图下的数据进行了整合,在求解的时候始终保持编码的离散特性,提高了推荐结果的质量。同时利用哈希编码实现了相似用户的快速搜索,提高了推荐结果计算的效率。
-
公开(公告)号:CN103473308B
公开(公告)日:2017-02-01
申请号:CN201310410604.9
申请日:2013-09-10
Applicant: 浙江大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于最大间隔张量学习的高维多媒体数据分类方法。它包括如下步骤:1)建立多媒体数据的训练数据集;2)对训练数据集建模,进行分析,得到分类模型;3)根据用户查询数据集及分类模型,对查询数据集分类。本发明针对多媒体的高维性和结构性,利用张量来表达多媒体数据,并通过最大间隔分类器的方法,对高维的多媒体数据进行分类。在对多媒体数据进行分解分析的同时完成分类,不仅保留了多媒体数据中的结构信息,而且避免了传统的通过拼合的方法产生的高维数据所引发的“维数灾难”,因此比传统的多媒体数据分类方法更加准确,并易于计算。
-
公开(公告)号:CN103473307B
公开(公告)日:2016-07-13
申请号:CN201310410588.3
申请日:2013-09-10
Applicant: 浙江大学
IPC: G06F17/30
Abstract: 本发明公开了一种跨媒体稀疏哈希索引方法。包括如下步骤:(1)对多个模态数据之间的关联关系利用超图进行统一建模(2)利用字典学习框架同时学习多个模态的字典,同时施加稀疏和超图关联关系的正则约束,对每个模态的数据学习得到相应的字典(3)将学习得到的字典作为哈希函数,对新的数据利用对应模态的字典进行稀疏编码(4)利用相应的哈希策略把稀疏编码转变为稀疏编码集合从而把稀疏编码相似性计算问题转变为集合相似性计算问题,利用类似jaccard距离度量方式进行相似性计算。利用该方法可以实现基于内容的海量数据的高效跨媒体检索。用户可以通过提交任意的模态的检索例子去检索任意模态的媒体对象。
-
公开(公告)号:CN104679835A
公开(公告)日:2015-06-03
申请号:CN201510065111.5
申请日:2015-02-09
Applicant: 浙江大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于多视图哈希的图书推荐方法,包括如下步骤:1)从日志收集系统中筛选出用户在两个视图上的行为数据,包括图书点击数据和搜索数据;2)构建用户在点击和搜索视图上的用户特征向量;3)利用两个视图的行为数据,通过多视图哈希算法得到用户哈希编码、哈希函数以及两个视图的权重;4)利用得到的用户哈希编码为目标用户寻找相似用户;5)得到相似用户点击的图书集合,作为推荐候选列表,计算目标用户对图书的偏好程度,返回目标用户偏好程度最大的前N本图书。本发明可以将用户在两个视图的行为数据整合到哈希编码中,提高图书推荐准确性;另一方面,哈希编码的汉明距离计算速度很快,可以提高图书推荐的效率。
-
公开(公告)号:CN103886067A
公开(公告)日:2014-06-25
申请号:CN201410105985.4
申请日:2014-03-20
Applicant: 浙江大学
CPC classification number: G06F17/30867 , G06F17/30731
Abstract: 本发明公开了一种使用标签隐含主题进行图书推荐的方法。它将图书作为文档,图书标签作为文档中的单词,采用LDA-Gibbs算法对图书标签进行主题建模,得到标签-主题模型,然后根据用户的图书阅读记录得到用户和标签的对应关系,使用LDA-inference算法得到用户-主题模型,最后根据用户在主题分布上的相似度找到兴趣相似的用户,对图书进行协同过滤推荐。本发明充分挖掘了图书标签中的语义信息,通过使用主题降低了表达用户所需的维度,减小了计算量,有助于提高推荐结果的质量,有一定的实用价值。
-
公开(公告)号:CN103559193A
公开(公告)日:2014-02-05
申请号:CN201310410816.7
申请日:2013-09-10
Applicant: 浙江大学
CPC classification number: G06F17/30017 , G06F17/274
Abstract: 本发明公开了一种基于选择单元的主题建模方法,包括如下步骤:根据查询请求提取数据库中的搜索结果包含的单词、片段结构和单词特征;确定建模采用的主题数;随机分配产生各个片段结构主题、单词主题及二元选择子;通过Gibbs采样过程迭代地确定上述变量;根据上述变量的最终分配结果向用户反馈各个主题中的显著文档和单词,以及具有各种特征的单词表达其所在片段结构的主题的能力。本发明具有的有益效果有:可同时在多种模态数据上进行主题建模;充分利用了数据隐含的结构信息,并消除了结构限制过强的不利效果;可提供文档中单词特征与片段结构限制之间的关联度等信息,为用户在理解数据上提供帮助;具有良好的可扩展性,可作为多种应用的算法基础。
-
-
-
-
-
-
-
-
-