-
公开(公告)号:CN108717654B
公开(公告)日:2022-03-25
申请号:CN201810470713.2
申请日:2018-05-17
申请人: 南京大学
摘要: 本发明公开了一种基于聚类特征迁移的多电商交叉推荐方法,包括如下步骤1)评分矩阵构造阶段:a采集各个电商数据;b数据清洗、去噪音;c构建评分矩阵;d结束;2)辅助域学习阶段:a获取评分矩阵;b提取用户/项目特征矩阵;c对用户/项目特征矩阵聚类;d计算平均评分;e构造聚类特征矩阵;f针对每个辅助电商,重复以上步骤至结束;3)目标域学习阶段:a获取目标电商评分矩阵;b迁移聚类特征,完成矩阵分解。c重构目标电商评分矩阵;d产生推荐列表;e结束。本发明利用迁移学习技术为电商推荐系统存在的数据稀疏性、冷启动和多样性与精确性两难困境问题提供了一种新的解决思路。
-
公开(公告)号:CN113361198B
公开(公告)日:2023-11-03
申请号:CN202110641240.X
申请日:2021-06-09
申请人: 南京大学
IPC分类号: G06F30/27 , G06N3/0442 , G06N3/08 , G06F111/04
摘要: 一种基于公共和私有信息挖掘的众包测试报告融合方法,1)进行特征映射,每个模态中包括所有模态共享的公共信息,以及该模态的私有信息,将原始特征空间中抽取的模态映射为同一维度的公共向量和私有向量;2)对不同模态所包含的所有模态共享的公共信息和每个模态的私有信息进行获取;3)进行模态关系挖掘,将得到d维公共信息Ci和私有信息Sim依次输入到LSTM中进行处理;4)进行标签预测,在多标签学习中,每种模态都有其对多标签预测的特定贡献,利用储存在LSTM记忆单元中的不同模态的信息获取标签之间的关系。本发明能够学习所有模态的低维公共表示,并通过强制正交约束提取每个模态的区别信息,同时,将公共表示作为一种新的模态加入到特定的模态序列中,实现基于提取的模态序列挖掘标签相关性。
-
公开(公告)号:CN113361198A
公开(公告)日:2021-09-07
申请号:CN202110641240.X
申请日:2021-06-09
申请人: 南京大学
IPC分类号: G06F30/27 , G06N3/04 , G06N3/08 , G06F111/04
摘要: 一种基于公共和私有信息挖掘的众包测试报告融合方法,1)进行特征映射,每个模态中包括所有模态共享的公共信息,以及该模态的私有信息,将原始特征空间中抽取的模态映射为同一维度的公共向量和私有向量;2)对不同模态所包含的所有模态共享的公共信息和每个模态的私有信息进行获取;3)进行模态关系挖掘,将得到d维公共信息Ci和私有信息Sim依次输入到LSTM中进行处理;4)进行标签预测,在多标签学习中,每种模态都有其对多标签预测的特定贡献,利用储存在LSTM记忆单元中的不同模态的信息获取标签之间的关系。本发明能够学习所有模态的低维公共表示,并通过强制正交约束提取每个模态的区别信息,同时,将公共表示作为一种新的模态加入到特定的模态序列中,实现基于提取的模态序列挖掘标签相关性。
-
公开(公告)号:CN108717654A
公开(公告)日:2018-10-30
申请号:CN201810470713.2
申请日:2018-05-17
申请人: 南京大学
摘要: 本发明公开了一种基于聚类特征迁移的多电商交叉推荐方法,包括如下步骤1)评分矩阵构造阶段:a采集各个电商数据;b数据清洗、去噪音;c构建评分矩阵;d结束;2)辅助域学习阶段:a获取评分矩阵;b提取用户/项目特征矩阵;c对用户/项目特征矩阵聚类;d计算平均评分;e构造聚类特征矩阵;f针对每个辅助电商,重复以上步骤至结束;3)目标域学习阶段:a获取目标电商评分矩阵;b迁移聚类特征,完成矩阵分解。c重构目标电商评分矩阵;d产生推荐列表;e结束。本发明利用迁移学习技术为电商推荐系统存在的数据稀疏性、冷启动和多样性与精确性两难困境问题提供了一种新的解决思路。
-
公开(公告)号:CN113360633B
公开(公告)日:2023-10-17
申请号:CN202110641886.8
申请日:2021-06-09
申请人: 南京大学
IPC分类号: G06F16/335 , G06F16/35 , G06F40/242 , G06F40/279 , G06N3/04 , G06N3/08
摘要: 本发明提出了一种基于深度域适应的跨域测试文档分类方法。包括1、数据采集阶段,获取足够多的辅助领域的文档数据及其标注,以及要分类的目标领域的文档数据;2、数据预处理阶段,对俩个领域的全部文档进行词语的划分之后进行去重和去停用词,之后进行字典的构建,再将每一个文档表示成one‑hot向量的形式;3、在跨域数据迁移阶段,将辅助领域和目标领域的数据同时送入深度网络中,来进行特征的学习和提取。本发明节省了数据标注的时间和人力成本,可结合多种网络结构进行特征的提取。
-
公开(公告)号:CN113360633A
公开(公告)日:2021-09-07
申请号:CN202110641886.8
申请日:2021-06-09
申请人: 南京大学
IPC分类号: G06F16/335 , G06F16/35 , G06F40/242 , G06F40/279 , G06N3/04 , G06N3/08
摘要: 本发明提出了一种基于深度域适应的跨域测试文档分类方法。包括1、数据采集阶段,获取足够多的辅助领域的文档数据及其标注,以及要分类的目标领域的文档数据;2、数据预处理阶段,对俩个领域的全部文档进行词语的划分之后进行去重和去停用词,之后进行字典的构建,再将每一个文档表示成one‑hot向量的形式;3、在跨域数据迁移阶段,将辅助领域和目标领域的数据同时送入深度网络中,来进行特征的学习和提取。本发明节省了数据标注的时间和人力成本,可结合多种网络结构进行特征的提取。
-
-
-
-
-