一种基于数据筛选的域适应方法和系统

    公开(公告)号:CN116522202B

    公开(公告)日:2025-03-18

    申请号:CN202310461928.9

    申请日:2023-04-26

    Applicant: 浙江大学

    Inventor: 吴超 王沛正 李皓

    Abstract: 本发明公开了一种基于数据筛选的域适应方法和系统,属于迁移学习中的域适应技术领域。获取任务一致但数据分布不同的源域和目标域数据集;利用源域数据预训练源域卷积神经网络和源域分类器;构建由源域卷积神经网络、目标域神经网络、判别器组成的对抗网络,并进行基于域分类任务的对抗训练;利用预训练后的源域卷积神经网络提取源域数据特征,利用训练后的判别器对源域数据进行域分类,从分类为源域的数据子集中剔除部分数据,更新源域数据集;使用新的源域数据集和原始的目标域数据集进行域适应操作。本发明利用对抗训练方式拉近了目标域与源域在同一特征空间的特征表示,筛选出更接近目标域数据的源数据进行域适应操作,提升了域适应的性能。

    一种基于联邦学习价值评估的慢性病医疗保健方法和系统

    公开(公告)号:CN116598012A

    公开(公告)日:2023-08-15

    申请号:CN202310420641.1

    申请日:2023-04-19

    Applicant: 浙江大学

    Inventor: 吴超 李金华 李皓

    Abstract: 本发明公开了一种基于联邦学习价值评估的慢性病医疗保健方法和方法,属于智慧医疗技术领域。客户端利用本地私有样本数据集训练本地模型,服务器利用私有样本数据集测试所有客户端的本地模型,对全部客户端进行等级划分;服务器初始化全局模型参数,并发送到所有客户端进行本地训练;服务器根据客户端的等级选择部分客户端,被选中的客户端将本地模型参数上传到服务器,服务器更新全局模型参数并传输回全部客户端;循环联邦训练过程,直到整个训练过程收敛。本发明通过评估联邦学习中不同数据源的价值,将客户端划分为若干个级别并赋予不同的优先级,避免模型训练过程中低质量数据造成时间和计算资源浪费,提高联邦学习的性能和训练效率。

    一种基于Transformer的多源无数据域自适应方法和系统

    公开(公告)号:CN116524249A

    公开(公告)日:2023-08-01

    申请号:CN202310420645.X

    申请日:2023-04-19

    Applicant: 浙江大学

    Inventor: 吴超 李港 李皓

    Abstract: 本发明公开了一种基于Transformer的多源无数据域自适应方法和系统,属于迁移学习技术领域。每个源域训练一个包括特征提取器和分类器的模型;为每个源域分配一个权重系数,初始化老师模型和学生模型;在目标域数据集上,计算硬伪标签和软类别正交伪标签;联合信息最大化损失、基于硬伪标签和软类别正交伪标签的交叉熵损失,迭代更新权重系数和学生模型,再更新教师模型,直至学生模型和权重系数收敛;最后将收敛后的学生模型的知识蒸馏给目标域模型。本发明在特征提取器中引入视觉Transformer网络,有效地聚焦于图像中的物体,结合软类别正交伪标签,解决了多源无数据域自适应中源域模型对目标域数据泛化能力不高的问题。

    一种基于无数据蒸馏的联邦学习聚合方法和系统

    公开(公告)号:CN116629376A

    公开(公告)日:2023-08-22

    申请号:CN202310461917.0

    申请日:2023-04-26

    Applicant: 浙江大学

    Inventor: 吴超 张真源 李皓

    Abstract: 本发明公开了一种基于无数据蒸馏的联邦学习聚合方法和系统,属于联邦学习和隐私保护研究领域。该方法通过引入分布式生成式对抗网络来实现无数据的联邦知识蒸馏,从而解决基于参数平均的联邦学习方法所存在的不支持模型异构、隐私泄露以及基于知识蒸馏的联邦学习方法所存在的难以获取公共数据集的问题。该方法主要包括本地对抗训练、生成式对抗网络聚合、联邦蒸馏三个步骤。本发明的方法提高了预测准确性,尤其是在一些极端的非独立同分布场景下(如客户端类别极度不均衡、数据量极度不均衡等)的预测准确性。同时,本发明的方法相较于现有的联邦学习方法实现了对客户端模型异构的支持,提高了隐私保护能力,增强了泛化性能。

    一种基于深度学习的网约车流量预测方法

    公开(公告)号:CN112669595B

    公开(公告)日:2022-07-01

    申请号:CN202011455308.7

    申请日:2020-12-10

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于深度学习的网约车流量预测方法,属于机器学习研究领域。该方法建立了历史交通量为输入的双向长短期记忆网络模型,即以过去8‑24小时的数据作为输入,预测未来一个小时的网约车流量数据。包括(1)获取网约车运营历史数据,统计网约车流量;(2)对网约车运营数据进行流量变化分析,匹配并标记流量骤增或骤减的外部环境属性;(3)DBSCAN聚类;(4)按照信息点扩大聚类区域;(5)构建以历史交通量分布为输入的LSTM预测模型,预测未来时间段的各区域的网约车流量数据。本发明的方法提高了预测准确性,尤其是在一些特殊情况下(如极端天气、节假日、大型活动等)的预测准确性。

    一种基于深度学习的网约车流量预测方法

    公开(公告)号:CN112669595A

    公开(公告)日:2021-04-16

    申请号:CN202011455308.7

    申请日:2020-12-10

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于深度学习的网约车流量预测方法,属于机器学习研究领域。该方法建立了历史交通量为输入的双向长短期记忆网络模型,即以过去8‑24小时的数据作为输入,预测未来一个小时的网约车流量数据。包括(1)获取网约车运营历史数据,统计网约车流量;(2)对网约车运营数据进行流量变化分析,匹配并标记流量骤增或骤减的外部环境属性;(3)DBSCAN聚类;(4)按照信息点扩大聚类区域;(5)构建以历史交通量分布为输入的LSTM预测模型,预测未来时间段的各区域的网约车流量数据。本发明的方法提高了预测准确性,尤其是在一些特殊情况下(如极端天气、节假日、大型活动等)的预测准确性。

    基于联邦和对比表征学习的图像编码器训练方法和系统

    公开(公告)号:CN116229219B

    公开(公告)日:2023-09-26

    申请号:CN202310521339.5

    申请日:2023-05-10

    Applicant: 浙江大学

    Inventor: 吴超 余敏君 李皓

    Abstract: 本发明公开了一种基于联邦和对比表征学习的图像编码器训练方法和系统,属于自监督机器学习技术领域。由两部分核心内容组成:一个是为了缓解类别不均衡问题所提出的基于类别多样性和特征对齐实现的联邦对比图像表征学习方法,其被记为FedFA;另一个是用来降低批标准层隐私泄漏风险的按层计算静态批标准化方法,其被记为lsBN。结合FedFA和lsBN,本发明可以在尽可能保护用户数据隐私的前提下,利用各客户端所存储的无标签图像数据来训练生成能够更好地服务于各类下游任务的通用图像编码器。

    一种基于用户兴趣域的端到端联邦个性化推荐方法和系统

    公开(公告)号:CN116226540A

    公开(公告)日:2023-06-06

    申请号:CN202310512758.2

    申请日:2023-05-09

    Applicant: 浙江大学

    Inventor: 吴超 章焕锭 李皓

    Abstract: 本发明公开了一种基于用户兴趣域的端到端联邦个性化推荐方法和系统,属于个性化推荐技术领域。本发明在类簇个性化思路的基础上,设置了带有个性化预测网络群组的推荐模型与基于图神经网络的客户端分类网络,并将该分类网络嵌入到个性化推荐模型中,将两者作为联邦推荐系统中的全局模型进行联邦训练。通过该端到端个性化推荐模型的设计,客户端的聚类过程可在模型的前向计算中自动完成,改善了训练效率;客户端分类网络也能通过推荐目标进行训练,使得聚类过程变为可学习。本发明改善了目前的类簇个性化推荐方法中存在的训练效率低和非学习性的问题,提升了个性化联邦推荐模型的性能。

    一种基于联邦学习的序列推荐方法和系统

    公开(公告)号:CN114595396A

    公开(公告)日:2022-06-07

    申请号:CN202210490648.6

    申请日:2022-05-07

    Abstract: 本发明公开了一种基于联邦学习的序列推荐方法和系统,属于个性化推荐领域和用户隐私保护领域。本发明将用户的个人信息、实时和历史数据都存放在本地,每个客户端能够根据自己的历史数据进行状态表示,捕捉用户与物品之间的交互关系,并基于深度强化学习将推荐过程看做一个序列化决策过程;本发明在联邦学习的聚合算法中引入了注意力机制,考虑到各个客户端提取特征信息的相关性,以及各个客户端的个性化带来的数据差异性,为每一个客户端制定权重系数,这是一种细粒度的重新赋权的手段,增加了数据的个性化程度,提高了推荐准确率,更加适合序列推荐领域,在保护个人数据隐私的同时,实现对用户的个性化推荐。

    一种基于智能手机传感器和机器学习的众包路面坑洼检测方法

    公开(公告)号:CN112710273A

    公开(公告)日:2021-04-27

    申请号:CN202011458070.3

    申请日:2020-12-10

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于智能手机传感器和机器学习的众包路面坑洼检测方法,包括以下步骤:1、手机APP采集加速度计信息、定位信息和时间戳信息;2、数据预处理,并传给云服务器;3、云服务器接收潜在的坑洼信息数据,提取信号特征;4、根据服务端部署的机器学习模型判断数据段是否为坑洼引起,若是则存储对应数据段的GPS位置。5、将不同车辆识别出的坑洼按GPS位置进行聚合,确定最终的坑洼。本发明针对路面平整度指标检测实时性差、需要使用专用设备、需要专业人员进行检测的问题,对智能手机中三轴振动加速度数据进行采集分析,从而实现对路面状况的自动检测,降低了检测成本,扩大了可检测的区域范围,同时也使得检测更加实时高效。

Patent Agency Ranking