-
公开(公告)号:CN118710356A
公开(公告)日:2024-09-27
申请号:CN202410757348.9
申请日:2024-06-13
Applicant: 南京大学
IPC: G06Q30/0601 , G06F18/2415 , G06F18/214 , G06F21/62
Abstract: 本发明公开一种基于数据生成重放的流式商品推荐方法,包括训练数据生成步骤,推荐算法模型训练步骤和商品推荐步骤;首先收集用户的反馈数据,训练一个扩散模型来拟合用户数据的分布,然后使用这个扩散模型重新构造一个伪造的用户反馈数据,在调度到计算资源后,基于这个构造的数据集更新推荐算法,最后根据推荐算法的输出结果来进行商品推荐。本发明可以在流式商品数据量较少、样本不均衡的条件下有效训练推荐算法,无需保存用户对商品的历史反馈数据,有效保护用户隐私,此外,本发明在更新模型时动态调度计算资源,确保计算资源的有效利用。
-
公开(公告)号:CN118013367A
公开(公告)日:2024-05-10
申请号:CN202410185543.9
申请日:2024-02-19
Applicant: 南京大学
IPC: G06F18/241 , G06F18/214
Abstract: 本发明公开一种面向通信领域信号分选的持续学习方法,旨在提高信号分类和识别的准确性和效率。首先通过部署数据采集系统,收集通信信号,这些信号数据将被标注以供后续处理。接着利用持续学习技术,构建一个能够适应不断变化的信号特征的动态模型。该模型采用LoRA微调技术,能够在接收到新类型信号时迅速调整,无需从头开始训练。此外,本发明通过可扩展的兼容子空间技术,建立旧信号和新信号类型之间的映射关系,从而实现对旧模型的有效重用。最后,通过实际信号数据对模型进行测试和验证。本发明使得模型在面对新的或未知的信号类型时具有更高的适应性和精准度,在通信领域的应用中展现出高效率和强大的实用性,特别适用于动态变化的通信环境。
-
公开(公告)号:CN113989556B
公开(公告)日:2024-04-09
申请号:CN202111253761.4
申请日:2021-10-27
Applicant: 南京大学
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06N3/088 , G06N3/0464
Abstract: 本发明公开一种小样本医学影像分类方法和系统,该方法包括图像收集、无监督特征训练、基于小样本的模型生成;首先从网络或者其他渠道,收集多种医学影像数据;然后利用采集的图像,使用基于混合困难近邻的无监督特征方法得到一个具有泛化性的预训练模型;在小样本场景下,使用预训练模型提取不同类的样本特征,根据特征计算类原型,在后续分类任务中,选取相似性最高的原型所处的类,作为新样本的预测类别。本发明不依赖于样本标记,使用无监督学习方法迁移知识,在保证准确率的前提下,大大减少样本获取成本和标注成本。
-
公开(公告)号:CN114662379A
公开(公告)日:2022-06-24
申请号:CN202210149681.2
申请日:2022-02-18
Applicant: 南京大学
IPC: G06F30/27 , G06F119/02
Abstract: 本发明公开一种基于预测不确定性的鲁棒模拟滤波器辅助设计方法和系统,包括训练数据的收集和不确定性预测模型的训练,以及利用不确定性模型进行辅助设计;首先使用模拟方法获得加入噪声的数据并利用这些数据训练不确定性预测模型,然后利用不确定性预测模型在滤波器设计过程中对其鲁棒性进行评估。本发明的方法能够在不进行实物实验的情况下估计特定滤波器参数在实际实现后的鲁棒性,能够有效减少实验成本,同时也允许使用较低精度的器件,降低模拟滤波器的生产成本。
-
公开(公告)号:CN114626442A
公开(公告)日:2022-06-14
申请号:CN202210172383.5
申请日:2022-02-24
Applicant: 南京大学
Abstract: 本发明公开一种面向通信领域不平衡业务感知的训练推理分歧消解方法和系统,首先通过部署样机搜集业务APP传输的通信包信号;然后通过分析业务APP类别的数据分布得到数据不平衡性的综合性度量,确定业务APP类别先验;其次使用带有业务APP类别先验的交叉熵损失训练业务感知模型;最后将业务感知模型部署进行推理使用。本发明提出了一种有效解决业务感知领域数据类别不平衡问题的方法,引入了业务APP类别先验信息对模型训练过程进行校正,可以大幅度提升业务感知模型的泛化性能,本发明易于实现部署且适用性强。
-
公开(公告)号:CN113988922A
公开(公告)日:2022-01-28
申请号:CN202111254303.2
申请日:2021-10-27
Applicant: 南京大学
Abstract: 本发明公开一种基于延迟时间采样的转化率模型流式更新方法,包括训练数据收集和构造步骤,权重模型和转化率模型训练步骤,流式模型更新步骤;首先收集用户的历史转化行为,然后采用延迟时间训练方法训练得到权重模型和转化率预测模型,最后利用权重模型使用流式到来的新数据对转化率预测模型进行更新。本发明的方法在实施过程中能够在较低的时延下及时更新转化率预测模型,同时避免了反馈不充分导致的模型精度下降的问题,能够实现实时性和精确性的平衡从而提高模型性能。
-
公开(公告)号:CN110505098A
公开(公告)日:2019-11-26
申请号:CN201910803496.9
申请日:2019-08-28
Applicant: 南京大学
IPC: H04L12/24
Abstract: 本发明公开一种基于异构模型重用的跨区域通信流量预测方法,包括数据采集步骤、模型重用步骤、新区域模型训练步骤和新区域模型测试步骤;首先收集不同区域通信数据,包括特征数据和特征的元信息描述数据;然后在之前区域数据上训练一个模型,采用模型重用和最优输运的技术将这个异构模型映射到当前区域的特征空间中;最后在新的区域上利用少量的通信数据建立一个新的模型,从而完成以少量有标记数据训练一个性能很好的可使用的模型。本发明可以解决新旧区域特征空间不同以及新区域只有数据难以建立一个新模型的难点,并且本发明实施过程中占用资源少,适用性强。
-
公开(公告)号:CN107239787A
公开(公告)日:2017-10-10
申请号:CN201610188948.3
申请日:2016-03-29
Applicant: 南京大学
IPC: G06K9/62
CPC classification number: G06K9/6256 , G06K9/6267
Abstract: 本发明公开了一种利用多来源数据具有隐私保护功能的图象分类方法,首先针对图象收集不同类型的特征属性,将每一组特征看作一个视图,每一个视图上训练一个分类器,对图象的结果进行预测,要求在有标记数据上预测的结果和真实的结果相同;在之后的训练过程中,要求不同视图的预测结果尽可能相近,使得预测性能强的视图能够辅助其它的视图,从而提升每一个视图以及综合的分类结果;最后利用在迭代训练过程中得到的分类器在每一个视图上进行图象分类。本发明所提供的方法实施过程中能够充分利用有标记数据和未标记数据上不同数据源的多种特征属性,适合数据源很多的情况,同时在整个训练过程中能够确保每一个数据源的特征属性不被其它数据源所获取。
-
公开(公告)号:CN106250924A
公开(公告)日:2016-12-21
申请号:CN201610600041.3
申请日:2016-07-27
Applicant: 南京大学
IPC: G06K9/62
CPC classification number: G06K9/6269
Abstract: 本发明公开一种基于多示例学习的新增类别检测方法,首先利用多示例学习中较为成熟的关键示例检测算法将多示例“包”中的关键示例抽取出来;之后,对于每个已知类别,将其对应的关键示例结合为一个“类别超包”,同时未被认定为关键示例的所有示例组成一个“元超包”;随后,包与超包之间的距离就可以通过后续的度量学习来确定。在实用阶段,对于已知类别的包,根据其距离最近的类别超包来判定其概念类别;而对于新增类别的包,由于不存在它对应的类别超包,距离它最近的超包则应为元超包,如此可以根据这一情形来判定其为新增类别。
-
公开(公告)号:CN119993458A
公开(公告)日:2025-05-13
申请号:CN202510097299.5
申请日:2025-01-22
IPC: G16H50/20 , G16H30/40 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/084 , G06N3/0895 , G06T7/00
Abstract: 本发明公开一种基于不完全监督信息的多维度牙周炎识别和检测方法,首先,获取标注的牙周疾病图像,排除掉无法识别的图像并将剩余图像中需要识别的部分裁剪出来,并根据牙龈是否发炎和牙周退缩程度两个维度对图像进行分类;接着,基于多维度分类模型估计全部样本的标签分布,并用于修改每个类别数据的训练损失;然后,基于多维度分类模型对无标注牙周炎图像数据生成伪标签,并将通过估计现有参数的类别偏差来获取更精准的伪标签,利用矫正标签重新训练模型;最后,利用训练好的模型生成图像对应的最终标签,得到最终的识别结果。本发明利用半监督学习的框架,在仅有少量标注数据且数据类别不均衡的场景下,通过估计标签分布得到无偏损失,并通过估计类别偏差来矫正伪标签,解决了类别不均衡和标注数据有限两个问题,能使模型达到较高的识别准确率。
-
-
-
-
-
-
-
-
-