-
公开(公告)号:CN112131661B
公开(公告)日:2024-07-23
申请号:CN202010946929.9
申请日:2020-09-10
Applicant: 南京大学
IPC: G06F30/15 , G06F30/27 , G05B17/02 , G06F18/214 , G06N3/048
Abstract: 本发明公开一种无人机自主跟拍运动目标的方法,包括在模拟器中训练跟拍虚拟目标,实现步骤为:(1)构建无人机模拟器;(2)在无人机模拟器中采集样本;(3)利用采集样本进行无人机飞行控制策略训练;所述无人机飞行控制策略训练过程中,使用神经网络来表示初始无人机飞行控制策略模型,用当前的初始飞行控制策略模型在无人机模拟器中控制无人机,在无人机模拟器提供的马尔科夫过程中采样,针对收集到的样本,用近端策略优化的方法优化当前初始飞行控制策略模型,直至初始飞行控制策略模型不再提升,得到无人机飞行控制策略模型。相比以往的手工控制无人机航拍的方法,使用强化学习学出的飞行控制策略,由于训练采样丰富,往往能够面对各种复杂情况,有反应灵活、控制平稳、人力成本低等优点。
-
公开(公告)号:CN111861648B
公开(公告)日:2024-07-23
申请号:CN202010640550.5
申请日:2020-07-06
Applicant: 南京大学
IPC: G06Q30/0601 , G06F18/214 , G06N3/09
Abstract: 本发明公开一种基于模拟训练的价格谈判策略模型学习方法,该方法以(1)基于机器学习的价格谈判对手模拟器构建、(2)基于虚拟环境的智能价格谈判策略优化、(3)价格谈判策略的迁移优化三大模块为特点,解决以往智能价格谈判领域的方案试错成本高、泛化性能差、策略易受攻击的问题。
-
公开(公告)号:CN113269040B
公开(公告)日:2024-07-19
申请号:CN202110445391.8
申请日:2021-04-25
Applicant: 南京大学
IPC: G06F16/29
Abstract: 本发明公开一种结合图象识别与激光雷达点云分割的驾驶环境感知方法,包括:(1)在真实道路上,收集地面激光雷达点云数据和图像数据。(2)使用收集的图像数据作为参考,将激光雷达点云数据与图像数据进行标定,标记收集的激光雷达点云数据。(3)初始化点云分割网络,对标记的激光雷达点云数据进行训练,更新网络参数。(4)将训练好的网络移植到无人车工控机中,获得点云所属物体的类别。(5)对图像数据进行识别。(6)对分割后的激光雷达点云数据与图像识别后的图像数据进行融合,获取道路和物体所在的准确位置。本发明实时感知环境,克服了图像识别在天气不好、光线较差的情况下识别效果不佳的缺点。
-
公开(公告)号:CN117112902A
公开(公告)日:2023-11-24
申请号:CN202311106875.5
申请日:2023-08-30
Applicant: 南京大学
IPC: G06F16/9535 , G06Q30/0601 , G06N20/00
Abstract: 本发明公开一种基于多模态对比学习算法的离线强化学习商品推荐系统,首先获取商品的相关图像、描述商品的文字以及其他商品的相关特征,通过对比学习算法融合多个模态的信息,得到商品的特征表示;将商品推荐过程建模为强化学习问题,通过用户曾经产生行为的商品特征和用户的基本信息得到用户的状态,系统推荐的商品作为动作,用户对于推荐的商品的反馈作为奖赏。利用离线强化学习算法在现有用户行为日志数据上进行训练,得到推荐系统的策略。本发明利用对比学习算法综合多个模态的信息构造物品的特征,在将推荐系统建模为强化学习问题的前提下,通过离线强化学习算法得到了推荐策略,使得商品推荐系统能够更好地完成推荐任务。
-
公开(公告)号:CN116629374A
公开(公告)日:2023-08-22
申请号:CN202310393334.9
申请日:2023-04-13
Applicant: 南京大学
Abstract: 本发明公开一种针对异构特征空间学件的查搜与复用方法,包含两个阶段——提交阶段和部署阶段;在提交阶段,开发者提交模型和准规约,学件库基于所有提交模型的准规约学习子空间和相关的映射函数,同时基于映射函数对上传模型的准规约进行调整;在部署阶段,学件库根据用户提交的准需求查找和推荐模型,然后用户复用模型。本发明在不额外收集跨多个特征空间的辅助数据和不接触提交模型的原始数据的情况下,使得学件库可以统筹管理开发者提供的来自异构特征空间的模型,并通过学件查搜使用户更方便有效地复用学件库中的模型。
-
公开(公告)号:CN116542136A
公开(公告)日:2023-08-04
申请号:CN202310396671.3
申请日:2023-04-13
Applicant: 南京大学
IPC: G06F30/27 , G06F16/2458 , G06F18/22
Abstract: 本发明的目的是提供一种通用的学件查搜与复用的方法和装置。所述方法包括:基于当前用户任务需求对应的查询信息,通过基于语义规约进行匹配,从学件库中筛选出多个候选学件;通过基于统计规约进行匹配,从所述多个候选学件中选择一个或多个学件;向所述用户返回所选择的一个或多个学件,以供用户对相应的模型进行复用。本申请实施例具有以下优点:通过收集开发者的模型,为其生成语义规约与统计规约并组合成学件来存储至学件库,并且,针对不同用户的机器学习任务需求,基于语义规约和统计规约来查搜匹配得到对用户有帮助的学件来进一步复用于用户任务,使得用户无需从头训练新的模型即可获得对其有帮助的优质模型来进行复用,提升了效率。
-
公开(公告)号:CN113282747B
公开(公告)日:2023-07-18
申请号:CN202110465097.3
申请日:2021-04-28
Applicant: 南京大学
Abstract: 本发明公开一种基于自动机器学习算法选择的文本分类方法,基于级联式自动机器学习的思想,从多种机器学习算法中为文本分类任务配置最优算法,包括:(1)采用文本向量嵌入方法将文本语料数据编码成向量表示,生成文本分类数据集;(2)利用多摇臂赌博机算法从多个机器学习分类算法中选择一个算法;(3)利用超参优化方法自动为所选择的算法搜索一组超参数;(4)基于搜索到的超参数初始化相应算法的超参,并在文本分类数据集上训练模型;(5)重复步骤(2)到步骤(4),直到达到设定的迭代次数,将训练得到的多个分类模型中预测性能最好的模型用于文本分类任务。本方法能自动的为任务文本训练一个鲁棒的分类模型。
-
公开(公告)号:CN115972211A
公开(公告)日:2023-04-18
申请号:CN202310064893.5
申请日:2023-02-06
Applicant: 南京大学
IPC: B25J9/16
Abstract: 本发明公开一种基于模型不确定性和行为先验的控制策略离线训练方法,通过在机械臂操作离线数据上训练集成动力学模型来构建对机械臂数据样本的不确定性度量,并采用变分自编码器来拟合收集该机械臂离线数据的行为先验策略,在加权贝尔曼更新的框架下仅使用机械臂离线数据来训练机械臂的控制策略。本发明能够使机械臂控制策略在离线训练的过程中有选择性地利用机械臂的离线数据集,减小不可信的机械臂数据样本对策略训练的影响,同时使可信的机械臂数据样本仍然能对策略训练起到正向作用,能够使得机械臂控制策略的离线学习过程更加稳定并提升机械臂控制策略的性能。
-
公开(公告)号:CN115801307A
公开(公告)日:2023-03-14
申请号:CN202211103998.9
申请日:2022-09-09
Applicant: 南京大学
IPC: H04L9/40 , H04L41/069
Abstract: 本发明公开了一种利用服务器日志进行端口扫描检测的方法和系统,包括特征提取步骤和端口扫描检测步骤;首先收集服务器集群上的访问日志,然后进行特征提取构建描述访问IP行为的聚合记录,最后根据正样本数目用规则或者聚类的方法判断是否发生端口扫描,同时将检测结果反馈给管理员和正样本数据库,进一步提升方法的准确性。本发明充分考虑了运维安全审计管理人员的实际需求,可实施性强、适用性强。
-
公开(公告)号:CN115269565A
公开(公告)日:2022-11-01
申请号:CN202210527838.0
申请日:2022-05-16
Applicant: 南京大学
IPC: G06F16/215 , G06F16/2457 , G06F16/9535 , G06K9/62 , G06N3/08 , G06N3/04
Abstract: 本发明公开一种基于强化学习的异常推荐数据检测方法和系统,主要聚焦于推荐系统中的多模态异常数据识别,依赖强化学习算法,针对半监督异常数据,提出了一种针对“一致异常”和“不合异常”同时进行识别的方法。该方法通过和推荐系统进行交互,在用户数据收集之后,传入推荐系统之前,由本发明提出的方法进行识别,将其中的异常数据进行剔除,并将正常的数据传送给推荐系统,经由推荐系统处理之后将结果反馈给用户。本发明容易融合不同模态的信息,获得更好的效果。
-
-
-
-
-
-
-
-
-