-
公开(公告)号:CN108197663B
公开(公告)日:2022-03-25
申请号:CN201810063763.9
申请日:2018-01-23
Applicant: 南京大学
IPC: G06V10/764 , G06V10/774 , G06K9/62 , G06V10/26
Abstract: 本发明公开了一种基于对偶集合多标记学习的书法作品图像分类方法,包括图像收集与训练样本标记步骤,样本特征提取与分类器训练步骤,图像预测步骤;首先收集一定量书法家作品图像,经过图像处理后进行人工标注书法家和字体,然后对收集图像进行特征提取并训练分类器,最后在实际使用中利用训练得到的分类器对待预测的书法作品图像进行分类,得知该作品的书法家和字体。与现有技术相比,本发明的方法分类器训练方式新颖,分类测试准确率高。
-
公开(公告)号:CN113721655A
公开(公告)日:2021-11-30
申请号:CN202110988096.7
申请日:2021-08-26
Applicant: 南京大学
IPC: G05D1/10
Abstract: 本发明公开一种控制周期自适应的强化学习无人机稳定飞行控制方法。本发明针对无人机飞行时灵敏性与稳定性的权衡问题,提出了基于强化学习的无人机自适应周期的控制方法。共包含以下关键环节:(1)构造动作增广的策略模型,在策略模型的动作输出中加入是否需要执行该动作的标志位。(2)在环境中运行策略模型时,若标志位为“是”,则执行策略模型输出的动作,并计一定的动作惩罚值;否则不执行该动作,且无惩罚值。(3)使用强化学习算法,通过策略模型与环境的交互,以最大化环境奖励并最小化动作惩罚值为目标,对策略模型进行优化。本发明使得无人机能够对其控制周期进行自适应的调整,同时保证了无人机的性能与飞行稳定性。
-
公开(公告)号:CN113283986A
公开(公告)日:2021-08-20
申请号:CN202110465112.4
申请日:2021-04-28
Applicant: 南京大学
Abstract: 本申请公开了一种基于自注意力机制的算法交易系统及基于该系统的算法交易模型的训练方法。其中系统包括:全连接神经网络模块,用于对输入的交易数据进行特征提取、转换和映射;自注意力机制模块,用于衡量不同时刻特征不同的重要程度,并提取其中较为重要的有效信息;长短时记忆网络模块,用于根据自注意力机制模块处理后的序列化信息输出交易决策。本申请训练方法包括使用近端策略优化算法训练一个策略函数π和一个值函数V,其参数分别为θ和。本申请的有益之处在于提供了一种结合了近端策略优化算法和长短时记忆网络的优势从而实现深层次挖掘市场特征的基于自注意力机制的算法交易系统及基于该系统的算法交易模型的训练方法。
-
公开(公告)号:CN113282747A
公开(公告)日:2021-08-20
申请号:CN202110465097.3
申请日:2021-04-28
Applicant: 南京大学
Abstract: 本发明公开一种基于自动机器学习算法选择的文本分类方法,基于级联式自动机器学习的思想,从多种机器学习算法中为文本分类任务配置最优算法,包括:(1)采用文本向量嵌入方法将文本语料数据编码成向量表示,生成文本分类数据集;(2)利用多摇臂赌博机算法从多个机器学习分类算法中选择一个算法;(3)利用超参优化方法自动为所选择的算法搜索一组超参数;(4)基于搜索到的超参数初始化相应算法的超参,并在文本分类数据集上训练模型;(5)重复步骤(2)到步骤(4),直到达到设定的迭代次数,将训练得到的多个分类模型中预测性能最好的模型用于文本分类任务。本方法能自动的为任务文本训练一个鲁棒的分类模型。
-
公开(公告)号:CN113281999A
公开(公告)日:2021-08-20
申请号:CN202110441572.3
申请日:2021-04-23
Applicant: 南京大学
Abstract: 本发明公开一种基于强化学习和迁移学习的无人机自主飞行训练方法(1)创建无人机仿真模拟器环境;(2)构建基于深度学习的环境转移模型,并随机初始化其中的映射;(3)构建强化学习的A3C算法,并随机初始化其飞行策略;(4)构建基于深度学习的环境逆转移模型;(5)收集无人机操作员和策略在现实环境下操作无人机进行飞行得到的飞行数据;(6)基于现实飞行数据,更新环境转移模型;(7)使用和进行基于动作校正的迁移学习,校正飞行策略,并在模拟器执行得到模拟飞行数据;(8)基于模拟飞行数据,使用A3C算法更新飞行策略,同时更新环境逆转移模型。直至策略收敛。最终得到策略作为的现实无人机的初始飞行策略。
-
公开(公告)号:CN113276883A
公开(公告)日:2021-08-20
申请号:CN202110464610.7
申请日:2021-04-28
Applicant: 南京大学
Abstract: 本发明公开一种基于动态生成环境的无人车行驶策略规划方法及实现装置,(1)在模拟器中构建无人驾驶环境。(2)初始化强化学习参数及网络策略模型。(3)与环境交互,收集无人驾驶车辆当前状态,由策略网络进行动作采样,在模拟器中执行动作并进入新的状态。(4)收集车辆在一段生成环境中的累积奖励以及是否成功完成任务,并建立一段新的生成环境。(5)对于车辆的行驶策略,在重复(3)中的操作采集一定强化学习样本后,进行强策略迭代。(6)对于车辆所面临的环境,将由(4)中所述的模式不断生成,并基于对是否成功以及累积奖励的收集,抽取那些失败道路以及低累积奖励道路的环境参数,在这些路段进行反复多次训练。(7)持续上述步骤训练直到策略收敛。
-
公开(公告)号:CN113269045A
公开(公告)日:2021-08-17
申请号:CN202110466339.0
申请日:2021-04-28
Applicant: 南京大学
Abstract: 本申请提供了一种自然场景下中文艺术字检测识别方法,其包括如下步骤:准备文本检测识别的训练数据集;使用所述训练数据集训练一个文字检测识别网络模型文字检测识别网络模型;使待识别图片输入至训练好的所述文字检测识别网络模型;所述文字检测识别网络模型输出输出概率最大的文字序列。本申请的有益之处在于提供了一种能综合有效的识别文字位置和文字内容的自然场景下中文艺术字检测识别方法。
-
公开(公告)号:CN112034888B
公开(公告)日:2021-07-30
申请号:CN202010944803.8
申请日:2020-09-10
Applicant: 南京大学
IPC: G05D1/10
Abstract: 本发明公开一种固定翼无人机自主控制协作策略训练方法,包含以下步骤:(1)基于动力学构建固定翼无人机操控仿真环境Es,采集飞行员控制无人机的真实轨迹数据,通过监督学习的方式学习得到无人机飞行控制策略;(2)构建简化的剥离了飞行控制的抽象环境Ea,创建分组对抗的两组无人机群,使用APEX_QMIX算法学习得到协作策略;(3)以分层强化学习的方式将飞行控制策略和协作策略进行组合,在仿真环境Es中进学得融合策略;(3)迁移到真实环境。本发明方法在现实场景中意义重大,具有泛化性好,成本低,鲁棒性强等特性。
-
公开(公告)号:CN113139624A
公开(公告)日:2021-07-20
申请号:CN202110537802.6
申请日:2021-05-18
Applicant: 南京大学
Abstract: 本申请提供了一种基于机器学习的网络用户分类方法,包括如下步骤:将网络用户特征数据构成若干个源网络用户特征数据;保存源网络用户分类任务的优化经验;将优化经验训练成方向模型;使用贝叶斯优化方法连续采样多个超参数组并保存所采样的多个超参数组;利用方向模型在保存的多个所述超参数组中选择最优的所述超参数组;对所选择的所述超参数组进行采样评估,计算真实的评估结果与方向模型对所述超参数组的评估结果的误差;根据所述真实的评估结果与方向模型对所述超参数组的评估结果的误差对所述方向模型进行调整。本申请的有益之处在于为网络用户分类问题提供了一种在机器学习的超参数优化过程中摆脱对大量采样的依赖从而提升超参数优化效率的基于贝叶斯优化的机器学习超参数处理方法。
-
公开(公告)号:CN113110592A
公开(公告)日:2021-07-13
申请号:CN202110488468.X
申请日:2021-05-06
Applicant: 南京大学
IPC: G05D1/10
Abstract: 本发明公开一种无人机避障与路径规划方法,结合蒙特卡洛树搜索与对比强化学习算法,克服GPS在特定环境中信号不足的问题,实现无人机在复杂环境中避障与路径选择的功能。包括以下几个步骤:(1)构造环境仿真模拟器。(2)无人机在模拟器中获得观测信息,利用深度神经网络处理观测信息。(3)利用蒙特卡洛树搜索进行粗粒度的路径规划,生成无人机前进路径中的阶段性目标点,用于后续强化学习算法的训练。(4)利用强化学习学习无人机精细的控制策略和细粒度的路径规划。(5)基于对比学习加速无人机训练。本发明方法使得无人机在难度系数高,不确定因素大的复杂环境中有自主决策能力,在相当程度上可应对突发情况,完成特定任务。
-
-
-
-
-
-
-
-
-