-
公开(公告)号:CN118426966A
公开(公告)日:2024-08-02
申请号:CN202410608731.8
申请日:2024-05-16
Applicant: 南京大学
IPC: G06F9/50 , G06F9/48 , G06N20/00 , G06F18/214 , G06F18/27
Abstract: 本发明公开一种面向智算中心的模型训练算力资源自适应调度方法,智算中心将持续接收到不同的机器学习模型训练任务,针对这些任务,本发明首先采用一种基于学习曲线外推的方法作为资源预测器,能够有效预测每个学习任务的算力资源需求。基于这一预测,资源分配器将结合不同任务的资源需求进行优先级排序,并相应地分配算力资源。最终,资源平衡器负责校正预测与实际分配之间的耦合误差,通过持续的自校正机制,确保资源分配的精确性和高效性。与现有的算力资源调度方法相比,本发明通过高频的资源预测与自校正机制,显著提升了智能算力中心的资源利用效率,满足了更多学习任务的并行训练需求。
-
公开(公告)号:CN113283986B
公开(公告)日:2024-06-25
申请号:CN202110465112.4
申请日:2021-04-28
Applicant: 南京大学
IPC: G06Q40/04 , G06N3/0442
Abstract: 本申请公开了一种基于自注意力机制的算法交易系统及基于该系统的算法交易模型的训练方法。其中系统包括:全连接神经网络模块,用于对输入的交易数据进行特征提取、转换和映射;自注意力机制模块,用于衡量不同时刻特征不同的重要程度,并提取其中较为重要的有效信息;长短时记忆网络模块,用于根据自注意力机制模块处理后的序列化信息输出交易决策。本申请训练方法包括使用近端策略优化算法训练一个策略函数π和一个值函数V,其参数分别为θ和#imgabs0#。本申请的有益之处在于提供了一种结合了近端策略优化算法和长短时记忆网络的优势从而实现深层次挖掘市场特征的基于自注意力机制的算法交易系统及基于该系统的算法交易模型的训练方法。
-
公开(公告)号:CN118013367A
公开(公告)日:2024-05-10
申请号:CN202410185543.9
申请日:2024-02-19
Applicant: 南京大学
IPC: G06F18/241 , G06F18/214
Abstract: 本发明公开一种面向通信领域信号分选的持续学习方法,旨在提高信号分类和识别的准确性和效率。首先通过部署数据采集系统,收集通信信号,这些信号数据将被标注以供后续处理。接着利用持续学习技术,构建一个能够适应不断变化的信号特征的动态模型。该模型采用LoRA微调技术,能够在接收到新类型信号时迅速调整,无需从头开始训练。此外,本发明通过可扩展的兼容子空间技术,建立旧信号和新信号类型之间的映射关系,从而实现对旧模型的有效重用。最后,通过实际信号数据对模型进行测试和验证。本发明使得模型在面对新的或未知的信号类型时具有更高的适应性和精准度,在通信领域的应用中展现出高效率和强大的实用性,特别适用于动态变化的通信环境。
-
公开(公告)号:CN117827749A
公开(公告)日:2024-04-05
申请号:CN202410053874.7
申请日:2024-01-13
Applicant: 南京大学
IPC: G06F16/11 , G06F16/14 , G06F16/16 , G06F16/172
Abstract: 本发明公开一种学件基座系统,包括学件存储层、系统引擎层、系统后端层以及用户界面层。本系统规范学件的结构与存储格式,全流程地支持学件存储、检测、组织、查搜、部署和复用,实现了系统的线上部署,为学件范式下各流程提供了稳定的在线服务和完善的用户交互方式,使用户不再需要从头构建机器学习模型而可以通过使用学件基座系统,在耗费更少的数据和计算资源的情况下得到效果更好的模型。该学件基座系统的四个层级清晰,且层级内的各个模块都由负责不同功能的基模块和子模块组成,整体架构具有高可扩展性。系统构建并管理大规模的、包含来自各种任务环境的学件的学件库,通过查搜和复用库中的模型实现高效解决机器学习任务的目的。
-
公开(公告)号:CN111461122B
公开(公告)日:2024-03-22
申请号:CN202010419375.7
申请日:2020-05-18
Applicant: 南京大学
IPC: G06V30/41 , G06V30/42 , G06V30/148 , G06V30/19 , G06V10/82 , G06N3/0464 , G06N3/084
Abstract: 本发明公开一种证件信息检测与提取方法,使用合成的证件数据集,可以代替真实证件数据集进行Faster‑RCNN检测模型的训练;使用基于深度神经网络的方法对证件信息进行检测与分类,无需特殊预处理;使用端到端的文字识别方法,对不定长的证件文字信息进行识别,不需分割。本发明不需要设定字符长度,更不需要识别单个汉字,避免了因切分错误而对识别率造成的影响,只需将图片输入网络模型中,即可得到文本信息。相对于传统的基于字符模板匹配的方法,在面对低亮度、低对比度、光照不均、变形、残缺、遮挡等问题时,具有很强的适应,精度远远优于传统方法。
-
公开(公告)号:CN117689039A
公开(公告)日:2024-03-12
申请号:CN202311725468.2
申请日:2023-12-15
Applicant: 南京大学
Abstract: 本发明公开一种基于乐观性原则和深度模型的智能体动作生成策略训练方法,将机器人行走任务建模为一个马尔科夫决策过程 ,其中S表示状态空间,指行走过程中机器人能感知到的状态信息;A表示动作空间,包含机器人能执行的所有动作;T表示状态转移函数,给定了机器人在任意状态采取任意动作后转移到的新状态的概率分布;R表示奖励函数,给定了机器人在任意状态采取任意动作后所收到的奖励,γ表示折扣因子;机器人行走仿真环境E模拟了真实机器人行走与环境的交互过程,为决策提供信息;机器人行走策略训练方法包括三个核心模块:基于乐观性原则的深度模型构建,基于深度模型的不确定性规划,以及机器人行走策略的训练。
-
公开(公告)号:CN116542134B
公开(公告)日:2024-02-09
申请号:CN202310392826.6
申请日:2023-04-13
Applicant: 南京大学
IPC: G06F30/27 , G06F16/2458 , G06F18/23213
Abstract: 本发明的目的是提供一种学件组织与查搜的方法和装置。所述方法包括:基于用户查搜模型的请求,向用户设备发送锚位规约、锚位模型以及学件库采用的核函数;接收用户设备发送的锚位模型损失和锚位规约的凸组合系数;根据所述锚位模型损失和锚位规约的凸组合系数,对学件库中的各个模型在用户任务上的损失进行估计;基于各个模型的估计损失,向用户返回估计损失最小的模型。本申请实施例具有以下优点:通过对学件库中的模型与缩略核均值嵌入规约进行组织得到锚位规约和锚位模型,并据此来查搜对用户有帮助的模型,能够有效识别模型在训练任务外的其它任务上可能具有的优异性能,提升了模型查搜的准确性和查搜效率。
-
公开(公告)号:CN116629374B
公开(公告)日:2023-12-26
申请号:CN202310393334.9
申请日:2023-04-13
Applicant: 南京大学
Abstract: 本发明公开一种针对异构特征空间学件的查搜与复用方法,包含两个阶段——提交阶段和部署阶段;在提交阶段,开发者提交模型和准规约,学件库基于所有提交模型的准规约学习子空间和相关的映射函数,同时基于映射函数对上传模型的准规约进行调整;在部署阶段,学件库根据用户提交的准需求查找和推荐模型,然后用户复用模型。本发明在不额外收集跨多个特征空间的辅助数据和不接触提交模型的原始数据的情况下,使得学件库可以统筹管理开发者提供的来自异构特征空间的模型,并通过学件查搜使用户更方便有效地复用学件库中的模型。
-
公开(公告)号:CN117075470A
公开(公告)日:2023-11-17
申请号:CN202310976077.1
申请日:2023-08-04
Applicant: 南京大学
Abstract: 本发明公开一种基于内部逻辑归纳的机器人决策策略训练方法及系统,在像素‑符号混合形式输入的机器人决策环境下,该方法针对不同输入形式的特点,将深度强化学习算法和规则学习算法整合,分别处理像素输入和符号输入。在机器人决策策略训练过程中,规则学习算法从少量高质量样本中归纳出有价值的命题逻辑知识,然后使用归纳的命题逻辑知识进行奖励工程设计,帮助深度强化学习算法的训练,提高训练方法的样本数据利用效率。
-
公开(公告)号:CN113297429B
公开(公告)日:2023-09-29
申请号:CN202110566210.7
申请日:2021-05-24
Applicant: 南京大学
IPC: G06F16/901 , G06F16/906 , G06N3/0464 , G06Q50/00
Abstract: 本发明公开一种基于神经网络架构搜索的社交网络链路预测方法,包括以下步骤:步骤1,构建训练数据集;步骤2,利用神经网络架构搜索框架进行搜索,并对搜索框架进行改进;利用其搜索到的最优cell构建神经网络模型;步骤3,对社交网络进行链路预测。该方法可以自动探索更优的神经网络的结构,从而降低了在链路预测中人工设计神经网络的困难,并可以提高链路预测算法的预测效果。
-
-
-
-
-
-
-
-
-