-
公开(公告)号:CN118551824A
公开(公告)日:2024-08-27
申请号:CN202410671703.0
申请日:2024-05-28
Applicant: 萨思数字科技(北京)有限公司 , 中国科学技术大学
IPC: G06N3/092 , G06N3/0455 , G06F16/332 , G06F16/33 , G06F16/35 , G06F18/2415
Abstract: 一种基于强化学习训练文本生成模型的方法和装置,所述方法包括:基于第一训练样本生成第二训练样本,所述第二训练样本包括:问题、第二支持文本;将所述问题和所述第二支持文本输入所述文本生成模型,获取所述文本生成模型输出的回复;根据所述回复确定第一反馈值;通过强化学习算法基于所述第一反馈值和所述回复调整所述文本生成模型的参数。
-
公开(公告)号:CN112287690B
公开(公告)日:2024-11-26
申请号:CN202011182427.X
申请日:2020-10-29
Applicant: 中国科学技术大学
IPC: G06F40/30 , G06F40/126 , G06F40/211 , G09B21/00
Abstract: 本发明公开了一种基于条件句子生成和跨模态重排的手语翻译方法,包括:将手语视频序列划分为若干视频片段,通过三维卷积神经网络从视频片段集合中提取时序特征,再通过时序建模器识别出手语视频序列中表达的关键词集合;对关键词集合编解码处理,生成由关键词组成的通顺句子集合;将通顺句子集合与手语视频序列进行比较,找出与手语视频序列相关度最高的句子,作为手语翻译结果。
-
公开(公告)号:CN118819695A
公开(公告)日:2024-10-22
申请号:CN202310429346.2
申请日:2023-04-20
Applicant: 华为云计算技术有限公司 , 中国科学技术大学
Abstract: 本申请公开了一种提示学习方法,该方法中,获取至少一组数据对,任意一组数据对包括第一数据和第二数据,第一数据包括第一提示和采用源语言的第一语料,第二数据包括第二提示和采用目标语言的第二语料,第一语料和第二语料组成一对平行语料;根据至少一组数据对以及预训练语言模型进行提示学习,以使得训练后的预训练语言模型能够根据训练后的第二提示执行基于目标语言的自然语言处理任务。这样,在提示学习过程中,预训练语言模型和/或第二提示等参数可以根据由平行语料所构建的数据对而调整,以使得训练后的预训练语言模型和/或训练后的第二提示能够对齐源语言和目标语言,缓解了跨语言迁移过程中由于语言表征差异性所带来的性能损失。
-
公开(公告)号:CN114612985B
公开(公告)日:2024-04-02
申请号:CN202210264194.0
申请日:2022-03-17
Applicant: 中国科学技术大学
IPC: G06V40/16 , G06V40/10 , G06F16/732 , G06F16/735 , G06F16/738 , G06V10/74 , G06V10/80 , G06N3/0464 , G06V10/82
Abstract: 本发明公开了一种肖像查询方法、系统、设备及存储介质,设计了一种新的查询框架,进一步挖掘人脸信息,增加人物查询结果间的约束,并设法减轻人物换装的影响,提升肖像查询的准确率;具体的:1)人脸检索时,使用检索到的数据库中高置信度人脸进行多次迭代检索,进一步挖掘人脸检索性能,得到新的查询集合,在保证准确率的同时,提高检索到的可靠样本的数量。2)通过增加人物查询结果间的约束,对待检索数据库进行缩减,进一步提升了检索的性能。3)通过对躯体外观特征使用KNN特征拓展进行增强,改善检索结果,并设计Top‑λ相似度,尽可能地排除不同着装对特征相似度的影响。
-
公开(公告)号:CN117114078B
公开(公告)日:2024-02-23
申请号:CN202311374772.7
申请日:2023-10-23
Applicant: 中国科学技术大学
IPC: G06N3/092 , G06N3/0455 , G06F18/2131
Abstract: 本发明公开了一种提升连续控制机器人训练效率的方法、设备及存储介质,方法包括:步骤1,经与机器人通信连接的传感器获取状态数据;步骤2,用多层密集连接的特征编码器对状态数据编码得百维向量作为状态表征数据;步骤3,用多层感知的傅里叶函数预测器将状态表征数据映射为傅里叶函数,以傅里叶函数逼近真实状态序列的频域变换方式优化更新特征编码器和傅里叶函数预测器;步骤4,将优化更新后的特征编码器输出的状态表征数据作为多层感知决策模型的输入,再用传统强化学习中的训练方法更新优化多层感知决策模型。步骤5,重复步骤1至步骤4直至训练结束。该方法能增强机器人从序列数据中的信息提取能力,进而提升机器人训练效率。
-
公开(公告)号:CN116544956A
公开(公告)日:2023-08-04
申请号:CN202310604746.2
申请日:2023-05-26
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种基于多智能体的配电网电压控制方法、系统、设备及介质,能够在大部分场景下自动调节光伏逆变器的无功功率并维持电压在安全范围内。相较于传统方案,本发明能够大大减少计算负担,且基于神经网络的策略能够进行快速推理,能够实时响应电网调度中的各种情况。同时与现有的用于电压控制任务的多智能体强化学习方案相比,加入了自主纠正危险动作的机制,能有效减少电压越限情况的方式,同时可以仅依赖于局部电网信息进行决策,能够很好的满足分布式部署地需求。因此,本发明可以便携地部署到局部电压控制设备中,应用场景广泛,为电网调度向智能化方向的发展提供了有力的技术支持,同时也能促进分布式可再生能源在电网发电端的普及。
-
公开(公告)号:CN116328312A
公开(公告)日:2023-06-27
申请号:CN202310243199.X
申请日:2023-03-14
Applicant: 中国科学技术大学
IPC: A63F13/67 , G06N3/08 , G06N3/0464
Abstract: 本发明公开了一种斗地主游戏自动博弈方法、系统、设备及存储介质,无需依赖人类先验知识,同时可以应对斗地主游戏庞大的状态和动作空间的斗地主游戏自动博弈方案,通过对手建模机制,预测下家的手牌,进而决策下一步的出牌策略,可以有效的提升斗地主游戏中智能化程度;并且,自博弈训练的过程也能够有助于科研人员对自动博弈的学术研究。
-
公开(公告)号:CN116245156A
公开(公告)日:2023-06-09
申请号:CN202310069298.0
申请日:2023-02-06
Applicant: 中国科学技术大学
IPC: G06N3/08 , G06N3/0499 , G06N3/048 , G06N5/04
Abstract: 本发明公开了一种多智能体场景的强化学习与应用方法、系统、设备及介质,设计了基于自注意力机制的值函数分解模块,它构造了智能体对的动作值,然后使用联系系数对它们进行加权,联系系数测量了智能体在多智能体系统中相互联系关系。解决了在价值分解方法中直接使用自注意机制所带来的最优动作一致原理不能得到保证的问题。基于自注意力机制的值函数分解模块可以被视为一个基本模块,应用于现有的价值分解方法,以提高性能。在多个模拟环境上的实证结果进一步表明,基于自注意力机制的值函数分解模块学习了多智能体系统中智能体之间合理的内部联系关系,与现有方案相比,学习性能有了显著提高。
-
公开(公告)号:CN111079661B
公开(公告)日:2022-07-15
申请号:CN201911319045.4
申请日:2019-12-19
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种手语识别系统,它可以显式地建模时空多线索之间的相关性,实现完整的手语视觉描述。在本系统中,空间多线索模块可以通过内置的姿态估计模块高效地分解出多线索特征。时间多线索模块由线索内和线索间建模器组成,可以在保留每一种线索的独有特征的同时探索不同线索带来的增益。除此之外,还设计了一种多线索序列优化算法,可以端到端的优化整个系统的参数和模块。根据设计的整套系统和优化算法,手语识别的准确率大幅提升。
-
公开(公告)号:CN114565979A
公开(公告)日:2022-05-31
申请号:CN202210213206.7
申请日:2022-03-04
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种行人重识别方法、系统、设备及存储介质,本发明将人脸识别有效地融入行人重识别任务中,在寻找行人时,将人脸和身体外观的信息相互融合,且这种融合不再局限于单样本中的信息融合,而是考虑到了不同样本的近邻样本的上下文信息,对人脸质量的不稳定容忍度高,融合性能更加鲁棒、优异。同时,本发明扩展性高,可与大量已有的行人重识别和人脸识别技术相结合,进一步提升性能。
-
-
-
-
-
-
-
-
-