基于用户反馈的大语言模型对话生成方法及装置、计算机可读存储介质、终端

    公开(公告)号:CN117573818A

    公开(公告)日:2024-02-20

    申请号:CN202311378499.5

    申请日:2023-10-23

    Inventor: 蔡华 宣晓华

    Abstract: 一种基于用户反馈的大语言模型对话生成方法及装置、计算机可读存储介质、终端,所述方法包括:接收当前会话轮次输入的问题;将所述问题输入第一预设大语言模型,得到第一预测结果,其中,所述第一预设大语言模型至少用于根据输入的问题预测用户的初级反馈信息;根据所述问题、所述第一预测结果和预设记忆库生成输入数据,其中,所述预设记忆库存储有用户对历史上至少一次会话轮次的对话的纠正反馈;将所述输入数据输入第二预设大语言模型,得到第二预测结果,其中,所述第二预设大语言模型用于根据输入数据预测对应当前会话轮次的增强对话回复以及对所述问题的理解。本发明可以使得对话系统变得更加智能,具有知识实时性和个性化。

    人体关键点生成方法及装置、计算机可读存储介质、终端

    公开(公告)号:CN117520762A

    公开(公告)日:2024-02-06

    申请号:CN202311260150.1

    申请日:2023-09-26

    Abstract: 一种人体关键点生成方法及装置、计算机可读存储介质、终端,所述人体关键点包含人脸关键点和躯体关键点,所述方法包括:对目标音频进行第一特征提取得到第一特征序列,然后解码得到多组人脸关键点,第一特征序列至少包含目标音频的语义信息和韵律信息;对目标音频进行第二特征提取得到第二特征序列,第二特征序列包含目标音频的语义信息且不包含韵律信息;采用第二特征序列与预设的待匹配样本库中的至少一部分样本特征序列进行特征匹配,以确定相似度最高的样本特征序列;基于所述多组人脸关键点,以及相似度最高的样本特征序列对应的一组或多组躯体关键点进行拼接,得到多组人体关键点。上述方案有助于提高生成的人体关键点的准确性和稳定性。

    图片的多标签分类方法、系统及电子设备

    公开(公告)号:CN118674995A

    公开(公告)日:2024-09-20

    申请号:CN202410909676.6

    申请日:2024-07-09

    Abstract: 本公开提供了一种图片的多标签分类方法、系统及电子设备。多标签分类方法包括:获取目标图片的第一图片特征;其中,第一图片特征包含冗余信息和噪音;基于多头注意力机制对第一图片特征进行压缩处理,以去除冗余信息,得到第二图片特征;基于稀疏编码对第二图片特征进行去噪处理,以得到目标图片特征;对目标图片特征所属的类别进行概率预测,以对目标图片进行多标签分类。基于多头注意力机制和稀疏编码依次对第一图片特征进行压缩和去噪处理,以去除第一图片特征中的以使得到的目标图片特征冗余信息和噪声,以使得到的目标图片特征只保留有价值的特征,进而使用该目标图片特征进行图片的多标签分类的效果更佳。

    大语言模型的处理方法、系统、设备、介质及程序产品

    公开(公告)号:CN118297107A

    公开(公告)日:2024-07-05

    申请号:CN202410390211.4

    申请日:2024-04-02

    Abstract: 本公开提供了一种大语言模型的处理方法、系统、设备、介质及程序产品,处理方法包括:获取数据集;根据数据集生成伪标签数据;根据伪标签数据获取指令微调数据;利用指令微调数据对原始大语言模型进行指令微调,得到新的大语言模型。本公开根据获取的数据集生成伪标签数据;再根据伪标签数据获取指令微调数据;利用指令微调数据对原始大语言模型进行指令微调,得到新的大语言模型,实现了基于伪标签数据对大语言模型进行指令微调,有效的缓解了大语言模型灾难性遗忘的问题,严格遵守了连续学习的形式,降低了计算的复杂度,提高了计算的效率和准确率。

    人脸图像生成方法及装置、计算机可读存储介质、终端

    公开(公告)号:CN117372553B

    公开(公告)日:2024-05-10

    申请号:CN202311085684.5

    申请日:2023-08-25

    Abstract: 一种人脸图像生成方法及装置、计算机可读存储介质、终端,方法包括:确定人脸图像生成模型,包括图像编码子模型、音频编码子模型、音频映射子模型以及解码子模型;将驱动音频输入音频编码子模型,得到音频编码特征,以及将下半部分被遮挡的人脸图像输入图像编码子模型,得到人脸图像编码特征;将音频编码特征输入音频映射子模型,得到权重向量;采用权重向量,对预设的多个记忆口型编码特征进行加权运算,得到融合口型特征,其中,多个记忆口型编码特征对应于不同类型的口型;将音频编码特征、人脸图像编码特征以及融合口型特征,输入解码子模型,得到人脸生成图像。上述方案有助于提高人脸生成图像与驱动音频的口型匹配度。

    人脸图像生成方法及装置、计算机可读存储介质、终端

    公开(公告)号:CN117372553A

    公开(公告)日:2024-01-09

    申请号:CN202311085684.5

    申请日:2023-08-25

    Abstract: 一种人脸图像生成方法及装置、计算机可读存储介质、终端,方法包括:确定人脸图像生成模型,包括图像编码子模型、音频编码子模型、音频映射子模型以及解码子模型;将驱动音频输入音频编码子模型,得到音频编码特征,以及将下半部分被遮挡的人脸图像输入图像编码子模型,得到人脸图像编码特征;将音频编码特征输入音频映射子模型,得到权重向量;采用权重向量,对预设的多个记忆口型编码特征进行加权运算,得到融合口型特征,其中,多个记忆口型编码特征对应于不同类型的口型;将音频编码特征、人脸图像编码特征以及融合口型特征,输入解码子模型,得到人脸生成图像。上述方案有助于提高人脸生成图像与驱动音频的口型匹配度。

    一种基于规则引擎的连铸质量预判模型在线系统

    公开(公告)号:CN114862099A

    公开(公告)日:2022-08-05

    申请号:CN202210287426.4

    申请日:2022-03-23

    Inventor: 余炯 宣晓华

    Abstract: 本发明提供了一种基于规则引擎的连铸质量预判模型在线系统,涉及人工智能领域,包括:规则引擎模块,用于提炼工艺质量判定规则,编辑核心策略,形成连铸质量预判模型;基于核心策略对输入的L1、L2系统数据,进行实时决策并输出决策数据;生成决策报表,显示决策数据情况;在线部署模块,用于将连铸质量预判模型部署到在线系统;通过人工对现场板坯的检查结果,对连铸质量预测模型进行调整,并再次进行在线部署;决策数据分析模块,用于对经连铸质量预判模型预判无故障的板坯进行质量判级;对经核心策略预判存在故障的板坯,根据决策数据指导板坯的切割优化。本发明通过数字化在线规则引擎进行规则引擎系统搭建,实现薄带连铸环节的智能化。

    一种人形机器人控制方法、系统、存储介质和程序产品

    公开(公告)号:CN119238533A

    公开(公告)日:2025-01-03

    申请号:CN202411651055.9

    申请日:2024-11-18

    Abstract: 本发明提供一种人形机器人控制方法、系统、存储介质和程序产品,属于计算机视觉领域。其中方法包括:预处理专家动作数据,将专家动作数据处理成和目标机器人骨骼架构相当的专家数据;在仿真环境中采用人形结构搭建机器人,配置机器人的关节参数,每个关节自由度由独立的物理控制模块进行控制;构建机器人的策略表征方法,包括状态空间、动作空间、奖励函数、多帧式控制方式;对机器人进行初始化;最小化每帧上的机器人动作与专家动作间的差异,最大化奖励函数,驱动机器人学习。本发明可以辅助人形机器人的学习过程,使得机器人可以在完成任务的同时拟人化,并且训练速度有所提升。

    手势生成方法及装置、计算机可读存储介质、终端

    公开(公告)号:CN117456598A

    公开(公告)日:2024-01-26

    申请号:CN202311169519.8

    申请日:2023-09-11

    Abstract: 一种手势生成方法及装置、计算机可读存储介质、终端,方法包括:确定时序对齐的音频语义特征序列、音频韵律特征序列、手势词特征序列;基于各个特征序列以及预训练模型执行多轮迭代,以确定生成手势特征序列;在每轮迭代中,至少基于第i个手势词特征以及第i个音频语义特征进行特征融合,得到第一融合特征,并基于所述第一融合特征确定目标手势词特征;至少基于第i个手势词特征以及第i个音频韵律特征进行特征融合,得到第二融合特征;至少基于目标手势词特征以及第二融合特征进行拼接处理,得到拼接结果;将所述拼接结果输入所述预训练模型,得到第i轮输出的生成手势特征。上述方案有助于生成能准确表达语义且体现个性差异的手势。

Patent Agency Ranking