情绪识别方法、装置、设备及存储介质

    公开(公告)号:CN115050077B

    公开(公告)日:2025-05-16

    申请号:CN202210760941.X

    申请日:2022-06-30

    Abstract: 本申请公开了情绪识别方法、装置、设备及存储介质,应用于神经网络技术领域,该情绪识别模型训练方法包括:获取待测视频和待测音频;在待测视频中确定多个待测视频帧,并利用标签集合中的各个情绪标签分别与待测文本模板拼接生成各个情绪标签分别对应的待测文本数据;将待测视频帧、待测文本数据和待测音频输入情绪识别模型,得到待测非文本编码数据和各个待测文本数据分别对应的各个待测文本编码数据;利用待测非文本编码数据分别和各个待测文本编码数据生成待测相似度数据;将最大待测相似度数据对应的情绪标签确定为待测视频对应的情绪识别结果;该方法引入了标签的本身所包含的语义信息,提高准确率。

    异构计算系统的检查点部署方法、系统、产品以及装置

    公开(公告)号:CN119226092A

    公开(公告)日:2024-12-31

    申请号:CN202411732114.5

    申请日:2024-11-29

    Abstract: 本发明公开了一种异构计算系统的检查点部署方法、系统、产品以及装置,涉及计算机技术领域。根据各异构算力设备的需求参数计算在每个存储设备上部署检查点时各存储设备对应的故障恢复耗时期望值,以权衡各异构算力设备的各需求参数对应检查点恢复的影响。根据各异构算力设备的需求参数和故障恢复耗时期望值确定初步的第一检查点部署关系,以实现在部署过程中针对于各异构算力设备的特性参数对应部署检查点到各个存储设备的局部最优选择的可预测性。根据初步的第一检查点部署关系,通过各异构算力设备的部署位置进行优化确定第二检查点部署关系,有效跳出局部最优解增加找到全局最优解的可能性,提高训练任务的执行效率。

    模型训练方法、视频定位方法、系统、设备、产品及介质

    公开(公告)号:CN118395195B

    公开(公告)日:2024-09-24

    申请号:CN202410853495.6

    申请日:2024-06-28

    Abstract: 本发明公开了一种模型训练方法、视频定位方法、系统、设备、产品及介质,涉及视频数据处理领域,用于解决定位音频事件时将视频模态视作噪声导致定位不准确的问题。获取训练数据集;根据视觉特征得到第一知识图结构,根据音频特征得到第二知识图结构;根据两个知识图结构对第一神经网络模型优化得到目标神经网络模型,目标神经网络模型用于对待处理视频数据进行类别标签定位。本发明通过构建视觉特征和音频特征对应的知识图结构,使用知识图结构优化第一神经网络模型,并未将视觉信息视为噪声,能捕捉和利用音频与视频间的复杂关联关系,能够更好地整合和利用多模态数据,提高得到的目标神经网络模型的定位精度和可靠性。

    视频语言任务执行及其模型训练方法、装置、设备、介质

    公开(公告)号:CN117876940B

    公开(公告)日:2024-05-31

    申请号:CN202410270242.6

    申请日:2024-03-11

    Abstract: 本发明公开了一种视频语言任务执行及其模型训练方法、装置、设备、介质,应用于视频理解技术领域。其中,方法包括将具有文本标签的视频样本、待学习视频参数和待学习帧参数输入至视频语言模型,视觉语言预训练模型提取视觉特征和参数特征,视频帧适配器基于待学习帧参数,将视觉特征转换为满足视觉语言预训练模型需求的帧视觉信息,视频适配器基于待学习视频参数提取视频视觉信息;根据帧视觉信息、视频视觉信息与文本语义特征之间损失信息,对视频语言模型进行迭代更新,直至满足预设模型训练结束条件。本发明可以解决相关技术视频语言模型收敛慢,训练耗时耗资源的问题,能够有效提升视频语言模型的训练效率,节省模型训练所需的计算资源。

    基于分布式系统的网络安全检测方法、系统、设备及介质

    公开(公告)号:CN117811846B

    公开(公告)日:2024-05-28

    申请号:CN202410230120.4

    申请日:2024-02-29

    Abstract: 本发明公开了一种基于分布式系统的网络安全检测方法、系统、设备及介质,涉及网络安全领域,为解决边缘计算设备采用固定大小的本地网络安全检测模型无法发挥最优性能的问题,该方法包括基于本地安全数据训练初始网络安全检测模型;将测试安全数据集输入初始网络安全检测模型后,根据两个输出网络块对应的输出值调整初始网络安全检测模型的神经网络深度得到本地网络安全检测模型;当满足参数更新条件时,利用本地网络安全检测模型的模型参数和关联计算设备的模型参数更新本地网络安全检测模型;通过更新后的本地网络安全检测模型进行本地网络安全检测。本发明能够使边缘计算设备发挥最优的本地网络安全检测性能,减少了通信开销和带宽需求。

    视觉问答及其模型训练方法、装置、电子设备、存储介质

    公开(公告)号:CN117892140A

    公开(公告)日:2024-04-16

    申请号:CN202410295706.9

    申请日:2024-03-15

    Abstract: 本发明公开了一种视觉问答及其模型训练方法、装置、电子设备、存储介质,应用于人工智能领域。其中,方法包括获取视觉问答训练样本数据集;将问题‑图像对样本输入至视觉问答模型,图文编码器对问题‑图像对样本进行图文编码处理,交互解码器从接收到的图文编码特征中提取交互对象的语义特征,推理解码器融合接收到的图文编码特征和交互对象特征,并基于融合图文编码特征对应的正确答案‑正确事件知识标签、与从知识库检索的答案、事件知识间的损失不断地迭代更新,直至满足预设模型训练结束条件。本发明可以解决相关技术无法满足用户高精度问答需求和答案可解释需求的问题,提升了基于场景交互任务中的视觉问答精度,让答案更具有可解释性。

    基于异构数据的设备分簇方法、装置、设备、系统及介质

    公开(公告)号:CN117806838A

    公开(公告)日:2024-04-02

    申请号:CN202410230125.7

    申请日:2024-02-29

    Abstract: 本发明提供基于异构数据的设备分簇方法、装置、设备、系统及介质,涉及计算机技术领域,首先可将多个边缘设备划分至多个设备簇,以便各边缘设备对机器学习模型进行层级联邦训练;同时,在分簇过程中,本发明可确定各边缘设备本地的机器学习模型对同一测试数据集的推理结果,并可基于该推理结果确定各边缘设备间的训练数据相似度;进而,可利用各训练数据相似度将各边缘设备划分至多个设备簇,即可在分簇过程中考虑数据异构的特点和分布情况,并将拥有相似数据的设备放在同一簇中,从而可提高簇内数据的相似性。这样,在各边缘设备进行层级联邦训练时,可确保相近的机器学习模型参数先聚合,可确保全局模型更快收敛,并可提升联邦学习效率。

    目标内容自动生成方法、装置、电子设备及可读存储介质

    公开(公告)号:CN117332823B

    公开(公告)日:2024-03-05

    申请号:CN202311596641.3

    申请日:2023-11-28

    Abstract: 本发明公开了一种目标内容自动生成方法、装置、电子设备及可读存储介质,应用于人工智能领域。其中,方法包括将用户的目标内容生成请求作为提示信息输入至自然语言任务处理模型得到指示任务,通过指令接口调用相应外部执行程序执行任务得到初始目标内容;利用当前长期记忆数据对指示任务和初始目标内容进行处理得到目标更新任务;将目标更新任务、初始目标内容和当前短期记忆数据作为下一轮次的提示信息输入至自然语言任务处理模型,循环执行直至指示任务为终止指令,将其上一轮次的初始目标内容作为目标内容进行输出。本发明可以解决相关技术低精度、低效率且高成本智能生成内(56)对比文件Feng Xiaocheng 等.Topic-to-EssayGeneration with Neural Networks《.PROCEEDINGS OF THE TWENTY-SEVENTHINTERNATIONAL JOINT CONFERENCE ONARTIFICIAL INTELLIGENCE》.2018,4078-4084.Xu Zhen 等.Dynamic Working Memory forContext-Aware Response Generation《.IEEE/ACM Transactions on Audio, Speech, andLanguage Processing》.2019,第27卷(第9期),1419-1431.Minlie Huang 等.Challenges inBuilding Intelligent Open-domain DialogSystems《.ACM Transactions on InformationSystems》.2020,第38卷(第3期),1–32.罗威.长时记忆循环神经网络算法研究《.中国博士学位论文全文数据库 信息科技辑》.2022,第2022年卷(第1期),I140-61.

Patent Agency Ranking