资源处理方法及相关装置、设备、系统和存储介质

    公开(公告)号:CN117667400A

    公开(公告)日:2024-03-08

    申请号:CN202311649872.6

    申请日:2023-11-29

    Abstract: 本申请公开了一种资源处理方法及相关装置、设备、系统和存储介质,其中,资源处理方法包括:接收来自业务终端对目标资源的第一操作请求;基于在中心节点预先配置的资源维护信息对第一操作请求进行解析,确定目标资源所在的数据节点作为目标节点以及目标节点的第一连接参数和目标资源的第二连接参数;基于第一连接参数和第二连接参数,构造第二操作请求;基于第二操作请求中第一连接参数,发送第二操作请求至目标节点;其中,目标节点至少基于第二操作请求中第二连接参数对目标资源执行操作。上述方案,能够在多节点系统中,提升系统易用性和可维护性。

    一种语音识别模型的训练方法、语音识别方法和相关装置

    公开(公告)号:CN117894301A

    公开(公告)日:2024-04-16

    申请号:CN202311870858.9

    申请日:2023-12-29

    Abstract: 本申请公开了一种语音识别模型的训练方法、语音识别方法和相关装置,该方法包括:利用语音识别模型对第一样本语音特征进行多次编码处理,得到第一样本语音编码特征,其中,至少一次编码处理作为目标编码处理,目标编码处理得到的编码特征作为样本目标特征,目标编码处理的输出特征为基于目标编码处理对应的样本分类特征得到,样本分类特征是对样本目标特征进行对应的目标建模单元的分类预测得到,对第一样本语音编码特征进行解码,得到第一样本语音对应的第一样本识别文本;基于第一样本识别文本和样本分类特征,调整语音识别模型的模型参数,能够提升语音识别模型的训练效率。

    多模态通用模型的预训练方法、语音识别方法及相关装置

    公开(公告)号:CN117953874A

    公开(公告)日:2024-04-30

    申请号:CN202311867273.1

    申请日:2023-12-29

    Abstract: 本申请提出一种多模态通用模型的预训练方法、语音识别方法及相关装置,能够基于不同模态的数据对多模态通用模型进行训练,提升多模态通用模型对具有多模态输入的下游任务的通用性,并且通过以拉近同源数据组中各数据对应的数据特征的距离为目标,对多模态通用模型的参数进行调整,能够使多模态通用模型对不同模态但描述相同或相近内容的数据进行相同的理解,进而提高对具有多模态输入的下游任务的预测结果的准确性,提升多模态通用模型针对具有多模态输入的下游任务的解决能力。

    信息补全方法及相关装置、设备、系统和存储介质

    公开(公告)号:CN117951317A

    公开(公告)日:2024-04-30

    申请号:CN202311739604.3

    申请日:2023-12-15

    Abstract: 本申请公开了一种信息补全方法及相关装置、设备、系统和存储介质,其中,信息补全方法包括:获取待补全多媒体资源的第一属性数据,并获取多媒体资源库;基于待补全多媒体资源分别与各个预设多媒体资源之间的名称相似度,选择预设多媒体资源作为候选多媒体资源;基于待补全多媒体资源的第一属性数据和候选多媒体资源的第二属性数据,构造用于指示大语言模型辨别候选多媒体资源是否与待补全多媒体资源为同一多媒体资源的提示文本;将提示文本输入至大语言模型,得到辨别结果;基于辨别结果,选择候选多媒体资源的第二属性数据对待补全多媒体资源的第一属性数据进行信息补全。上述方案,能够提升信息补全的补全速度和补全精度。

    计划管理方法、装置、电子设备和存储介质

    公开(公告)号:CN119863082A

    公开(公告)日:2025-04-22

    申请号:CN202411964239.0

    申请日:2024-12-30

    Abstract: 本发明涉及人工智能技术领域,提供一种计划管理方法、装置、电子设备和存储介质,方法包括:确定需求文本和用户个性化信息;基于专家规则模型,应用所述需求文本和用户个性化信息,生成当前计划,基于逻辑推理模型和所述用户个性化信息,对所述当前计划进行可行性推理,并基于当前计划的推理结果调整所述当前计划,直至得到阶段计划;所述专家规则模型和所述逻辑推理模型基于大型语言模型训练得到;基于所述阶段计划的执行情况,管理所述阶段计划。本发明提供的计划管理方法、装置、电子设备和存储介质,能够及时发现并修正计划中的不合理之处,确保计划的顺利执行,从而增强计划的可行性和可靠性。

    行人轨迹预测方法、装置、电子设备及存储介质

    公开(公告)号:CN118038484A

    公开(公告)日:2024-05-14

    申请号:CN202311739412.2

    申请日:2023-12-15

    Abstract: 本申请提出一种行人轨迹预测方法、装置、电子设备及存储介质,该方法包括:基于第一行人的历史轨迹对应的历史轨迹特征,预测历史轨迹对应的未来轨迹的终点,并确定未来轨迹的终点对应的轨迹终点特征;基于第一行人的历史轨迹特征和轨迹终点特征,预测第一行人的下一轨迹点;将第一行人的下一轨迹点与第一行人的历史轨迹组合,得到更新后的第一行人的历史轨迹;重复执行上述步骤,得到由预测的各个下一轨迹点按照预测顺序组成的预测轨迹。采用本申请的技术方案,先预测出行人未来轨迹的终点,从而确定行人意图,再根据未来轨迹的终点和历史轨迹预测出下一轨迹点,能够在确定行人意图的情况下对未来轨迹进行预测,提高了行人轨迹预测的准确度。

    一种虚拟形象对话交互方法及相关设备和系统

    公开(公告)号:CN116563500A

    公开(公告)日:2023-08-08

    申请号:CN202310371245.4

    申请日:2023-04-04

    Abstract: 本发明提供了一种虚拟形象对话交互方法及相关设备和系统,其中,虚拟形象对话交互方法包括:接收终端发送的用户交互信息,用户交互信息包括用户的交互输入信息;根据用户交互信息,从预先构建的预渲染资源集中获取对交互输入信息进行响应所需的预渲染资源,预渲染资源集包括3D虚拟形象的若干条不同的预渲染资源,3D虚拟形象的每条预渲染资源包括虚拟形象资源和相关联的话术资源;将获取的预渲染资源发送至终端,以使终端在接收到预渲染资源时,将接收的预渲染资源渲染成3D虚拟形象的交互响应视频并展示。本发明提供的虚拟形象对话交互方法对终端的性能没有较高的要求,这使得本发明提供的虚拟形象对话交互方法能够大规模在C端落地。

Patent Agency Ranking