视频编码方法、视频解码方法、装置和通信设备

    公开(公告)号:CN119277084A

    公开(公告)日:2025-01-07

    申请号:CN202310827426.3

    申请日:2023-07-06

    Abstract: 本申请涉及一种视频编码方法、视频解码方法、装置和通信设备。所述方法通过对视频帧对应的多个视频特征进行融合以及编码,得到编码特征,再将编码特征发送至接收设备。该方法通过融合不同视频特征后进行编码,具备了针对多数量和/或多尺度的视频特征进行编码的能力,在一定程度上提高的视频数据的编码效率,进而当需要对大量的视频特征进行编码后传输时,可以在一定程度上提高视频数据传输的速率。另外,由于对不同视频特征进行了融合处理,可以去除多个视频特征中存在的语义冗余的特征,可以在一定程度上提高编码效果,进而可以提高后期基于编码特征进行解码和还原后的特征的还原度。

    交互控制方法及系统、电子设备
    22.
    发明公开

    公开(公告)号:CN117193582A

    公开(公告)日:2023-12-08

    申请号:CN202311278884.2

    申请日:2023-09-28

    Inventor: 刘宁 杨明川

    Abstract: 本公开实施例是关于一种交互控制方法及系统、电子设备,涉及人工智能技术领域,该方法包括:将交互应用的记忆内容进行存储,所述记忆内容包括交互应用的反馈信息以及属性特征;从记忆内容中进行检索,得到目标任务操作对应的检索结果;基于所述检索结果得到所述目标任务操作对应的任务结果,并根据所述任务结果更新记忆内容;获取待查询信息,基于更新后的记忆内容对所述待查询信息进行检索,并根据检索得到的总体概述摘要确定针对所述待查询信息的响应结果。本公开能够提高交互控制的交互效果。

    任务处理方法、装置、程序产品与电子设备

    公开(公告)号:CN119887099A

    公开(公告)日:2025-04-25

    申请号:CN202411959584.5

    申请日:2024-12-27

    Abstract: 本公开提供一种任务处理方法、装置、程序产品与电子设备,涉及计算机技术领域。该方法包括:接收待处理任务;根据所述待处理任务的业务信息,确定与所述待处理任务对应的关联工作流;其中,所述关联工作流从存储有各类任务的工作流的增强记忆系统中获取;根据所述关联工作流,确定所述待处理任务的目标工作流,并根据所述目标工作流,执行所述待处理任务。本公开通过确定与待处理任务对应的关联工作流,迅速创建目标工作流,相比相关技术中智能体每次从头开始建立工作流的处理方式,极大的提高了创建目标工作流的效率,提升了对待处理任务的处理效率。

    一种模型推理服务、模型预训练装置及视频片段检索方法

    公开(公告)号:CN119719417A

    公开(公告)日:2025-03-28

    申请号:CN202311270462.0

    申请日:2023-09-27

    Abstract: 本申请提供了一种模型推理服务、模型预训练装置及视频片段检索方法,能够精确地检索视频中包含待检索目标的视频片段。该方法包括:获取用户输入的第一文本,其中所述第一文本用于描述待检索目标的信息;将所述第一文本输入视频片段检索模型中的文本编码器,获取所述视频片段检索模型输出的所述第一文本的第一文本特征向量;并将视频中的多个图像帧逐次输入所述视频片段检索模型中的图像编码器,获取所述视频片段检索模型输出的所述多个图像帧的图像特征向量;若所述多个图像帧的图像特征向量中存在与所述第一文本特征向量的相似度满足条件的目标图像特征向量,则将所述目标图像特征向量对应的图像帧作为对应所述待检索目标的图像帧并输出。

    视觉问答模型的训练、视觉问答任务处理方法及装置

    公开(公告)号:CN116894996A

    公开(公告)日:2023-10-17

    申请号:CN202310833232.4

    申请日:2023-07-07

    Abstract: 本公开涉及机器学习技术领域,涉及一种视觉问答模型的训练方法及装置、视觉问答任务处理方法及装置、计算机可读存储介质及电子设备,视觉问答模型的训练方法包括:获取初始训练数据,初始训练数据包括图文输入数据以及图文输入数据对应的真值答案,其中,图文输入数据包括图像特征数据和文本特征数据;将图文输入数据输入至第一初始模型得到第一参考答案;基于第一参考答案和真值答案对初始训练数据进行筛选得到第一目标训练数据;利用第一目标训练数据的第一参考答案以及对应的真值答案更新第二初始模型得到视觉问答模型;其中,第一初始模型和第二初始模型的模型架构一致。本公开实施例的技术方案提高了得到视觉问答模型的处理精度。

    问答方法、装置、电子设备及存储介质

    公开(公告)号:CN116860941A

    公开(公告)日:2023-10-10

    申请号:CN202310854442.1

    申请日:2023-07-12

    Inventor: 胡婕 杨明川 李伟

    Abstract: 本公开提供了一种问答方法、装置、电子设备及存储介质,涉及自然语言处理技术领域。本公开通过获取待回答问题;将待回答问题拆分为多个子问题,生成待回答问题的实体序列和动作序列,实体序列中包含待回答问题中所有子问题的多个实体且多个实体按照待回答子问题的顺序进行排序,动作序列中包含待回答问题中所有子问题的多个动作且多个动作按照待回答子问题的顺序进行排序;遍历实体序列和动作序列,获取第一子问题的答案,根据第一子问题的答案生成第二子问题的答案,确定为待回答问题的回答结果。本公开提供的问答方法,既增加了回答结果的准确度,又提高了用户获取答案的速度,提升了用户满意度。

    图像处理方法、装置、设备、存储介质和程序产品

    公开(公告)号:CN119991463A

    公开(公告)日:2025-05-13

    申请号:CN202510059316.6

    申请日:2025-01-14

    Abstract: 本公开提供了一种图像处理方法、装置、设备、存储介质和程序产品,涉及图像处理技术领域。其中,图像处理方法包括:基于补帧网络分别对在时域上相邻的第一图像和第二图像进行至少一个通道的光流学习,得到补帧图像的所述至少一个通道的通道分量,所述补帧图像在所述时域上位于所述第一图像和所述第二图像之间,或位于所述第一图像和所述第二图像之后;基于所述至少一个通道的通道分量生成所述补帧图像。通过本公开的技术方案,通过选择至少一个通道进行光流学习,实现灵活的通道选择,进而可以根据实际需求灵活调整计算量,能够在保证视觉效果的前提下,减少计算资源的消耗。

Patent Agency Ranking