-
公开(公告)号:CN119225530A
公开(公告)日:2024-12-31
申请号:CN202411208770.5
申请日:2024-08-30
Applicant: 北京大学
IPC: G06F3/01 , G06F3/04815 , G06T17/00 , G06T15/00 , G06T19/20
Abstract: 本申请公开了一种人机交互方法、装置、介质及电子设备,方法包括:响应于用户针对目标对象的选择指令,展示目标对象的数字3D模型;在数字3D模型的展示时长到达预设时长的情况下,获取目标对象的介绍文本;根据介绍文本,通过多模态大模型对数字3D模型进行推理,得到与介绍文本相关的分割区域,多模态大模型用于将介绍文本与多个视角的2D图像进行对齐并分割,多个视角的2D图像是将数字3D模型的不同预定义视点进行渲染得到的;播放介绍文本对应的音频,并显示分割区域。因此,采用本申请实施例,用户在面对文化遗产的数字化展示时,可以将抽象的文本解释与具体的文化细节有效联系起来,从而提升了用户的体验和学习效果。
-
公开(公告)号:CN114615494B
公开(公告)日:2024-09-27
申请号:CN202011409791.5
申请日:2020-12-04
Applicant: 咪咕文化科技有限公司 , 北京大学 , 中国移动通信集团有限公司
IPC: H04N19/117 , H04N19/147 , H04N19/176 , H04N19/186
Abstract: 本发明提供了一种图像处理方法、装置及设备,其中,图像处理方法包括:对待处理图像进行N层块划分,得到每一层块划分对应的滤波单元;滤波单元为第一滤波单元或第二滤波单元;获取各个所述第一滤波单元的第一率失真代价以及各个所述第一滤波单元所对应的第二滤波单元的第二率失真代价的总和;根据所述第一率失真代价和所述总和,确定所述待处理图像的最终分块结果。本方案很好的解决了现有技术中图像处理方案浪费处理资源的问题。
-
公开(公告)号:CN111866506B
公开(公告)日:2024-09-06
申请号:CN202010509308.4
申请日:2020-06-07
Applicant: 咪咕文化科技有限公司 , 北京大学 , 中国移动通信集团有限公司
IPC: H04N19/147 , H04N19/186 , H04N19/82 , H04N19/86
Abstract: 本发明提供了一种图像编码方法、装置、设备及可读存储介质,所述方法包括确定当前编码帧对应的目标滤波信息;若所述目标滤波信息是基于所述当前编码帧的所有像素进行分类获得的第一滤波信息,则将所述目标滤波信息编码至码流中;若所述目标滤波信息是时域信息列表中的一个第二滤波信息,则将所述目标滤波信息在所述时域信息列表中对应的第一标识信息编码至所述码流中;其中,所述时域信息列表包含有K个第二滤波信息,所述第二滤波信息是基于目标编码帧的所有像素进行分类获得的滤波信息,所述目标编码帧的时序在所述当前编码帧之前,K为正整数。本发明的方案能够减少码流中的参数数量,降低码流消耗,并且还有利于提高编码效率。
-
公开(公告)号:CN117422855B
公开(公告)日:2024-05-03
申请号:CN202311750184.9
申请日:2023-12-19
Applicant: 浙江省北大信息技术高等研究院 , 北京大学
Abstract: 本申请提出一种面向机器视觉的图像预处理方法、装置、设备及存储介质,该方法包括:对原始图像进行模糊处理生成待增强图像,待增强图像的清晰度低于原始图像的清晰度;对待增强图像的语义特征进行增强处理生成目标图像;将目标图像输入图像处理神经网络,以触发所述图像处理神经网络基于所述目标图像的语义特征执行图像分析任务。本申请实施例提供的图像预处理技术,能够在降低码率的情况下,将图像处理神经网络的分析性维持在较佳的水平。
-
公开(公告)号:CN111247804B
公开(公告)日:2023-10-13
申请号:CN201980005232.7
申请日:2019-03-12
Applicant: 北京大学 , 深圳市大疆创新科技有限公司
IPC: H04N19/513 , H04N19/56 , H04N19/82 , H04N19/176 , H04N19/13 , H04N19/107
Abstract: 提供一种图像处理的方法与装置,该方法包括:获取图像块的控制点的运动矢量CPMV;根据该图像块的CPMV,获取该图像块中子图像块的运动矢量,运动矢量为整像素精度。通过使作为图像处理单元的子图像块的运动矢量为整像素精度,可以使子图像块的运动补偿过程不涉及亚像素,从而在一定程度上可以降低Affine预测技术产生的带宽压力。
-
公开(公告)号:CN116866605A
公开(公告)日:2023-10-10
申请号:CN202311024533.9
申请日:2019-01-03
Applicant: 北京大学 , 深圳市大疆创新科技有限公司
IPC: H04N19/513 , H04N19/176 , H04N19/107
Abstract: 提供一种视频处理方法和装置,该方法包括:获取当前块的参考帧列表,当前块的参考帧列表包括第一参考帧列表和第二参考帧列表;根据当前块的参考帧列表,确定目标参考帧列表,目标参考帧列表为第一参考帧列表和第二参考帧列表之一;根据当前块的目标参考帧列表确定当前块的时域运动矢量;根据时域运动矢量确定当前块的子块的运动信息;根据当前块的子块的运动信息对当前块进行帧间预测。通过限制双向预测过程中需要扫描的参考帧列表的数量,可以简化编解码操作。
-
公开(公告)号:CN116634172A
公开(公告)日:2023-08-22
申请号:CN202310664406.9
申请日:2019-01-02
Applicant: 北京大学 , 深圳市大疆创新科技有限公司
IPC: H04N19/52 , H04N19/577 , H04N19/105
Abstract: 本申请实施例提供一种候选MV列表构建方法和装置,包括:在帧间预测模式为第一合并模式时,构建第一合并模式下的当前图像块的第一候选MV列表;在帧间预测模式为第二合并模式时,获取当前图像块的第一候选MV列表,若第一候选MV列表中包括双向MV,则对第一候选MV列表中的MV进行重组,得到第二合并模式下的当前图像块的第二候选MV列表。本申请实施例提供的候选MV列表构建方法和装置,可降低视频编解码装置硬件的复杂度。
-
公开(公告)号:CN116527911A
公开(公告)日:2023-08-01
申请号:CN202310437128.3
申请日:2023-04-21
Applicant: 北京大学
IPC: H04N19/156 , H04N19/124 , H04N19/146 , H04N19/42
Abstract: 本发明提供一种码率控制的方法及装置,所述方法包括:获取当前时刻编码缓存器的第一实际充溢度;通过对所述第一实际充溢度进行指数映射,确定量化步长;所述指数映射的目标关系式中的指数函数的底数为大于1的数;基于所述量化步长确定当前编码单元的量化参数。基于此,在待编码图像的编码难度升高时,缓冲编码缓存器的充溢度的波动以缓解缓存器的状态。
-
公开(公告)号:CN113766247B
公开(公告)日:2023-07-25
申请号:CN202111185949.X
申请日:2019-06-25
Applicant: 北京大学 , 深圳市大疆创新科技有限公司
IPC: H04N19/61 , H04N19/82 , H04N19/70 , H04N19/147 , H04N19/184 , H04N19/186
Abstract: 提供环路滤波的方法与装置,通过优化编解码环路滤波过程中的编码方式,降低环路滤波的计算复杂度,加快计算速度,提高编解码性能。一种环路滤波的方法包括:确定环路滤波的多组滤波系数;采用非差分编码方式对所述多组滤波系数进行编码。另一环路滤波的方法包括:确定环路滤波的修正索引参数;采用非指数哥伦布编码方式对所述修正索引参数进行编码。还涉及一种环路滤波的方法包括:确定图像帧的亮度分量的环路滤波修正参数以及色度分量的环路滤波修正参数;其中,所述亮度分量的环路滤波修正参数以及所述色度分量的环路滤波修正参数为从同一个参数列表中选择的参数。
-
公开(公告)号:CN112843677B
公开(公告)日:2023-07-11
申请号:CN202110172567.7
申请日:2021-02-08
IPC: A63F13/358 , G06V10/46 , G06V10/764
Abstract: 本公开实施例提供一种系统延时确定方法、装置、设备和存储介质,包括:响应于作用在背景窗口的多媒体信号上的用户操作指令,获取用户操作指令的输入时刻;检测背景窗口和前景窗口中的多媒体信号,其中,背景窗口是输入时刻之前的第一时间窗口,前景窗口是输入时刻之后的第二时间窗口;基于前景窗口中的多媒体信号相对于背景窗口中的多媒体信号的突变情况,确定用户操作指令的响应时刻;根据输入时刻和响应时刻确定系统的系统延时。本公开实施例通过获取用户操作指令的输入时刻以及用户操作指令对应的响应时刻确定系统延时,该方案不需要昂贵的硬件设备,也不需要过多的人工参与,可以方便快捷地测量远程渲染系统的交互延时。
-
-
-
-
-
-
-
-
-