-
公开(公告)号:CN111816166A
公开(公告)日:2020-10-23
申请号:CN202010694750.9
申请日:2020-07-17
Abstract: 提供一种声音识别方法、装置以及存储指令的计算机可读存储介质。所述声音识别方法包括:获取输入音频的时域特征;获取所述输入音频的频域特征;将所述输入音频的时域特征和所述输入音频的频域特征进行融合,并基于融合后的特征执行声音识别。
-
公开(公告)号:CN102625097B
公开(公告)日:2014-11-05
申请号:CN201110033714.9
申请日:2011-01-31
Applicant: 北京大学
IPC: H04N19/597 , H04N19/61
Abstract: 本发明提供了一种三维视频帧内预测方法及编解码方法。本发明要解决的技术问题是在传统混合编码框架下改进三维视频帧内预测方法,提高三维视频/图像编码的压缩效率。本发明提出了一种新的帧内差异补偿预测方法,在交织模式下的三维视频,首先对其他视点的图像内容进行编码,然后在编码当前视点时,利用已重构的其他视点图像作为参考图像,进行视间差异估计及差异补偿,降低预测冗余,提高编码效率。本发明不仅能够明显提高常用码率范围内三维视频/图像编码的压缩效率,同时计算复杂度相对较低,适合实际应用。
-
公开(公告)号:CN102196270B
公开(公告)日:2013-04-24
申请号:CN201010127079.6
申请日:2010-03-12
Abstract: 本发明实施例涉及一种帧内预测方法及装置、编解码方法及装置,其中,一种帧内预测方法包括:根据待预测块内的像素与预测模板的相对位置关系,获得参考区域内具有所述相对位置关系的参考像素以及参考预测模板;根据参考区域内具有相对位置关系的参考像素以及参考预测模板,得到待预测块内的像素对应于预测模板内像素的重建像素值的加权系数的集合;根据预测模板内像素的重建像素值,以及待预测块内的像素对应于预测模板内像素的重建像素值的加权系数的集合,得到待预测块内的像素的预测值。利用待预测块内各像素与预测模板的相对位置关系得到待预测块内各像素的预测值,提高了帧内预测准确度。
-
公开(公告)号:CN102625097A
公开(公告)日:2012-08-01
申请号:CN201110033714.9
申请日:2011-01-31
Applicant: 北京大学
Abstract: 本发明提供了一种三维视频帧内预测方法及编解码方法。本发明要解决的技术问题是在传统混合编码框架下改进三维视频帧内预测方法,提高三维视频/图像编码的压缩效率。本发明提出了一种新的帧内差异补偿预测方法,在交织模式下的三维视频,首先对其他视点的图像内容进行编码,然后在编码当前视点时,利用已重构的其他视点图像作为参考图像,进行视间差异估计及差异补偿,降低预测冗余,提高编码效率。本发明不仅能够明显提高常用码率范围内三维视频/图像编码的压缩效率,同时计算复杂度相对较低,适合实际应用。
-
公开(公告)号:CN102196270A
公开(公告)日:2011-09-21
申请号:CN201010127079.6
申请日:2010-03-12
Abstract: 本发明实施例涉及一种帧内预测方法及装置、编解码方法及装置,其中,一种帧内预测方法包括:根据待预测块内的像素与预测模板的相对位置关系,获得参考区域内具有所述相对位置关系的参考像素以及参考预测模板;根据参考区域内具有相对位置关系的参考像素以及参考预测模板,得到待预测块内的像素对应于预测模板内像素的重建像素值的加权系数的集合;根据预测模板内像素的重建像素值,以及待预测块内的像素对应于预测模板内像素的重建像素值的加权系数的集合,得到待预测块内的像素的预测值。利用待预测块内各像素与预测模板的相对位置关系得到待预测块内各像素的预测值,提高了帧内预测准确度。
-
公开(公告)号:CN101895757A
公开(公告)日:2010-11-24
申请号:CN201010232113.6
申请日:2010-07-15
Applicant: 北京大学
Abstract: 本发明公开了一种预测残差块的重排序、逆重排序方法及系统。该方法包括:根据统计得到的预测残差块的幅度分布,设置预测残差块的排序方法,并且所有可能的预测残差块的排序方法为两种或两种以上;根据残差块的排序方法,在对残差块进行变换之前,对残差块内的残差值进行重排序。本发明通过在空域对残差块内的残差采样值进行重排序,使得不同模式的残差统计特性近似相同,从而可以仅使用少量的变换函数实现与模式相关变换近似的性能,同时降低了编解码器的存储复杂度。
-
公开(公告)号:CN101710993A
公开(公告)日:2010-05-19
申请号:CN200910241349.3
申请日:2009-11-30
Applicant: 北京大学
Abstract: 本发明公开了一种基于块的自适应超分辨率视频处理方法及系统。所述方法包括:对视频图像,选择基于块的下采样模式;依据所述下采样模式,对当前视频图像进行下采样,获取下采样块;结合块编码预测模式和所述下采样模式,选择依据率失真的编码模式,对获取的所述下采样块进行编码;对编码的下采样块进行解码,获取解码后的下采样块,并对其进行类型划分,基于所述下采样块的类型,对所述下采样块进行上采样,获取上采样重建块;基于本发明,能够提高中、低码率下视频编码的压缩效率,同时能够保证高码率下,编码性能不低于传统的混合编码的性能。
-
公开(公告)号:CN1441239A
公开(公告)日:2003-09-10
申请号:CN02158591.1
申请日:2002-12-26
Applicant: 北京大学
Abstract: 本发明涉及一种使用稀土荧光络合物使生物组织染色的方法。本发明所用染色试剂为一类稀土荧光络合物溶液,将之滴到生物组织上或将试样浸泡在染色剂稀土荧光络合物溶液中0.5-3分钟,然后用蒸馏水冲洗,在紫外光激发下,用荧光显微镜可以观察到已着色的组织试样的形态和结构细节。本发明方法操作简单方便,样品不需要预处理,省时间,用此方法整个过程不超过5分钟;色彩鲜艳,轮廓清晰;所用的生物样品不受种类、起源的限制;试剂无毒性或毒性极微弱,染色过程对细胞或组织的原有结构无任何影响;染色过程不受离体组织或在体组织的限制。可广泛应用于分子生物学、组织切片病理研究、医学鉴定、卫生防疫等领域。
-
公开(公告)号:CN119729047A
公开(公告)日:2025-03-28
申请号:CN202311284018.4
申请日:2023-09-28
Applicant: 北京字跳网络技术有限公司 , 北京大学
IPC: H04N21/2343 , H04N21/234 , H04N19/154 , H04N19/176 , H04N19/42 , H04N19/61 , H04N19/91
Abstract: 本公开提供一种视频处理方法、装置及电子设备,该方法包括:获取第一视频;基于视频处理模型,对所述第一视频进行处理,得到第二视频,所述视频处理模型的训练阶段包括可微分的编码器,所述可微分的编码器用于模拟编码器对视频进行量化、编码的过程,所述可微分的编码器可进行梯度回传;对所述第二视频进行编码处理。
-
公开(公告)号:CN113496460B
公开(公告)日:2024-03-22
申请号:CN202010258460.X
申请日:2020-04-03
Applicant: 北京大学 , 北京字节跳动科技有限公司
IPC: G06T3/04 , G06N3/0464 , G06N3/08
Abstract: 本发明公开一种基于特征调整的神经风格迁移方法及系统,属于图像与视频风格化领域,训练主要由内容编码器、风格编码器、装饰器和解码器组成的神经风格迁移网络模型,输入目标内容图像或视频帧和参考风格图像,得到风格迁移结果图像或视频帧,通过调整神经网络的特征空间与通道两个维度的分布,只需要一次参数前传就可以实现效果良好的风格迁移。
-
-
-
-
-
-
-
-
-