-
公开(公告)号:CN119317957A
公开(公告)日:2025-01-14
申请号:CN202280096502.1
申请日:2022-06-14
Applicant: 微软技术许可有限责任公司
Abstract: 描述了用于编码和解码诸如音频数据的信号的技术和解决方案。所公开的创新可以特别用于语音编解码应用,诸如用于实时通信。使用神经网络,上下文编解码可以用于使用来自过去帧的重建的潜在特征的预测作为上下文来针对当前帧编码潜在特征。提取器基于这种预测和使用编码器获得的当前帧的潜在特征来学习类残差特征。然后量化类残差特征。在编解码框架的解码器部分,量化特征被去量化,然后与来自先前重建的潜在特征的预测组合以提供当前帧的重建特征,然后可以由解码器处理该重建特征以提供重建信号。
-
公开(公告)号:CN114503569A
公开(公告)日:2022-05-13
申请号:CN202080070588.1
申请日:2020-09-07
Applicant: 微软技术许可有限责任公司
IPC: H04N19/169 , H04N19/122 , H04N19/164 , H04N19/46 , H04L65/1104 , H04L65/1069 , H04L65/60 , H04L65/65 , H04N19/105
Abstract: 描述了用于将AV1编码视频数据封装在NAL单元内的技术。例如,所述NAL单元可以是H.264或HEVC NAL单元。封装能够包括使用保留的NAL单元类型。例如,能够使用保留的NAL单元类型将包括AV1编码视频数据的开放比特流单元封装在NAL单元内。所述NAL单元能够被分组以经由计算机网络递送到另一计算设备。
-
公开(公告)号:CN108370378B
公开(公告)日:2021-04-16
申请号:CN201680073029.X
申请日:2016-12-26
Applicant: 微软技术许可有限责任公司
Abstract: 音频流被编码以经由通信信道发送给接收设备。要被发送的音频流在处理器上执行的音频编码器处被接收。处理器具有一定量的可用处理资源。通信信道的可用带宽被确定。基于所确定的带宽,可用处理资源的一部分被分配给音频编码器。如果所确定的带宽低于带宽门限,则所分配的部分更大。音频编码器使用处理资源的所分配的部分对音频流进行编码,以及经由通信信道将经编码的音频流发送给接收设备。
-
公开(公告)号:CN110460861A
公开(公告)日:2019-11-15
申请号:CN201910847304.4
申请日:2015-01-07
Applicant: 微软技术许可有限责任公司
IPC: H04N19/52 , H04N19/513 , H04N19/523 , H04N19/43 , H04N19/70
Abstract: 一种用于在对运动图像数据进行编码时使用的格式,包括:包括多个帧的帧序列,其中帧中的至少一个区域是使用运动估计来编码的;表示针对这些帧中的相应的每个帧或者这样的帧中的每个帧内的一个或多个区域中的相应的每个区域的运动估计的运动向量的运动向量值的相应的集合;以及与相应的帧或区域中的每个帧或区域相关联的至少一个相应的指示符,其指示相应的帧或区域的相应的运动向量值是以第一分辨率来编码的还是以第二分辨率来编码的。
-
公开(公告)号:CN108028943A
公开(公告)日:2018-05-11
申请号:CN201680052283.1
申请日:2016-09-08
Applicant: 微软技术许可有限责任公司
Abstract: 描述了用于由视频编码器和/或视频解码器验证长期参考(LTR)使用的技术。例如,验证视频编码器和/或视频解码器在正确地应用LTR可以通过以两种方式编码和解码视频序列并比较结果来进行。在一些实现中,通过以下操作来完成验证LTR使用:解码已经根据LTR使用模式编码的经编码的视频序列、解码已经根据LTR使用模式编码且根据有损信道模型修改的经修改的经编码的视频序列、并且比较来自经编码的视频序列和经修改的经编码的视频序列两者的经解码的视频内容。例如,所述比较可以包括确定从LTR恢复点位置开始这两个经解码的视频内容是否比特精确地匹配。
-
公开(公告)号:CN108028922A
公开(公告)日:2018-05-11
申请号:CN201680052204.7
申请日:2016-09-08
Applicant: 微软技术许可有限责任公司
IPC: H04N19/105 , H04L1/00 , H04L1/16 , H04L1/18 , H04L12/18 , H04N21/6375 , H04N21/6405 , H04N19/172 , H04N19/164 , H04N19/174 , H04N19/65 , H04N19/573 , H04N19/58
Abstract: 一种发送设备,其用于生成要通过网络发送至接收设备的视频的多个经编码的部分,所述发送设备被配置为:通过反馈信道从所述接收设备接收错误消息,所述错误消息指示所述多个经编码的部分中已经在所述接收设备处丢失的至少一个经编码的部分;响应于所述接收所述错误消息而编码恢复部分;以及通过所述网络将所述恢复部分发送至所述接收设备;其中:所述错误消息包括这样的信息,所述信息涉及在所述接收设备处成功地解码的经解码的部分,并且所述恢复部分是相对于所述经解码的部分编码的。
-
公开(公告)号:CN110460861B
公开(公告)日:2022-11-18
申请号:CN201910847304.4
申请日:2015-01-07
Applicant: 微软技术许可有限责任公司
IPC: H04N19/52 , H04N19/513 , H04N19/523 , H04N19/43 , H04N19/70
Abstract: 一种用于在对运动图像数据进行编码时使用的格式,包括:包括多个帧的帧序列,其中帧中的至少一个区域是使用运动估计来编码的;表示针对这些帧中的相应的每个帧或者这样的帧中的每个帧内的一个或多个区域中的相应的每个区域的运动估计的运动向量的运动向量值的相应的集合;以及与相应的帧或区域中的每个帧或区域相关联的至少一个相应的指示符,其指示相应的帧或区域的相应的运动向量值是以第一分辨率来编码的还是以第二分辨率来编码的。
-
公开(公告)号:CN107439008B
公开(公告)日:2021-11-16
申请号:CN201680020825.7
申请日:2016-04-07
Applicant: 微软技术许可有限责任公司
IPC: H04N7/15 , H04N19/103 , H04N19/154 , H04N19/184 , H04N19/31 , H04N19/40 , H04N19/48 , H04N19/65 , H04N19/70 , H04N21/2343
Abstract: 提出了减轻数字视频的互操作性情景中的损失的方法。例如,比特流修改工具(例如,运行在视频会议系统的网络节点上的比特流重写器)接收经编码视频的流入比特流(例如,从使用第一损失恢复策略的编码器)。比特流修改工具处理经编码视频的流入比特流以产生经编码视频的流出比特流。通过这样做,比特流修改工具改变流入比特流与流出比特流之间的至少一个语法元素以便减轻在有损递送情况下对流出比特流的解码期间的图片损失效应。比特流修改工具输出流出比特流。以该方法,比特流修改工具可以帮助避免空白屏幕、冻结屏幕或者在有损递送情况下的解码期间的其它故障(例如,利用使用不同损失恢复策略的解码器)。
-
公开(公告)号:CN105900420B
公开(公告)日:2019-06-11
申请号:CN201480072763.5
申请日:2014-12-19
Applicant: 微软技术许可有限责任公司
IPC: H04N19/109 , H04N19/136 , H04N19/174 , H04N19/42
Abstract: 提出了在视频编码期间选择运动向量(“MV”)精度的方法。这些方法可以便于在率失真性能和/或计算效率方面有效的压缩。例如,视频编码器从多个MV精度中确定针对视频的单位的MV精度,其包括一个或多个分数样本MV精度和整数样本MV精度。视频编码器可以识别具有分数样本MV精度的一组MV值,然后至少部分地基于分数部分为零的MV值(该组内)的流行,选择针对单位的MV精度。或者,视频编码器可以执行率失真分析,其中率失真分析朝向整数样本MV精度偏置。或者,视频编码器可以收集关于视频的信息,并至少部分地基于收集到的信息选择针对所述单位的MV精度。
-
公开(公告)号:CN110149513B
公开(公告)日:2022-10-14
申请号:CN201910451602.1
申请日:2014-12-19
Applicant: 微软技术许可有限责任公司
IPC: H04N19/109 , H04N19/136 , H04N19/174 , H04N19/42
Abstract: 提出了在视频编码期间选择运动向量(“MV”)精度的方法。这些方法可以便于在率失真性能和/或计算效率方面有效的压缩。例如,视频编码器从多个MV精度中确定针对视频的单位的MV精度,其包括一个或多个分数样本MV精度和整数样本MV精度。视频编码器可以识别具有分数样本MV精度的一组MV值,然后至少部分地基于分数部分为零的MV值(该组内)的流行,选择针对单位的MV精度。或者,视频编码器可以执行率失真分析,其中率失真分析朝向整数样本MV精度偏置。或者,视频编码器可以收集关于视频的信息,并至少部分地基于收集到的信息选择针对所述单位的MV精度。
-
-
-
-
-
-
-
-
-