-
公开(公告)号:CN118160286A
公开(公告)日:2024-06-07
申请号:CN202480000399.5
申请日:2024-01-31
Applicant: 北京小米移动软件有限公司
Inventor: 王宾
IPC: H04L65/70
Abstract: 本公开涉及编解码方法、装置以及存储介质,一种编解码方法,方法由编码器执行,包括:基于第一信号对音频数据进行编码,得到第一编码数据,所述第一信号包括对所述音频数据进行编码的编码信息,所述第一信号由第一设备反馈,所述音频数据用于所述第一设备进行机器分析或机器训练。在上述实施例中,第一信号指示了对音频数据进行编码所涉及的编码信息,解决了对音频数据进行编码的准确性低的问题,通过第一信号包括的编码信息对音频数据进行编码,保证对音频数据进行编码的准确性,进而保证后续对音频数据进行机器分析的准确性。
-
公开(公告)号:CN117769740A
公开(公告)日:2024-03-26
申请号:CN202380012178.5
申请日:2023-11-07
Applicant: 北京小米移动软件有限公司
Inventor: 王宾
IPC: G10L19/008 , G10L19/16
Abstract: 本公开涉及一种音频信号编解码方法及装置、通信系统、通信设备、存储介质,属于通信技术领域。该方法包括:音频信号发送端设备获取待编码混合格式音频信号;确定待编码混合格式音频信号的第一信息;对待编码混合格式音频信号进行预处理;基于第一信息,对预处理后的待编码混合格式音频信号进行音频格式转换获得传输声道音频信号和元数据信息;对传输声道音频信号进行编码获得第一编码参数,对元数据信息进行编码获得第二编码参数;将第一编码参数和第二编码参数写入码流中;向音频信号接收端设备发送码流;音频信号接收端设备接收码流并解码。通过编码端在有限制约束条件下的高效率编码以使解码端能够解码重建与原始输入信号更为接近的解码信号。
-
公开(公告)号:CN117716425A
公开(公告)日:2024-03-15
申请号:CN202380011719.2
申请日:2023-10-18
Applicant: 北京小米移动软件有限公司
Inventor: 王宾
IPC: G10L19/16
Abstract: 本公开提供一种音频信号的处理方法、装置、音频设备及存储介质。方法包括:获取第一音频信号对应的多个待分配组合的第一参数,所述第一参数用于指示所述多个待分配组合的重要程度;根据所述第一参数,在编码前基于可用比特为所述多个待分配组合分配编码比特。本公开的方法中,根据第一音频信号中不同待分配组合的第一参数,在编码前适应性的分配待分配组合的编码比特,从而根据待分配组合的重要性更好的指导编码比特的分配,便于提升信号音质,进而提升编码质量。
-
公开(公告)号:CN116434760A
公开(公告)日:2023-07-14
申请号:CN202310403661.8
申请日:2023-04-14
Applicant: 北京小米移动软件有限公司
IPC: G10L19/008 , G10L19/02 , G10L19/022
Abstract: 本申请关于一种音频编码方法、装置、电子设备和存储介质,属于音频处理技术领域。该方法包括:对声道序列进行分组,得到多个声道组,每个声道组包括声道序列中连续的若干个声道,相邻的声道组间存在一个或多个相同的声道;对声道序列中各声道的音频信号按帧进行频域转换,得到各声道每帧的频域系数;根据各声道的频域系数,从变换矩阵集中确定声道组对应的频带集中各频带的目标变换矩阵;基于各频带的目标变换矩阵,对声道组内声道的频域系数进行同频带去相关处理,得到声道组的编码信息;基于声道组的编码信息得到编码码流,并将编码码流发给解码器进行解码。由此,本方案可以实现对多个声道的音频信号的压缩传输,降低传输和存储成本。
-
公开(公告)号:CN116391226A
公开(公告)日:2023-07-04
申请号:CN202380008348.2
申请日:2023-02-17
Applicant: 北京小米移动软件有限公司
IPC: G10L25/51 , G10L19/00 , G10L19/018
Abstract: 本公开实施例公开了一种心理声学分析方法、装置、设备及存储介质,可以应用于通信系统中,该方法包括:确定音频信号的多个掩蔽源;根据多个掩蔽源中的部分掩蔽源,分析音频信号的掩蔽阈值。通过实施本公开的方法,由于从音频信号的所有掩蔽源中选择部分掩蔽源参与掩蔽阈值的分析计算,从而能够有效减少心理声学分析的计算量,进而降低计算复杂度。
-
公开(公告)号:CN116368460A
公开(公告)日:2023-06-30
申请号:CN202380008239.0
申请日:2023-02-14
Applicant: 北京小米移动软件有限公司
Inventor: 王宾
IPC: G06F3/16
Abstract: 本公开提出一种音频处理方法、装置、设备及存储介质,属于通信技术领域。该方法包括:获取音频码流信号;获取模式选择参数,并根据模式选择参数对音频码流信号进行处理获得对应类型的输出信号。在本公开实施例之中,可以通过模式选择参数实现对输出信号的格式的控制,可以提高终端设备利用此音频处理方法设计音频解决方案时的灵活性。本公开针对一种“音频处理”这一情形提供了一种处理方法,可以降低对输出信号的格式限制,可以减少部分格式的输出信号在现有“音频处理”技术中无法获取到的情况。
-
-
-
-
-