-
公开(公告)号:CN119904536A
公开(公告)日:2025-04-29
申请号:CN202311402594.4
申请日:2023-10-26
Applicant: 北京小米移动软件有限公司 , 北京小米松果电子有限公司
IPC: G06T11/00 , G06F16/903 , G06F16/9038 , G06F9/451
Abstract: 本公开涉及一种图像生成方法、装置及存储介质。所述方法应用于终端,包括:响应于用户的输入操作,确定图像生成参数,所述输入操作用于请求生成与所述图像生成参数对应的目标图像的操作;在确定所述终端未存储图像生成模型的情况下,从云服务器获取所述图像生成模型的数据信息;根据所述数据信息,得到所述图像生成模型;根据所述图像生成参数,通过所述图像生成模型生成目标图像。
-
公开(公告)号:CN118900300A
公开(公告)日:2024-11-05
申请号:CN202310499402.X
申请日:2023-05-05
Applicant: 北京小米移动软件有限公司
IPC: H04M1/72454 , H04M1/72403 , G10L25/18 , G10L25/24 , G10L25/27 , G10L25/30 , G10L25/51
Abstract: 本申请提出一种数据处理方法、装置、电子设备和存储介质,其中,方法包括:获取语音采集装置采集的环境语音数据,对环境语音数据进行语音信号处理,得到环境语音数据的频谱图,根据频谱图包括的语音特征,对环境语音数据对应的目标场景进行识别,响应于识别得到环境语音数据对应的目标场景,启动和场景对应的应用程序,其中,应用程序用于提供和场景对应的服务。基于采集的环境的语音数据,识别对应的目标场景,并在识别得到对应的目标场景的情况下,自动启动和目标场景匹配的应用程序,以提供对应的服务,提高了效率和便利性。
-
公开(公告)号:CN118534467A
公开(公告)日:2024-08-23
申请号:CN202310190617.3
申请日:2023-02-23
Applicant: 北京小米移动软件有限公司
IPC: G01S15/08 , G01S7/539 , G06F18/10 , G06N3/0464 , G06N3/08
Abstract: 本公开是关于一种距离获取方法和装置、电子设备、存储介质。该方法包括:获取所述超声波接收器所输出的声波信号;对所述声波信号进行频域处理,得到所述声波信号对应的频域信号;对所述频域信号进行分析处理,得到所述频域信号对应的频域特征信号;所述频域特征信号用于表征所述电子设备与障碍物之间相对运动;根据所述频域特征信号获取所述电子设备与障碍物之间的距离。本实施例中超声波发生器和超声波接收器无需在电子设备的显示屏上开孔即可实现收发超声波信号,可以确定出频域特征信号即确定出电子设备与障碍物之间的相对运动,最终获取到电子设备与障碍物之间的距离,能够可靠实现全面屏电子设备的防误触功能。
-
公开(公告)号:CN118522299A
公开(公告)日:2024-08-20
申请号:CN202310181599.2
申请日:2023-02-20
Applicant: 北京小米移动软件有限公司
IPC: G10L21/0208 , G10L21/0232 , G10L21/0264
Abstract: 本公开是关于一种回声消除方法、装置以及存储介质。回声消除方法包括:获取待进行回声消除的声音信号,并对所述声音信号进行预处理,得到预处理后声音信号;对所述预处理后声音信号进行频谱特征提取,得到所述预处理后声音信号的频域信息;基于所述频域信息、噪声估计值、噪声协方差矩阵,迭代确定滤波系数;基于所述滤波系数,对所述待进行回声消除的声音信号进行回声消除。通过本公开实施例,可实现实时高效的回声消除功能,能够在保证低计算复杂度的同时提升回声消除率,且系统稳定不易发散。
-
公开(公告)号:CN118318455A
公开(公告)日:2024-07-09
申请号:CN202280004903.X
申请日:2022-11-07
Applicant: 北京小米移动软件有限公司
Abstract: 本公开提出一种音频信号渲染方法、装置、设备及存储介质,方法包括:确定待渲染的音频对象信号中的直达声信号对应的第一增益HRIR;确定待渲染的音频对象信号中的至少一个反射声信号对应的第二增益HRIR;基于所述第一增益HRIR和所述第二增益HRIR确定待渲染的音频对象信号对应的融合HRIR;基于所述融合HRIR对待渲染的音频对象信号进行渲染。本公开的方法可以确保渲染效果,能够尽可能还原声信号的真实环境,提升声源朝向渲染的体验感,使渲染效果更接近真实情况。
-
公开(公告)号:CN117804491A
公开(公告)日:2024-04-02
申请号:CN202211177130.3
申请日:2022-09-26
Applicant: 北京小米移动软件有限公司
IPC: G01C21/36
Abstract: 本公开提供一种导航方法、装置、电子设备及可读储存介质,所述方法包括:获取导航信息,并根据导航信息,确定所述导航语音的空间音效,最后播放携带有所述空间音效的所述导航语音。本公开通过根据所述导航信息,确定所述导航语音的空间音效,使得用户能够接收到携带有空间音效的导航语音,在用户未能获取导航语音的文字内容的情况下,可以凭借空间音效确定当前导航信息指示的移动动作,增强导航语音的引导性。
-
公开(公告)号:CN112151041B
公开(公告)日:2024-03-29
申请号:CN201910562897.X
申请日:2019-06-26
Applicant: 北京小米移动软件有限公司
IPC: G10L17/22 , H04M1/65 , H04M1/72403 , H04M1/72433 , H04M1/72448
Abstract: 本公开是关于一种基于录音机程序的录音方法、装置、终端及存储介质,所述方法包括:通过所述录音机程序录制录音音频文件;对所述录音音频文件的声纹进行识别,得到至少一个声纹对象;对每个所述声纹对象在所述录音音频文件中所对应的时间段进行标注;在所述录音音频文件的查看界面,根据所述标注对每个所述声纹对象所对应的时间段进行区别显示。本公开使得查看界面能够直接观看到每个声纹对象所对应的时间段,用户可以直接选择感兴趣的声纹对象所对应的时间段进行查看和回放,提高了用户对录音音频文件的信息获取效率。
-
公开(公告)号:CN117672175A
公开(公告)日:2024-03-08
申请号:CN202211021906.2
申请日:2022-08-24
Applicant: 北京小米移动软件有限公司
IPC: G10L13/02 , G10L13/033 , G10L13/08 , G10L13/10
Abstract: 本公开是关于一种语音合成方法及装置、电子设备、存储介质。其中,该方法,包括:获取第一对象的第一语音和第二对象的第二语音;从所述第一语音中提取所述第一对象的第一音色特征、从所述第二语音中提取内容信息,所述内容信息中包含所述第二对象的第二音色特征的一部分和所述第二语音的语义信息;对所述第一音色特征和所述内容信息进行语音合成,得到目标语音。
-
公开(公告)号:CN117597945A
公开(公告)日:2024-02-23
申请号:CN202280004311.8
申请日:2022-06-14
Applicant: 北京小米移动软件有限公司
Abstract: 本公开涉及一种音频播放方法、装置及存储介质,所述方法应用于终端,包括:确定所述终端播放的音频数据对应的音频类型;根据所述音频类型,确定所述音频数据对应的音频控制信息,所述音频控制信息包括声场控制信息和多个虚拟扬声器对应的虚拟扬声器分布信息;根据所述声场控制信息和所述虚拟扬声器分布信息,播放所述音频数据。本公开可以根据音频数据对应的音频类型,确定该音频数据对应的音频控制信息,该音频控制信息包括声场控制信息和多个虚拟扬声器对应的虚拟扬声器分布信息,这样,能够按照不同的虚拟声场播放不同音频类型的音频数据,使得播放的音频数据的空间感知质量更高,从而提高了3D音效的效果。
-
公开(公告)号:CN117470225A
公开(公告)日:2024-01-30
申请号:CN202210865737.4
申请日:2022-07-21
Applicant: 北京小米移动软件有限公司
Abstract: 本公开是关于导航方法、装置、电子设备及存储介质,所述方法应用于与音频设备预先建立连接的终端设备,所述方法包括:在导航过程中,确定目标位置相对于所述终端设备的当前位置的第一距离和第一角度;根据所述第一距离和所述第一角度,对待播放音频进行渲染,得到目标音频,其中,所述目标音频的虚拟音源方向为所述目标位置的方向;控制所述音频设备播放所述目标音频。由于目标音频的虚拟音源方向为目标位置的方向,因此目标音频能够使用户直接且准确的得到目标位置的方向,从而降低导航交互方式的复杂程度和识别难度,降低用户对导航的使用难度,改善用户的使用体验,提高导航的正确率。
-
-
-
-
-
-
-
-
-