-
公开(公告)号:CN117809646A
公开(公告)日:2024-04-02
申请号:CN202311104802.2
申请日:2023-08-30
Applicant: 海信视像科技股份有限公司
IPC: G10L15/22 , G10L15/18 , G10L15/30 , H04N21/422
Abstract: 本发明实施例公开了一种显示设备、服务器、语音处理方法及存储介质,涉及语音交互技术领域,该显示设备包括:控制器,该控制器被配置为:在语音指令的停顿时长大于停顿阈值的情况下,根据语音指令的音频信号功率,确定语音指令的尾点连续性检测结果;在尾点连续性检测结果指示语音指令的尾点为非停顿尾点的情况下,向服务器发送完整性检测请求,以使服务器采用预先训练的语义完整性模型检测语音指令的语义完整性,并在语音指令为完整语音指令的情况下,对语音指令进行语义解析,基于解析结果确定反馈指令;接收服务器发送的反馈指令,并控制显示器显示反馈指令对应的目标界面。应用本发明的技术方案,能够提高检测语音指令完整性的准确率。
-
公开(公告)号:CN119440457A
公开(公告)日:2025-02-14
申请号:CN202411546351.2
申请日:2024-10-31
Applicant: 海信视像科技股份有限公司
Abstract: 本申请一些实施例示出一种显示设备、音频生成方法及内容展示方法,涉及音频生成领域,该方法包括:响应于应用启动指令,显示第一应用页面;接收第一输入信息;控制第一目标应用根据第一输入信息确定第一音频开头片段;控制第一目标应用将第一音频开头片段输入到符号音频生成模型,得到第一符号音频文件;控制第一目标应用生成第一音频。通过目标应用可直接根据用户输入信息确定音频开头片段,并将音频开头片段输入至符号音频生成模型中生成相应的音频,无需用户了解符号文件相关知识后才能使用符号音频生成模型,降低用户使用符号音频生成模型的难度,且以音频开头片段作为输入,可提高生成音频的准确性,生成更能满足不同用户需求的音频。
-
公开(公告)号:CN116246619A
公开(公告)日:2023-06-09
申请号:CN202211561972.9
申请日:2022-12-07
Applicant: 海信视像科技股份有限公司
IPC: G10L15/22 , G01S3/80 , F24F11/80 , F24F11/79 , F24F11/74 , F24F11/56 , G10L15/30 , G10L15/18 , G10L15/26 , G10L25/51 , G10L13/047
Abstract: 本申请一些实施例提供一种智能设备和声源定位方法。智能设备可以获取第一声音采集器采集的第一语音音频数据和第二声音采集器采集的第二语音音频数据,并对第一语音音频数据或第二语音音频数据进行识别,得到用户的控制指令。智能设备对第一语音音频数据和第二语音音频数据进行二阶滤波时延估计,得到语音时延。基于语音时延可以获取用户相对于智能设备的用户方向,从而基于用户方向执行控制指令。智能设备可以获取用户方向从而实现对用户的定位,从而控制智能设备实现相应的控制指令,提高用户的使用体验。
-
公开(公告)号:CN119312207A
公开(公告)日:2025-01-14
申请号:CN202411207079.5
申请日:2024-08-30
Applicant: 海信视像科技股份有限公司
IPC: G06F18/243 , G06N5/04 , G06N5/01 , G06F16/903 , G06Q10/20
Abstract: 本申请实施例公开一种家电设备故障诊断方法、终端设备及服务器,终端设备执行方法包括:获取用户输入的故障描述数据;向服务器发送第一查询指令,第一查询指令用于指示服务器根据故障描述数据从知识库中查询目标知识;知识库根据故障树结构化文件生成,故障树结构化文件包括目标家电设备关联的至少一个故障树,故障树包括多个节点,节点配置一种故障类型对应的故障表现图像、故障日志、修复方式和故障现象;根据故障描述数据和目标知识生成提示词信息并发送给服务器;根据服务器发送的应答信息在人机对话页面显示对应的应答内容;应答信息包括目标家电设备的故障类型和推荐修复方式。这样,可以提升家电设备的故障诊断准确性和故障修复效率。
-
公开(公告)号:CN119446097A
公开(公告)日:2025-02-14
申请号:CN202411321924.1
申请日:2024-09-20
Applicant: 海信视像科技股份有限公司
IPC: G10H1/00 , G10H1/02 , G10H1/40 , G06F16/683 , G06N5/04 , G06N3/0455 , G06N3/0475 , G06N3/08
Abstract: 本申请提供实施例属于显示技术,提供一种音频生成方法、显示设备、存储介质及程序产品,该音频生成方法包括:获取用于生成音频的生成指令,所述生成指令包括文本指令或者语音指令;基于所述生成指令,提取用于表征音频生成需求的规则参数;根据所述规则参数在音频数据库中查找,获得与所述规则参数相适配的参考音频;基于所述参考音频的开头片段进行提取,获得用于表征所述开头片段中音频要素的提示词,所述音频要素包括音色、节奏或者速度中的至少一项;通过训练后的音频生成模型,基于所述提示词进行推理,以进行音频定制,获得相应生成的音频文件。本申请可以满足用户对于自我表达的需求,在家用电器上实现个性化定制音频。
-
公开(公告)号:CN116312614A
公开(公告)日:2023-06-23
申请号:CN202310186652.8
申请日:2023-03-01
Applicant: 海信视像科技股份有限公司
Abstract: 本公开涉及一种声音信号处理方法、装置、设备及介质,涉及音频处理技术领域;其中,该方法包括:获取外接设备的声音采集模块采集的第一声音信号和外接设备已发送至显示设备的第二声音信号,其中,第一声音信号包括用户语音信号和显示设备播放的目标音频信号;通过延时估计方法,确定第二声音信号中的原始音频信号和目标音频信号之间的延迟时间;对目标音频信号进行滤波处理,确定残差信号;通过延迟时间、残差信号以及原始音频信号对第一声音信号进行处理,确定用户语音信号。本公开实施例通过对第一声音信号进行处理,能够得到较为准确的用户语音信号,从而对用户语音信号进行识别时,有利于提高识别结果的准确性,提升用户的使用体验。
-
-
-
-
-