-
公开(公告)号:CN106611595B
公开(公告)日:2021-12-10
申请号:CN201610902916.5
申请日:2016-10-17
Applicant: 三星电子株式会社
IPC: G10L13/02 , G10L13/047
Abstract: 一种用于将文本转换为语音的电子装置和方法。电子装置包括处理器和与处理器电连接的存储器。存储器存储超级群集型通用声学数据集和使处理器执行以下操作的指令:获取至少一个文本,选择与获取的文本被转换成的语音相关联的信息,当所选择的信息是第一信息时,选择第一路径中的至少一条第一路径,基于所选择的第一路径来加载所述超级群集型通用声学数据集中的元素,并基于所述超级群集型通用声学数据集中的所述元素来产生第一声学信号,当所选择的信息是第二信息时,选择第二路径中的至少一条第二路径,基于所述至少一条的第二路径来加载所述超级群集型通用声学数据集中的元素,并基于所述超级群集型通用数据集中的所述元素来产生第二声学信号。
-
公开(公告)号:CN118120010A
公开(公告)日:2024-05-31
申请号:CN202280069984.1
申请日:2022-06-27
Applicant: 三星电子株式会社
IPC: G10L13/10 , G10L13/047
Abstract: 公开了一种电子装置、终端装置及其控制方法。该电子装置包括:输入接口;以及处理器,包括用于提取声学特征的韵律模块和被用于生成语音波形的声码器模块。处理器:使用输入接口接收文本输入;使用韵律模块从输入文本识别第一声学特征,其中,第一声学特征与第一采样率相对应;基于识别的第一声学特征,生成与不同于第一采样率的修改的采样率相对应的修改的声学特征;以及通过基于第一声学特征和修改的声学特征训练声码器模块来生成多个声码器学习模型。
-
公开(公告)号:CN106611595A
公开(公告)日:2017-05-03
申请号:CN201610902916.5
申请日:2016-10-17
Applicant: 三星电子株式会社
IPC: G10L13/02 , G10L13/047
CPC classification number: G10L13/086 , G10L13/0335 , G10L13/04 , G10L13/06 , G10L13/02 , G10L13/047
Abstract: 一种用于将文本转换为语音的电子装置和方法。电子装置包括处理器和与处理器电连接的存储器。存储器存储超级群集型通用声学数据集和使处理器执行以下操作的指令:获取至少一个文本,选择与获取的文本被转换成的语音相关联的信息,当所选择的信息是第一信息时,选择第一路径中的至少一条第一路径,基于所选择的第一路径来加载所述超级群集型通用声学数据集中的元素,并基于所述超级群集型通用声学数据集中的所述元素来产生第一声学信号,当所选择的信息是第二信息时,选择第二路径中的至少一条第二路径,基于所述至少一条的第二路径来加载所述超级群集型通用声学数据集中的元素,并基于所述超级群集型通用数据集中的所述元素来产生第二声学信号。
-
公开(公告)号:CN119866521A
公开(公告)日:2025-04-22
申请号:CN202380065010.0
申请日:2023-09-25
Applicant: 三星电子株式会社
IPC: G10L15/22 , G10L15/04 , G10L15/08 , G10L15/16 , G10L13/10 , G10L21/043 , G06F3/16 , G10L25/63 , G10L15/26
Abstract: 根据实施例,电子装置可以包括:接收环境声音的麦克风;扬声器;在其中存储参数信息的存储器;以及处理器,处理器在通过麦克风检测到用户话语语音时控制扬声器执行用户话语语音的语音识别,并且输出对应于语音识别结果的第一响应消息。处理器可以:检测语音识别结果中指示对第一响应消息的重新请求的话语表达,识别构成第一响应消息的至少一个文本,基于对应于文本的至少一个参数确定将包括在第二响应消息中的至少一个语音信号,以及生成强调所确定的至少一个语音信号的第二响应消息。
-
公开(公告)号:CN116635933A
公开(公告)日:2023-08-22
申请号:CN202280008387.8
申请日:2022-03-07
Applicant: 三星电子株式会社
IPC: G10L15/22
Abstract: 根据实施例,一种电子装置可以包括:存储器;以及至少一个处理器,所述至少一个处理器可操作地连接到所述存储器,其中,所述至少一个处理器:在语音助理应用被执行时,在多个发音串当中识别存储在所述存储器中的声音源数据量的值小于特定值的发音串;基于所识别的发音串识别话题;获得与所述话题中包括的多个词当中包括所识别的发音串的词相对应的问题文本;输出与所述问题文本相对应的问题语音;以及在输出所述问题语音之后接收话语。
-
-
-
-