Patent search ap:("中国科学院自动化研究所") AND inv:"陶建华" Page 10

91.

发明公开
发音器官可视语音合成系统有权转让

公开(公告)号：CN102820030A

公开(公告)日：2012-12-12

申请号：CN201210265448.7

申请日：2012-07-27

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 杨明浩 , 李昊 , 刘斌

IPC: G10L13/00

Abstract: 本发明提供了一种发音器官可视语音合成系统，包括：音频分析模块、参数映射模块、动画驱动模块和运动分析模块，其中：音频分析模块，用于接收输入的说话人语音信号，根据能量信息判断静音段，将非静音段语音进行编码，输出语音线谱对参数；参数映射模块，用于接收音频分析模块实时传递来的语音线谱对参数，并利用经过训练的混合高斯模型，将其转化为模型运动参数；动画驱动模块，用于接收参数映射模块实时生成的模型运动参数，驱动虚拟发音器官模型的关键点运动，进而带动整个虚拟发音器官模型的运动。本发明直接由输入语音的频域参数生成相应的运动参数来带动模型运动，具有不受在线数据库的限制和生理模型的限制优点。

92.

发明公开
基于残差信号频谱重构的声码器有权转让

公开(公告)号：CN102750955A

公开(公告)日：2012-10-24

申请号：CN201210253946.X

申请日：2012-07-20

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 温正棋

IPC: G10L19/12

Abstract: 本发明提供了一种基于残差信号频谱重构的声码器，包括：参数提取模块，用于接收待分析的语音数据、计算基频参数和频谱参数；逆滤波模块，用于根据频谱参数设计逆滤波器对语音数据逆滤波，获得残差信号；周期信号支路，与逆滤波模块相连接，用于根据基频参数和逆滤波后的残差信号，生成周期激励信号；非周期信号支路，与逆滤波模块相连接，用于根据基频参数和逆滤波后的残差信号，生成非周期激励信号；以及参数语音合成器模块，与周期信号支路和非周期信号支路相连接，用于根据周期频谱参数、周期激励信号和非周期激励信号，调用语音合成器合成语音。本发明对逆滤波后的残差信号进行建模，使激励信号具有较高的准确性，提高了合成语音的音质。

93.

发明授权
基于正交图像的快速个性化人脸建模方法失效转让

公开(公告)号：CN100430963C

公开(公告)日：2008-11-05

申请号：CN200510108136.5

申请日：2005-09-29

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 李永林

IPC: G06T17/00

Abstract: 基于正交图像的快速个性化人脸建模方法，包括步骤：利用摄像机拍摄两幅正交人脸图像，即正面人脸图像和侧面人脸图像。对两幅图像进行归一化处理，通过对通用人脸网格模型的投影，得到和正交图像对应的两个方向的投影网格。在人脸图像和投影网格上选择对应的特征点，利用匹配算法求得二者之间的最佳匹配参数，然后对所有的投影网格进行匹配，得到匹配后的网格特征点的位置，并利用径向基函数插值算法对结果进行插值，得到精确的匹配结果。然后从两个匹配后的投影网格恢复其三维信息，得到个性化的人脸网格模型。再对该网格模型进行纹理映射，获得最终的个性化人脸模型。该模型可以用于人脸动画、人脸识别等多个领域。

94.

发明公开
基于音节韵律约束关系的汉语语音合成方法及系统有权

公开(公告)号：CN101064103A

公开(公告)日：2007-10-31

申请号：CN200610076015.1

申请日：2006-04-24

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 于剑

IPC: G10L13/00 , G10L13/02 , G10L13/08

Abstract: 本发明公开了一种基于音节韵律约束关系的汉语语音合成方法及系统，系统包括：文本输入模块、韵律处理模块、语音输出模块。方法包括：接收或输入任意文字串转换成语音输出；文本分析对输入文本格式和内容分析并转换成音节序列串；韵律预测模块接收附着韵律信息的音节序列串，利用统计模型预测出与其对应的目标韵律值；波形拼接模块接收所述附着目标韵律值的音节序列串，根据所述音节序列携带的韵律信息从所述压缩语音库中选取与目标韵律值最为接近的样本并拼接；语音输出模块播放韵律表现接近于自然的拼接语音。依据本发明将极大提高系统合成语音的自然度和流畅度，从而使得输出的语音非常自然，几乎接近真人所发出的语音。

95.

发明公开
一种嵌入式语音合成方法及系统有权转让

公开(公告)号：CN1924994A

公开(公告)日：2007-03-07

申请号：CN200510086311.5

申请日：2005-08-31

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 张皖志

IPC: G10L13/00 , G10L13/02

Abstract: 本发明公开了一种嵌入式语音合成方法及系统，用于手持数字移动设备操作系统，将系统接收到的或输入的任意文字串转换成语音输出。以汉语中的声韵母作为合成系统及语音库的基本单元；首先创建基于声韵母的原始语音库，然后基于声韵母样本的上下文环境属性以及声学特征，对所述原始语音库进行量化压缩，最后通过语音压缩算法对所述量化压缩后的语料库进行编码压缩，得到最终的压缩语音库。依据本发明提供的方法可提升合成系统的可压缩性，从而降低其在嵌入式平台下所占用的系统资源，同时可使得合成结果保持较好的自然度和可懂度。

96.

发明授权
一种基于高频特征的区域生成音频检测与定位方法及装置有权

公开(公告)号：CN118298852B

公开(公告)日：2024-09-10

申请号：CN202410726562.8

申请日：2024-06-06

Applicant: 中国科学院自动化研究所

Inventor： 何佳毅 , 易江燕 , 陶建华

IPC: G10L25/51 , G10L25/27

Abstract: 本发明提供了一种基于高频特征的区域生成音频检测与定位方法及装置，应用于音频处理领域。该方法包括：提取待检测音频中目标频率的信号，得到待检测信号；对待检测信号进行分帧处理，得到至少两个待检测帧；针对至少两个待检测帧中的每个待检测帧，将待检测帧分别与至少两个待检测帧中的其他待检测帧进行组合，生成至少一个待检测帧对；将至少一个待检测帧对输入训练好的音频检测与定位模型中，输出至少一个待检测帧对各自对应的相似度；根据至少一个待检测帧对各自对应的相似度，和至少两个待检测帧各自对应的帧时间，从待检测音频中检测和定位生成区段。本发明的方法能够从待检测音频中检测和定位生成区段，解决了难以定位生成区段的问题。

97.

发明公开
一种基于持续强化学习的语音攻防博弈自反馈方法及装置有权

公开(公告)号：CN118366479A

公开(公告)日：2024-07-19

申请号：CN202410788551.2

申请日：2024-06-19

Applicant: 中国科学院自动化研究所

Inventor： 何佳毅 , 易江燕 , 陶建华 , 陈玉杰

IPC: G10L25/51 , G10L25/27

Abstract: 本发明提供了一种基于持续强化学习的语音攻防博弈自反馈方法及装置，可以应用于人工智能技术领域。该方法包括：将从数据集中获取的样本数据输入到对抗样本生成子模型中，利用对抗样本生成策略对样本数据进行处理，生成语音样本；在语音样本通过质量评估的情况下，将语音样本输入到语音鉴别子模型中，输出对语音样本的鉴别结果；对比鉴别结果与语音样本的真实标签，得到对比结果，对比结果用于反馈调节对抗样本生成策略；在对比结果表征鉴别结果与语音样本的真实标签不同的情况下，将语音样本存储到增量样本集中，并利用持续学习子模型基于增量样本集对语音鉴别子模型进行增量训练。

98.

发明授权
语音控制方法、装置、电子设备及存储介质有权

公开(公告)号：CN113436629B

公开(公告)日：2024-06-04

申请号：CN202110997178.8

申请日：2021-08-27

Applicant: 中国科学院自动化研究所

Inventor： 聂帅 , 陶建华 , 梁山 , 易江燕 , 傅睿博

IPC: G10L15/22 , G10L15/14 , G10L15/06

Abstract: 本申请涉及一种语音控制方法、装置、电子设备及存储介质，所述语音控制方法，包括以下步骤：获取已知唤醒词的音节；确定与所述唤醒词对应的非唤醒词的音节；根据所述唤醒词的音节、所述非唤醒词的音节和预设的垃圾词信息构建唤醒词解码网络，以根据所述唤醒词解码网络对输入的语音进行解码，并根据解码结果确定是否执行唤醒操作，本申请在解码网络中引入非唤醒词的音节从而统一描述非唤醒词，能够降低非唤醒词引起的误唤醒率。

99.

发明授权
基于孪生网络的远程监督关系抽取降噪系统有权

公开(公告)号：CN112668342B

公开(公告)日：2024-05-07

申请号：CN202110024800.7

申请日：2021-01-08

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 霍文帅 , 张大伟 , 杨国花 , 刘通

IPC: G06F40/30 , G06F40/289 , G06F16/36 , G06F16/35 , G06F18/23213 , G06N3/0464 , G06N3/08

Abstract: 本申请实施例涉及一种基于孪生网络的远程监督关系抽取降噪系统，旨在旨在降低远程监督回标训练数据的噪声影响，同时减少训练数据损失的情况。该系统包括：文本分析模块，关系选择器训练模块，关系选择模块，噪声数据聚类模块，关系分类模块；所述文本分析模块用于接收远程监督回标文本数据，输出初始候选数据和初始高可信度数据；所述关系选择器训练模块用于利用标注好的文本数据训练出基于孪生网络的关系选择器；所述关系选择模块用于对初始候选数据和初始高可信度数据进行关系选择，输出噪声数据和新增高可信度数据；所述噪声聚类模块用于对噪声数据进行聚类分析，输出新增候选数据，所述关系分类模块用于输出最后的分类结果。

100.

发明授权
一种基于张量分解的知识推理方法、装置、设备有权

公开(公告)号：CN113051404B

公开(公告)日：2024-02-06

申请号：CN202110024807.9

申请日：2021-01-08

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 邵朋朋 , 刘通 , 杨国花 , 张大伟

IPC: G06F16/36 , G06F16/2455

Abstract: 本申请实施例涉及数据处理技术领域，具体涉及一种基于张量分解的知识推理方法、装置、设备，旨在提高时序知识推理任务的准确率。所述方法包括：对时序知识图谱数据集中的数据进行提取，得到多组四元组数据，多组四元组数据中的每组四元组数据中包含了头实体、关系、尾实体以及时间；对多组四元组数据进行标注及处理，将处理好的四元组数据作为训练材料；将训练材料输入基于张量分解的时序知识推理模型及其变体模型中，利用梯度下降算法对时序知识推理模型及其变体模型分别进行训练，得到训练好的时序知识推理模型及其变体模型；使用训练好的时序知识推理模型及其变体模型分别执行预测任务，推理问题的答案，得到最终的推理结果。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification