-
公开(公告)号:CN1239569A
公开(公告)日:1999-12-22
申请号:CN97180220.3
申请日:1997-09-30
申请人: 西门子股份公司
摘要: 公开了一种语音编码方法,其中该语音信号被采样并分割成多个帧,在该帧上执行多带激励分析以获取该带内的一基本音高、多个发声/不发声判定和谐音幅度。谐音幅度被分成固定数目的谐音的第一组和其余谐音的第二组,这两个组中的第一组利用离散余弦比变换、第二组利用非一平方变换分别进行变换,所得的变换系数被矢量量化以形成多个输出索引。还公开了一种执行编码和解码方法的解码方法及设备。
-
公开(公告)号:CN1223739A
公开(公告)日:1999-07-21
申请号:CN97195936.6
申请日:1997-06-27
申请人: 微软公司
CPC分类号: G10L15/063 , G10L2015/0635
摘要: 一种用来动态选择用来训练语音识别系统的词的方法和系统。语音识别系统使用隐藏的马尔克夫模型模拟每个音素,并且把每个词表示为音素的一个序列。训练系统根据相应代码字将作为音素的部分读出的概率排列用于每帧的每个音素。训练系统收集其相应词是已知的读出发音。训练系统然后把每个发音的代码字与它认为是其部分的音素对准。训练系统然后使用对准帧的对准代码字来计算对于每个音素的平均等级。最后,训练系统选择包含具有低等级的音素的词用于训练。
-
公开(公告)号:CN1222997A
公开(公告)日:1999-07-14
申请号:CN97195785.1
申请日:1997-07-01
申请人: 松下电器产业株式会社
CPC分类号: G10L19/038 , G10L2019/0005
摘要: 为了使用矢量量化方法把音频信号进行编码,减少信息量,在编码单元1中进行编码时,选择把输入矢量进行分割生成的子矢量与发送侧代码薄29003中的各音频代码之间的听觉距离中具有最小距离的音频代码,对于与听觉重要度高的子矢量的要素相当的部分,在音频代码选择单元2900102中忽略表示其相位信息的正负符号进行处理,相对于发送侧代码薄29003中的音频代码进行比较检索,在所得到的结果上另外添加由相位信息抽取单元2900107抽取的与上述子矢量的要素部分对应的相位信息作为代码索引进行输出,由此能够不降低解码时音频信号的听觉品质,减少矢量量化的代码检索中的计算量,减少代码薄的代码数。
-
公开(公告)号:CN1185616A
公开(公告)日:1998-06-24
申请号:CN97121233.3
申请日:1997-10-23
申请人: 索尼公司
IPC分类号: G10L9/18
CPC分类号: G10L21/038
摘要: 准备窄频带代码簿和宽频带代码簿,在窄频带代码簿中已经先存储了从许多音频信号的模式中得到的窄频带音频信号的时域参数,在宽频带代码簿中对应于所述窄频带代码簿,已经先存储了从所述许多音频信号的模式中得到的宽频带音频信号的时域参数,并且通过宽频带代码簿进行合成。在这种情况下,采用自相关作为代码簿的参数。当音频合成时,采用把对LPC余量进行上取样得到的信号作为激励源。
-
公开(公告)号:CN1166886A
公开(公告)日:1997-12-03
申请号:CN95196342.2
申请日:1995-09-29
申请人: 苹果电脑公司
CPC分类号: G10L15/04 , G10L25/15 , G10L2015/027
摘要: 一种包括一个麦克风、A/D转换器、一种音节识别系统、一种集成化音节分类器和一种置信度累加器的连续汉语普通话语音识别系统。该音节识别系统产生N个最佳假设及其初始置信度。该集成化音节分类器有一个估值输入语言基音一次的基音估值器和一个按照N个最佳假设之一的音节划分来切分估值基音的长时音调器。该长时音调分类器对于已切分的估值基音进行长时音调分析并产生一个长时音调置信度信号。置信度累加器接收该初始置信度和该长时音调置信度信号,按照相应的长时音调置信度信号修正每个初始置信度,按照累加的置信度重新排列这N个最佳假设,并输出这N个最佳假设。
-
公开(公告)号:CN1063959A
公开(公告)日:1992-08-26
申请号:CN91106930.5
申请日:1991-02-08
摘要: 一种将变化数字量转变为固体语言表达装置的电路,包括接口电路及控制电路,接口电路包括与固体语言电路地址相同位数的多路选择开关组、多路开关组的输出送至固体语言电路的地址端。控制电路可以由CPU或IC逻辑电路组成,控制电路包括产生时序脉冲的电路及产生多路选择开关导通顺序地址码的电路。本发明可制成将数字量等转变为语言表达的装置,也可制成专用集成电路芯片,在电子计量仪器中广为使用。
-
公开(公告)号:CN1150456C
公开(公告)日:2004-05-19
申请号:CN97125283.1
申请日:1997-10-15
申请人: 松下电器产业株式会社
摘要: 本发明提供一种图象编码方法和编码装置,在由软件所进行的图象、声音、图象声音编码处理中,根据硬件环境和软件环境,来决定编码条件,而灵活利用设备资料,得到良好的编码结果。在对从摄象机取入的图象声音进行编码时,把进行了数字化的声音数据暂时存储在声音缓冲部中,根据其存储量来决定是对数字化的图象数据进行编码处理还是不进行处理而丢弃该图象数据。
-
公开(公告)号:CN1127720C
公开(公告)日:2003-11-12
申请号:CN96100867.9
申请日:1996-01-12
申请人: 雅马哈株式会社
CPC分类号: G10H7/006 , G10H1/125 , G10H5/007 , G10H7/004 , G10H2220/106 , G10H2250/161 , G10H2250/261 , G10H2250/475 , G10H2250/481 , G10H2250/535 , G10H2250/621
摘要: 多个数字信号处理器以相互并行关系提供,以及用于期望声信号合成或处理的一系列操作分成多个操作组,以分配给信号处理器。第一及第二总线与各个信号处理器连接,以便操作所必要的参数通过第一总线分布地供给信号处理器,并且各个信号处理器的操作结果传到另一信号处理器或一个输出端口。一个数字信号处理器通过第二总线接收另一数字信号处理器的输出数据,以便使用接收的数据执行一个预定操作。
-
公开(公告)号:CN1071914C
公开(公告)日:2001-09-26
申请号:CN94191246.9
申请日:1994-11-29
申请人: 索尼公司
CPC分类号: G10L19/0212
摘要: 一种信号编码方法和信号解码方法,所述编码方法的特征在于,把输入信号分块以后变换成频谱信号,把所述频谱信号分割成多个单元以后归一化,把全部或部分所述频谱信号可变长编码以后与各单元的归一化系数和重新量化的比特数一起输出,其中,对于所述编码后输出信号的一块的比特数设置上限;在需要超过所述上限比特数的那种块中,在至少强制地改变一个单元的归一化系数以后进行重新量化和熵编码并输出所述频谱信号。
-
公开(公告)号:CN1205097A
公开(公告)日:1999-01-13
申请号:CN97191350.1
申请日:1997-08-04
申请人: 松下电器产业株式会社
CPC分类号: G10L19/12 , G10L2019/0005
摘要: 本发明旨在提高CELP型声音编码装置和CELP型声音译码装置的声源生成部的音质,由音调峰值位置计算器12计算自适应编码矢量的音调峰值位置,由振幅增强窗生成器13生成用于增强音调峰值位置的振幅的窗,由振幅增强加窗器16增强与音调峰值位置对应的噪音编码矢量的振幅。将脉冲的搜索位置确定为在音调峰值位置附近密而在除此之外的部分稀疏,根据所确定的搜索位置进行脉冲位置搜索。利用此前的子帧的音调峰值位置、音调周期信息以及当前的子帧的音调周期信息反向自适应地切换声源结构,提高音质,同时抑制传送路线错误的影响的传播。
-
-
-
-
-
-
-
-
-