-
公开(公告)号:CN119168183A
公开(公告)日:2024-12-20
申请号:CN202411415482.7
申请日:2024-10-11
Applicant: 嘉兴恒创电力设计研究院有限公司 , 清华大学
IPC: G06Q10/047 , G06Q30/0201 , G06F16/29 , G06Q10/0639 , G06V10/764 , G06N5/01 , G06N20/20 , G06N3/006 , G06N3/126 , G06Q50/06 , G06F17/16
Abstract: 本申请涉及输电线工程技术领域,特别涉及一种输电线选线方法、装置、设备及介质,其中,方法包括:获取目标区域的多源地理信息;对多源地理信息进行分类处理得到目标分类结果,根据目标分类结果计算目标区域中每条输电线路径的路径地理综合成本值权重;将每条路径的路径地理综合成本值权重输入选线模型,选线模型输出目标区域的目标输电线路径,其中,选线模型基于目标灰狼算法进行选线,目标灰狼算法为引入遗传算法的交叉和变异操作的灰狼算法。由此,解决了现有技术中输电线规划成本高、效率低、精度差且主观性强等问题。
-
公开(公告)号:CN108694950B
公开(公告)日:2021-10-01
申请号:CN201810465602.2
申请日:2018-05-16
Applicant: 清华大学
Abstract: 本发明提出一种基于深度混合模型的说话人确认方法,属于声纹识别、模式识别与机器学习技术领域。该方法首先获取目标说话人的训练语音数据并进行预处理,得到训练语音数据的梅尔倒谱特征集;对梅尔倒谱特征集建立第0层高斯混合模型并求导,得到一阶导数集;然后依次建立第一层高斯混合模型、第二层高斯混合模型,直至建立建立第S层高斯混合模型,将所有高斯混合模型组合得到说话人的深度混合模型;然后获取测试语音数据并提取梅尔倒谱特征集,建立测试语音数据的深度混合模型;计算两个模型的相似度:若相似度小于等于阈值,则测试语音数据属于目标说话人。本发明不仅考虑数据自身分布,还考虑数据的导数分布,提升说话人确认的准确性。
-
公开(公告)号:CN107481723A
公开(公告)日:2017-12-15
申请号:CN201710751356.2
申请日:2017-08-28
Applicant: 清华大学
Abstract: 本发明提出一种用于声纹识别的信道匹配方法及其装置,属于语音识别和语音通信领域。本发明方法首先采集语音数据,根据要模拟的通信模式对语音数据进行语音编码得到压缩语音数据;随后根据相应通信模式下信道模拟的误码率对压缩语音数据进行误码操作,得到信道模拟语音数据;最后对该语音数据进行语音解码操作,得到相应通信模式下的语音。本发明装置包括:语音采集及读取模块、语音编码模块、信道误码模拟模块、语音解码模块和数据存储模块。本发明可模拟固话、VOIP网络电话、微信电话、QQ电话、2G、3G、4G等语音通信过程,从而得到与测试语音信道条件相同的训练语音,有效解决了信道失配问题,适用于声纹识别的应用需求。
-
公开(公告)号:CN106898355A
公开(公告)日:2017-06-27
申请号:CN201710031899.7
申请日:2017-01-17
Applicant: 清华大学
Abstract: 本发明提出一种基于二次建模的说话人识别方法,属于声纹识别、模式识别与机器学习领域。该方法在模型训练阶段,获取待识别说话人的训练语音数据并预处理;根据训练语音数据训练得到第一个DNN模型;利用第一个DNN模型,对训练语音数据进行识别,提取易混语音数据;根据易混语音数据训练得到第二个DNN模型;在说话人识别阶段,获取待识别语音数据并预处理;利用第一个DNN模型对待识别语音数据进行识别,若识别概率大于设定阈值,则得到说话人识别结果;否则通过第二个DNN模型对待识别语音数据进行第二次识别,得到说话人识别结果。本发明通过建立两个DNN模型,同时考虑说话人宏观特征和微观特征,有效提高说话人识别的准确率。
-
公开(公告)号:CN101894548A
公开(公告)日:2010-11-24
申请号:CN201010207237.9
申请日:2010-06-23
Applicant: 清华大学
Abstract: 本发明的实施例提出了一种用于语种识别的建模方法,包括输入语音数据,对语音数据预处理得到特征序列,将特征矢量映射为超矢量,对超矢量进行投影补偿,通过支持向量机算法建立训练语种模型;对待测语音采用上述步骤得到待测超矢量,对待测超矢量进行投影补偿,利用语种模型对所述待测超矢量打分,识别待测语音的语言种类。本发明实施例还提出了一种用于语种识别的建模装置包括语音预处理模块、特征提取模块、多坐标系原点选择模块、特征矢量映射模块、子空间提取模块、子空间投影补偿模块、训练模块和识别模块。根据本发明实施例提供的方法及装置,去除高维统计量中对识别无效的信息,提高语种识别的正确率,降低在集成电路上的运算复杂度。
-
公开(公告)号:CN110379433B
公开(公告)日:2021-10-08
申请号:CN201910711306.0
申请日:2019-08-02
Applicant: 清华大学 , 北京华控智加科技有限公司
Abstract: 本申请涉及一种身份验证的方法、装置、计算机设备及存储介质。方法包括:获取目标用户根据目标动态验证码输入的语音数据;根据预设的分段算法,将语音数据划分为至少一个语音帧;针对每个语音帧,根据预设的声学特征提取算法,提取该语音帧对应的声学特征向量;将该语音帧对应的声学特征向量输入至预先训练的身份验证多任务模型,输出该语音帧对应的中间用户特征向量和第一后验概率集合;根据各语音帧对应的中间用户特征向量和预设的池化算法,确定目标用户对应的第一用户特征向量;根据目标用户对应的第一用户特征向量和各语音帧对应的第一后验概率集合,对目标用户进行身份验证。采用本申请可以降低服务器的计算复杂度,提高服务器的处理效率。
-
公开(公告)号:CN104575519B
公开(公告)日:2018-12-25
申请号:CN201310488434.6
申请日:2013-10-17
Applicant: 清华大学 , 深圳市车音网科技有限公司
Abstract: 本发明公开了一种特征提取方法、装置及重音检测的方法、装置,涉及语音检测技术。为解决现有技术在重音检测上准确率低的问题。技术方案包括:依据预设的音素与声学特征发音属性的对应关系,通过第一分类器进行输出所述声学特征发音属性的第一帧级特征向量;依据预设的音素与元辅音发音属性的对应关系,通过第二分类器将所述声学特征发音属性的第一帧级特征向量进行输出所述元辅音发音属性的第二帧级特征向量;将所述声学特征发音属性的第一帧级特征向量或所述元辅音发音属性的第二帧级特征向量进行映射所述帧级对应的音节级发音特征向量。该方案可以应用语音检测过程中。
-
公开(公告)号:CN107633845A
公开(公告)日:2018-01-26
申请号:CN201710812259.X
申请日:2017-09-11
Applicant: 清华大学
Abstract: 本发明提出一种鉴别式局部信息距离保持映射的说话人确认方法,属于声纹识别、模式识别与机器学习领域。该方法在训练阶段获取训练语音数据并提取每条训练语音数据的i-vector;根据每个说话人对应的训练语音数据,提取每个说话人的i-vector;训练得到鉴别式局部保持映射矩阵;在说话人确认阶段,获取待测语音数据并选定一个训练语音数据的说话人,计算待测语音数据与该说话人的i-vector距离,若该距离小于设定的距离阈值,则判断待测语音数据属于说话人;说话人确认完成。本发明适用性强,且着重考虑了异类近邻点,增强对易混说话人语音的鉴别,具有更好的区分能力,提高说话人确认的准确率。
-
公开(公告)号:CN107452403A
公开(公告)日:2017-12-08
申请号:CN201710817534.7
申请日:2017-09-12
Applicant: 清华大学
Abstract: 本发明提出一种说话人标记方法,属于声纹识别、模式识别与机器学习技术领域。本方法包括三个阶段:在第一阶段,通过i-vector概率线性鉴别分析凝聚层次聚类方法将待测语音数据分为长度相等的片段,然后将片段聚为与说话人总数相等的类;在第二阶段,利用第一阶段的聚类结果,得到片段属于说话人的先验概率;在第三阶段,通过基于软判决的变分贝叶斯隐马尔科夫方法进行迭代,当系统收敛时,计算片段所属的说话人,说话人标记结束。本发明结合了两种说话人标记方法的优点,可有效地提高说话人标记的准确率。
-
公开(公告)号:CN102508575A
公开(公告)日:2012-06-20
申请号:CN201110354897.4
申请日:2011-11-10
Applicant: 清华大学深圳研究生院
Abstract: 本发明公开了一种屏幕书写装置,用于在投影屏幕上手写输入信息,包括接触块和压力传感器,所述接触块与所述投影屏幕相接触用于获取书写时的压力信息,所述压力传感器将所述接触块获取的压力信息转换为电信号;其特征在于:还包括电信号处理单元和变色材料;所述电信号处理单元将所述压力传感器输出的电信号转换为所述颜色变化模块能感知的信号;所述变色材料根据所述电信号处理单元输出的信号产生相应的颜色。本发明的屏幕书写装置,屏幕书写装置中不需再设置通信装置,屏幕书写装置的体积较小,方便携带,且交互过程能达到实时准确的要求。本发明还同时公开了一种屏幕书写系统及其实现方法。
-
-
-
-
-
-
-
-
-