-
公开(公告)号:CN108417210B
公开(公告)日:2020-06-26
申请号:CN201810022130.3
申请日:2018-01-10
Applicant: 苏州思必驰信息科技有限公司 , 上海交通大学
Abstract: 本发明公开一种词嵌入语言模型训练方法,包括:确定语料库中的所有词语的属性以生成词表,所述属性包括所有词语的词性分类、所有词性分类的概率分布和所有词语在所属词性分类下的概率分布;生成所述词表中所有词语的词向量;生成对应于所述词表中所有词语的词性分类的词性分类向量;以所述词表中的词语的词向量和所述词表中的词语的词性分类向量为输入,以所述词表中的词语所属的词性分类的概率分布和所述词表中的词语在所属词性分类下的概率分布为输出进行训练,以得到所述词嵌入语言模型。本发明实施例中在进行语言模型,即便是遇到OOV词语,也能通过该OOV词语的形态学信息和所述词性分类的句法级信息来进行准确的识别。
-
公开(公告)号:CN107358948B
公开(公告)日:2020-06-09
申请号:CN201710501293.5
申请日:2017-06-27
Applicant: 上海交通大学 , 苏州思必驰信息科技有限公司
Abstract: 一种基于注意力模型的语言输入关联性检测方法,通过采集训练语言模型所需的训练语料并进行预处理,并对语料中的每个词序列数据进行标注;然后使用标注后的训练序列对语言模型中的循环神经网络进行训练,再采用训练语料中所有数据集合对更新后的语言模型进行训练,当所得到的预测词的概率分布在验证集上是收敛时语言模型训练完成;最后使用训练后的语言模型对输入句子进行评分,从而得到词之间的关系。本发明采用基于注意力(attention)的方式去自动提取预测词与它们的相关关系。同时,在训练词向量时尝试引入语法和语义的信息,让词向量能够隐含更丰富的信息。通过这些技术期望可以提升语言模型的性能。
-
公开(公告)号:CN108847249B
公开(公告)日:2020-06-05
申请号:CN201810537499.8
申请日:2018-05-30
Applicant: 苏州思必驰信息科技有限公司 , 上海交通大学
IPC: G10L21/003 , G10L21/007 , G10L21/013 , G10L25/24
Abstract: 本发明公开声音转换优化方法和系统,方法包括:从原始音频信号中提取原始梅尔频谱特征;将原始梅尔频谱特征经过帧到帧特征映射得到目标梅尔频谱特征;将所述原始音频信号作为输入,所述目标梅尔频谱特征作为条件,输入声音转换声码器以得到优化后的音频信号。本发明提出了一个高品质的音频转换结构,摒弃了声学特征中常用的梅尔倒谱系数和基频F0,转而使用了非常低水平的梅尔频谱图作为声学特征,从而在简化结构和计算的同时还能比现有技术转换出的声音更加自然。
-
公开(公告)号:CN108847220B
公开(公告)日:2020-04-28
申请号:CN201810538670.7
申请日:2018-05-30
Applicant: 苏州思必驰信息科技有限公司 , 上海交通大学
Abstract: 本发明实施例提供一种对话状态跟踪器的训练方法。该方法包括:通过已标注对话集(L)预训练对话状态跟踪器,以确定未标注对话集(U)中各未标注对话的预测概率和对话轮数;来确定各未标注对话的时间代价参数和/或稳定性参数和/或多元化参数;根据所述参数,确定对应各未标注对话的优先权;按照优先权从未标注对话集(U)中选取部分的未标注对话进行标注,添加至已标注对话集(L);通过添加后的已标注对话集(L)训练对话状态跟踪器。本发明实施例还提供一种对话状态跟踪器的训练系统。本发明实施例的对话状态跟踪器的训练方法根据考虑不同的未标注对话具有不同的时间代价,增加了待标注对话的选择方式而提升对话状态跟踪器的训练效果。
-
公开(公告)号:CN107944027B
公开(公告)日:2020-03-31
申请号:CN201711320645.3
申请日:2017-12-12
Applicant: 苏州思必驰信息科技有限公司 , 上海交通大学
IPC: G06F16/22
Abstract: 本发明实施例提供一种创建语义键索引的方法。该方法包括:在对话语料库中,分析各对语句对的输入语句和回复语句的各词语的词性,提取每句语句中符合预设词性要求的各语义键;按照语义键对对话语料库中的所有语句进行聚类,每一类别的语句对应于同一语义键;利用对话语料库中的各类别的语句训练序列到序列模型,得到能够将语句映射成为实值向量的编码网络;将属于同一类别的语句利用编码网络进行编码,得到与各语义键相对应的实值向量集合;从与各语义键相对应的实值向量集合中选择多个实值向量组成记忆矩阵,在各语义键和各记忆矩阵件建立语义键索引。本发明实施例还提供一种创建语义键索引的系统。本发明实施例生成的语句具有多样性、方向性。
-
公开(公告)号:CN110473569A
公开(公告)日:2019-11-19
申请号:CN201910858649.X
申请日:2019-09-11
Applicant: 苏州思必驰信息科技有限公司 , 上海交通大学
Abstract: 本发明实施例提供一种检测说话人欺骗攻击的优化方法。该方法包括:接收带有真实标签或欺骗标签的训练数据集,对训练数据集内的各音频进行前端特征提取,获得各音频的频谱特征,对频谱特征进行随机遮掩;将随机遮掩后的各频谱特征输入至神经网络模型,通过神经网络模型确定出随机遮掩后各音频的后验概率,根据真实标签或欺骗标签以及随机遮掩后各音频的后验概率对神经网络模型进行训练,确定说话人欺骗攻击检测模型;将待测音频输入,确定欺骗攻击检测结果。本发明实施例还提供一种检测说话人欺骗攻击的优化系统。本发明实施例通过改进的频谱特征的数据增强,可以在数据量受限的训练数据集上训练,得到泛化性能较高的模型,提高系统的整体性能。
-
公开(公告)号:CN110427629A
公开(公告)日:2019-11-08
申请号:CN201910744141.7
申请日:2019-08-13
Applicant: 苏州思必驰信息科技有限公司 , 上海交通大学
IPC: G06F17/27
Abstract: 本发明公开半监督文本简化模型训练方法和系统,其中,方法包括:建立复杂句到简单句的转化模型Comp2Simp和简单句到复杂句的回译模型Simp2Comp;分别对Comp2Simp和Simp2Comp进行初始化;利用初始化后的Simp2Comp构造第一平行语料对,利用初始化后的Comp2Simp构造第二平行语料对;利用第一平行语料对对初始化后的Comp2Simp的进行有监督训练,利用第二平行语料对对初始化后的Simp2Comp的进行有监督训练,从而完成第一轮迭代;分别利用参数更新后的Simp2Comp和Comp2Simp重复执行上述构造平行语料对和更新模型参数的过程完成后续迭代。
-
公开(公告)号:CN110096583A
公开(公告)日:2019-08-06
申请号:CN201910385840.7
申请日:2019-05-09
Applicant: 苏州思必驰信息科技有限公司 , 上海交通大学
IPC: G06F16/332
Abstract: 本发明公开一种多领域对话管理系统及其构建方法,其中系统包括:全局代理,配置为输入为槽无关对话状态,输出为槽无关对话动作分布;多个本地代理,配置为输入为槽相关对话状态,输出为槽相关对话动作分布;所述多个本地代理中的每个本地代理之间配置为相互通信,所述多个本地代理中的每个本地代理与所述全局代理之间配置为相互通信,以进行各代理之间的参数共享。本发明多领域对话管理系统由一些子网络(示例性地,全局代理和本地代理)组成,通过参数共享机制和通信机制,可以在多个领域中使用单个参数集,这使得可以在领域之间训练通用策略。
-
公开(公告)号:CN105869630B
公开(公告)日:2019-08-02
申请号:CN201610478041.0
申请日:2016-06-27
Applicant: 上海交通大学
Abstract: 一种基于深度学习的说话人语音欺骗攻击检测方法及系统,通过构建音频训练集,初始化并采用训练集的多帧特征向量和单帧向量序列分别训练深度前馈神经网络和深度递归神经网络;在测试阶段,将待测音频的帧级别和序列级别特征向量分别导入经训练的两个线性差分分析模型,将所得到的两个结果分数加权后作为评分,经与预定义阈值比较实现语音欺骗辨别。本发明既能够捕捉局部特征,又能把握全局信息。并且在识别验证阶段采用线性差分分析作为分类器,通过分数融合做出判断,能够极大地提高语音欺骗检测的精确度。
-
公开(公告)号:CN108962238A
公开(公告)日:2018-12-07
申请号:CN201810569168.2
申请日:2018-06-05
Applicant: 苏州思必驰信息科技有限公司 , 上海交通大学
Abstract: 本发明公开一种基于结构化神经网络的对话方法、系统、设备及存储介质,其中,所述方法包括:将接收到的置信对话状态分解成多个子对话状态;所述多个网络结点将所述多个子对话状态转化为对应的多个子对话状态向量;所述多个网络结点中的每一个网络结点分别根据所述多个子对话状态向量确定所述每个网络结点的输出值;根据所述每个网络结点的输出值确定对应于所述置信对话状态的对话动作。本发明由于采用了结构化的神经网络从而使得得到的神经网络对话策略能够更加高效的得到训练,并且仅需要少量的对话交互数据就能够训练得到性能达到较高水平的模型的效果。
-
-
-
-
-
-
-
-
-