-
公开(公告)号:CN107357838A
公开(公告)日:2017-11-17
申请号:CN201710483734.3
申请日:2017-06-23
Applicant: 上海交通大学 , 苏州思必驰信息科技有限公司
IPC: G06F17/30 , G10L15/06 , G10L15/16 , G10L15/183
Abstract: 一种基于多任务学习的对话策略在线实现方法,通过实时获取人机对话的语料信息,提取当前用户状态特征和用户动作特征并构造得到训练输入;然后将对话策略学习过程中的单一累积奖赏值拆分成对话轮数奖赏值和对话成功奖赏值作为训练标注,并在线训练过程中通过多任务学习技术对两种不同的值模型同时进行优化,最后合并两项奖赏值,并更新对话策略。本发明采用强化学习的框架,通过在线学习进行对话策略优化,无需根据领域人工设计规则策略,能够适应不同复杂度的领域信息结构、不同规模的数据;本发明将原始优化单一累积奖赏值的任务进行分解,利用多任务学习同时优化从而学到更好的网络结构,降低训练过程的方差。
-
公开(公告)号:CN107123417A
公开(公告)日:2017-09-01
申请号:CN201710343427.5
申请日:2017-05-16
Applicant: 上海交通大学 , 苏州思必驰信息科技有限公司
Abstract: 一种基于鉴别性训练的定制语音唤醒优化方法及系统,在给定带标注的声学数据后,结合初始的基于神经网络的声学模型,通过神经网络前向传播得到逐帧声学概率;结合标注序列及逐帧声学概率,得到标注唤醒词的建模概率;利用在大量文本上统计得到的音素级语言模型,构建为相应的搜索网络;基于音素级语言模型的搜索空间和逐帧声学模型可以进行唤醒词竞争项建模,得到后验概率;结合唤醒词竞争项建模和标注唤醒词建模,进行声学模型的鉴别性训练;通过鉴别性训练得到的声学模型采用基于唤醒词置信度与自动估计阈值的比较以判别是否唤醒。
-
公开(公告)号:CN106875007A
公开(公告)日:2017-06-20
申请号:CN201710062794.8
申请日:2017-01-25
Applicant: 上海交通大学 , 苏州思必驰信息科技有限公司
IPC: G06N3/04
Abstract: 一种用于语音欺骗检测的基于卷积长短期记忆端对端深度神经网络,包括:一个具备长短期记忆序列映射的卷积神经网络前端和一个神经网络直接分类器,卷积神经网络前端包括:至少两个用于标准特征提取的CNN和至少一个用于标签预测的CNN,该用于标签预测的CNN标准特征以长短期记忆的序列方式进行标签预测。本发明通过对现有各种特征的综合能力进行考量,规避了特征提取的过程,并提高了方法架构针对不同任务的适应性。
-
公开(公告)号:CN105047192A
公开(公告)日:2015-11-11
申请号:CN201510272044.4
申请日:2015-05-25
Applicant: 上海交通大学 , 苏州思必驰信息科技有限公司
IPC: G10L13/027 , G06F21/36 , G06F21/32
Abstract: 一种基于隐马尔科夫模型的统计语音合成方法及装置,通过生成关联多模态的自然语言问题,根据自然语言问题生成相应图片并加入干扰元素,根据问题文本,使用基于HMM的语音合成方法的多模态验证码合成语音并加入噪声,本发明将验证码的模式从单模态提升到互相之间有语义关联的多模态,进一步增进现有验证码对于人类和计算机的区分性,提升互联网验证系统的人机区分度,加强安全性能。
-
公开(公告)号:CN104732978A
公开(公告)日:2015-06-24
申请号:CN201510107647.9
申请日:2015-03-12
Applicant: 上海交通大学 , 苏州思必驰信息科技有限公司
Abstract: 一种智能语音领域的基于联合深度学习的文本相关的说话人识别方法,首先从待检测音频中提出得到FBANK系数,经帧扩展后输入神经网络进行计算,得到待测音频的j‐vector;再训练LDA模型并得到预测阈值,最后将待测试的说话人的注册音频的j‐vector和待测试的说话人的测试音频的j‐vector归一化后输入带有预测阈值的LDA模型,并得到预测结果。本发明能够极大地提高文本相关的说话人识别的精确度。
-
公开(公告)号:CN104618612A
公开(公告)日:2015-05-13
申请号:CN201510064921.9
申请日:2015-02-09
Applicant: 上海交通大学 , 苏州思必驰信息科技有限公司
Abstract: 一种通过互联网进行云端信息服务的电话系统,包括:云端服务器、由主控模块、互联网连接模块、语音电话板卡和语音输入输出模块组成的用户端,其中:主控模块分别与互联网连接模块、语音电话版卡和语音输入输出模块相连,互联网连接模块与主控模块相连,语音电话板卡和主控模块相连,语音输入输出模块和主控模块相连,云端服务器通过互联网与一个或多个用户端的互联网连接模块相连,接收连接请求并向主控模块回传网络数据,语音电话板卡与有线电话网络相连,进行电话网络的调制解调以使得所述系统用户端接入有线电话网络。本发明保留电话使用语音的优势,结合智能语音技术的发展,在电话的基础上加入了在云端将非语音信息处理成语音信息的功能和对用户语音请求的分析功能。
-
公开(公告)号:CN204741495U
公开(公告)日:2015-11-04
申请号:CN201520088311.8
申请日:2015-02-09
Applicant: 上海交通大学 , 苏州思必驰信息科技有限公司
Abstract: 一种通过互联网进行云端信息服务的电话装置,包括:云端服务器、由主控电路、互联网连接电路、语音电话板卡和语音输入输出电路组成的用户端,其中:主控电路分别与互联网连接电路、语音电话版卡和语音输入输出电路相连,互联网连接电路与主控电路相连,语音电话板卡和主控电路相连,语音输入输出电路和主控电路相连,云端服务器通过互联网与一个或多个用户端的互联网连接电路相连,接收连接请求并向主控电路回传网络数据,语音电话板卡与有线电话网络相连,进行电话网络的调制解调以使得所述的系统用户端接入有线电话网络。本实用新型保留电话使用语音的优势,结合智能语音技术的发展,在电话的基础上加入了在云端将非语音信息处理成语音信息的功能和对用户语音请求的分析功能。
-
-
-
-
-
-