-
公开(公告)号:CN1138386A
公开(公告)日:1996-12-18
申请号:CN94194566.9
申请日:1994-12-20
申请人: 夸尔柯姆股份有限公司
摘要: 一种具有特征抽取装置(22)的话音识别系统,该系统位于远程站(40)中。特征抽取装置(22)从输入话音帧中抽取特征,然后将抽取的特征提供给中央处理站(42)。在中央处理站(42)中,将特征提供给确定输入话音帧之语法的字译码器(48)。
-
公开(公告)号:CN106710589B
公开(公告)日:2019-07-30
申请号:CN201611239071.2
申请日:2016-12-28
申请人: 百度在线网络技术(北京)有限公司
CPC分类号: G10L15/02 , G06K9/4628 , G06K9/6274 , G06N3/04 , G06N3/0454 , G06N3/08 , G10L15/16 , G10L15/22 , G10L15/24 , G10L15/30 , G10L25/18
摘要: 本发明提出一种基于人工智能的语音特征提取方法及装置,其中,方法包括:对待识别语音进行频谱分析,得到待识别语音的语谱图,利用图像识别算法中的Inception卷积结构,对语谱图进行特征提取,得到待识别语音的语音特征。本发明中,通过对待识别语音进行频谱分析,将连续的待识别语音转换成语谱图进行表示,由于Inception卷积结构为可以精准识别图像特征的有效的图像识别方式,利用Inception卷积结构对语谱图进行识别,提取出待识别语音较为准确的语音特征,进而可以提高语音识别的准确率。
-
公开(公告)号:CN109688367A
公开(公告)日:2019-04-26
申请号:CN201811651782.X
申请日:2018-12-31
申请人: 深圳爱为移动科技有限公司
IPC分类号: H04N7/15 , H04N21/233 , H04N21/2343 , H04N21/235 , H04N21/435 , H04N21/439 , H04N21/4402 , H04N21/8547 , G10L13/02 , G10L15/00 , G10L15/26 , G10L15/30 , G06F17/28
CPC分类号: H04N7/15 , G06F17/289 , G10L13/02 , G10L15/005 , G10L15/26 , G10L15/30 , H04N21/2335 , H04N21/2343 , H04N21/2355 , H04N21/4355 , H04N21/4398 , H04N21/4402 , H04N21/8547
摘要: 本发明公开了多终端多语言实时视频群聊的方法及系统,移动终端采集视频流、音频流和时间戳进行压缩分别发送至流媒体服务器和识别服务器,业务服务器向数据库服务器请求查询其他移动终端的预留信息以判断是否需要进行语言翻译,当需要进行翻译时识别服务器将第一音频流转码为第一语言文本并由翻译服务器进行翻译为第二语言文本,并由合成服务器转换为第二音频流并发送至流媒体服务器,混流服务器向流媒体服务器调取视频流及第二音频流混流成第二视频文件,并发送至其他移动终端,使不同的移动终端之间能实现无语言障碍的多终端多语言实时视频。
-
公开(公告)号:CN109639623A
公开(公告)日:2019-04-16
申请号:CN201811123926.4
申请日:2018-09-26
申请人: 夏普株式会社
CPC分类号: G06F21/32 , G06F21/83 , G06F2221/2115 , G10L17/005 , G10L17/22 , H04L63/0861 , G10L15/22 , G10L15/30 , G10L2015/223 , G10L2015/225 , H04L63/0876 , H04L63/108
摘要: 本发明提供一种在由进行生物体认证的识别装置认证后的用户的信息与从语音输入输出装置输入的信息一致的情况下,许可该认证后的用户的登入(Login)的认证系统等。存储有识别信息的识别装置利用生物体认证信息进行用户的认证并将识别信息发送至服务器装置。所述服务器装置从语音输入输出装置接收语音数据,根据该语音数据辨别语音识别信息,在接收到的所述识别信息与所述语音识别信息一致的情况下,许可与所述识别信息对应的用户的登入。
-
公开(公告)号:CN109493868A
公开(公告)日:2019-03-19
申请号:CN201811531587.3
申请日:2018-12-13
申请人: 中国平安财产保险股份有限公司
发明人: 罗柏发
CPC分类号: G10L15/265 , G10L15/30
摘要: 本发明提供用于基于语音识别的保单录入方法和相关装置,其中,方法包括:接收语音采集终端发送的目标语音数据,目标语音数据为语音采集到的目标保单对应的语音数据;对目标语音数据进行语音识别,得到目标语音数据对应的保单信息;根据保单信息生成多个保单项目信息;确定多个保单项目信息中的各个保单项目信息与目标保单中的保单项目的对应关系;根据对应关系在多个保单项目信息中确定第一保单项目对应的第一保单项目信息,将第一保单项目信息作为第一保单项目对应的信息录入至保单信息存储系统,保单信息存储系统用于保存保单信息。本发明的技术方案,可以省去用户手动输入保单项目信息的过程,提高保单录入的效率。
-
公开(公告)号:CN109474671A
公开(公告)日:2019-03-15
申请号:CN201811235433.X
申请日:2018-10-23
申请人: 深圳市一体数科科技有限公司
CPC分类号: H04L67/12 , G01N33/98 , G10L15/22 , G10L15/30 , G10L2015/223 , H04L12/40 , H04L67/18 , H04L67/26 , H04L2012/40215 , H04M1/72525 , H04M1/7253 , H04W4/40 , H04W4/80
摘要: 一种智能车载设备及其通信方法,OBD装置将车辆实时诊断信息通过车载智能终端传送到云服务器,由云服务器提供相应的诊断并推送相应的服务商信息给所述车载智能终端。这种基于OBD诊断信息进行信息推送的方法,保障了车辆维护和服务推送的针对性和连续性。本发明还通过增加预警投票模块,实现了全员参与车况、路况和驾况的监督和预警,降低事故发生率;本发明还公开了一种智能车载设备的通信方法,通过对所述异常信息进行投票和统计分析最大限度的避免误报、漏报险情,可及时避险;还通过预置异常信息清单,当发生异常,可快速进行预警,进一步提高预警效率。
-
公开(公告)号:CN109448721A
公开(公告)日:2019-03-08
申请号:CN201811591915.9
申请日:2018-12-20
申请人: 西安TCL软件开发有限公司
CPC分类号: G10L15/22 , G10L15/30 , G10L2015/223 , H04L67/125
摘要: 本发明公开了一种语音控制方法、系统、云服务器及语音设备,所述方法包括:获取用户的语音信息和/或与本机设备进行通信连接的外部设备的状态信息;根据所述语音信息和/或所述状态信息获取控制策略,其中,所述控制策略包括控制指令和外部设备信息;将所述控制指令发送至所述外部设备信息对应的外部设备,以供所述外部设备信息对应的外部设备对所述控制指令作出响应。本发明实现了对城市网络中的各语音设备和外部设备进行统一管理,使得城市网络中的各种外部设备以语音设备为节点形成一个整体网络,使得外部设备控制方式智能化。
-
公开(公告)号:CN109065037A
公开(公告)日:2018-12-21
申请号:CN201810748509.2
申请日:2018-07-10
申请人: 福州瑞芯微电子股份有限公司
发明人: 陈长海
CPC分类号: G10L15/22 , G10L15/08 , G10L15/30 , G10L15/34 , G10L2015/088 , G10L2015/223 , H04L65/605 , H04L67/1095 , H04L67/1097
摘要: 本发明提供一种基于语音交互的音频流控制方法,步骤S1、首先让音频流进入一个公共缓冲池;步骤S2、由所述公共缓冲池向云端缓存模块输入音频数据,同时向唤醒引擎过音频流;步骤S3、所述唤醒引擎触发预设的唤醒阈值,向云端缓存模块同步唤醒词后的音频流时序位置,然后将这个音频流时序位置作为起始位置开始上传音频流给云端交互控制模块;步骤S4、云端交互控制模块按照云端的要求封包上传数据,同时云端交互控制模块根据云端反馈和自身的流控来决定本次语音交互结束的时间点,这样就完成了一次完整语音交互的流控。本发明控制方法不存在误识别的情况,且延时低,云端响应速度快。
-
公开(公告)号:CN109036394A
公开(公告)日:2018-12-18
申请号:CN201810640658.7
申请日:2018-06-21
申请人: 珠海金山网络游戏科技有限公司 , 珠海西山居移动游戏科技有限公司
CPC分类号: G10L15/22 , G06F3/016 , G10L15/30 , G10L2015/223 , G10L2015/225
摘要: 本申请提出一种增强用户体验的个人客户端交互方法,包括以下步骤:分别通过压力传感器和语音接收器获取接触位置数据和命令指示语音;通过通信器实时将接触位置数据、命令指示语音和个人客户端的唯一识别号发送至具有处理器的远程计算机;根据通信器发出的接触位置数据和命令指示语音,以及基于个人客户端所对应的用户配置文件,形成反馈指令并通过通信器保存在存储器中;在验证存储器中所保存反馈指令后,根据反馈指令控制指示器作出相应的指示。其中个人客户端外形为模型,并包括压力传感器、语音接收器、存储器、指示器和通信器。本申请还提出一种增强用户体验的个人客户端交互系统。
-
公开(公告)号:CN108958012A
公开(公告)日:2018-12-07
申请号:CN201810619153.2
申请日:2018-06-15
申请人: 赵锦秋
发明人: 赵锦秋
CPC分类号: G04G11/00 , G04G13/028 , G08C17/02 , G10L15/22 , G10L15/30 , G10L2015/223 , H04L67/06 , H04L67/125
摘要: 本申请公开了一种唤醒设备、系统及唤醒设备的调整方法,该唤醒设备包括:控制模块、供电模块、唤醒模块、语音模块和显示模块,供电模块分别与控制模块、唤醒模块、语音模块和显示模块相连接;控制模块分别与唤醒模块、语音模块和显示模块相连接,并通过向各个模块发送控制指令来控制各个模块的工作状态;显示模块用于显示实时时间和设定的唤醒时间;唤醒模块用于在设定的唤醒时间到达时,根据预先设定的唤醒方式唤醒用户,唤醒方式包括灯光和/或音频;语音模块用于接收输入的语音数据,并对语音数据进行分析,得到语音控制指令,将语音控制指令发送给控制模块,控制模块通过语音控制指令控制唤醒模块和/或显示模块执行相应的操作。
-
-
-
-
-
-
-
-
-