-
公开(公告)号:CN107146623A
公开(公告)日:2017-09-08
申请号:CN201710223526.X
申请日:2017-04-07
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提出一种基于人工智能的语音识别方法、装置和系统,其中,方法包括:在语音识别过程中,采集待识别的语音数据;通过与服务端的上行连接,向服务端发送上行数据流,其中,上行数据流包括语音数据;在向服务端发送上行数据流的过程中,并行通过与服务端的下行连接,接收服务端发送的下行数据流;其中,下行数据流,包括结果数据,结果数据是服务端根据语音数据进行语音识别得到的。该方法通过两条并行的数据流,以流式数据传输的方式实现了待识别语音数据的实时上传和语音识别结果的实时下发,解决了现有技术中无法实现数据的实时上传和实时下发的技术问题。
-
公开(公告)号:CN105096941A
公开(公告)日:2015-11-25
申请号:CN201510558047.4
申请日:2015-09-02
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/07
Abstract: 本发明公开了一种语音识别方法以及装置,其中方法包括:获取说话人输入的语音信息,并获取说话人的说话人信息;根据说话人信息判断是否存在与说话人对应的个人声学模型;如果存在,则获取的个人声学模型,并根据说话人的个人声学模型对语音信息进行语音识别;如果不存在,则根据基础声学模型对语音信息进行语音识别,并根据语音信息生成说话人的语料信息并存储;以及根据基础声学模型和存储的语料信息生成说话人的个人声学模型。该方法可以基于说话人自适应的语音识别过程能够针对每个说话人的特点,定制他们的声学模型,从而提高每个说话人的准确度,提升了用户体验。
-
公开(公告)号:CN107146623B
公开(公告)日:2021-03-16
申请号:CN201710223526.X
申请日:2017-04-07
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提出一种基于人工智能的语音识别方法、装置和系统,其中,方法包括:在语音识别过程中,采集待识别的语音数据;通过与服务端的上行连接,向服务端发送上行数据流,其中,上行数据流包括语音数据;在向服务端发送上行数据流的过程中,并行通过与服务端的下行连接,接收服务端发送的下行数据流;其中,下行数据流,包括结果数据,结果数据是服务端根据语音数据进行语音识别得到的。该方法通过两条并行的数据流,以流式数据传输的方式实现了待识别语音数据的实时上传和语音识别结果的实时下发,解决了现有技术中无法实现数据的实时上传和实时下发的技术问题。
-
公开(公告)号:CN104967622A
公开(公告)日:2015-10-07
申请号:CN201510372778.X
申请日:2015-06-30
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G10L17/24 , G06F21/31 , G06F21/32 , H04L63/0861 , H04L9/3231 , H04L63/083
Abstract: 本发明提出一种基于声纹的通讯方法、装置和系统,该基于声纹的通讯方法包括向服务端发送第一信息,并接收所述服务端发送的标识信息,所述标识信息是所述服务端接收到所述第一信息后生成的,所述第一信息是用户账号信息和语音信息中的一种;向所述服务端发送第二信息和所述标识信息,所述第二信息是所述用户账号信息和所述语音信息中的另一种。该方法能够提高基于声纹通讯的安全性。
-
公开(公告)号:CN107526826B
公开(公告)日:2021-09-17
申请号:CN201710773346.9
申请日:2017-08-31
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/953 , G10L15/183 , G10L25/54
Abstract: 本发明提出一种语音搜索处理方法、装置及服务器,其中,该方法包括:获取语音搜索语句;分别根据N种语言模型,对所述搜索语句进行识别的同时,对所述搜索语句所属的语言类型进行判断,其中每种语言模型分别对应一种类型的语言,N为大于1的正整数;在确定所述搜索语句属于第i种类型的语言时,获取所述第i种类型的语言模型对应的识别结果;根据所述识别结果进行搜索。由此,实现了对语音搜索语句的识别及搜索,提高了语音搜索处理的效率,减少了用户的等待时间,改善了用户体验。
-
公开(公告)号:CN107370610A
公开(公告)日:2017-11-21
申请号:CN201710761582.9
申请日:2017-08-30
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请提出一种会议同步方发和装置,其中方法包括:获取第一终端发送的同步会议申请请求,其中申请请求中包括当前会议的信息;根据当前会议的信息,确定与当前会议关联的处理资源及共享链接;将共享链接发送给第一终端;在接收到第一终端发送的语音数据时,利用处理资源对语音数据进行处理,生成与当前会议对应的会议内容。该方法通过会议信息确定处理资源及共享链接,以对语音数据进行处理生成会议内容,不仅实现了对会议内容的自动记录,还可将会议内容通过共享链接分享给其他用户,提高了会议同步的灵活性,提升了用户体验。
-
公开(公告)号:CN104967622B
公开(公告)日:2017-04-05
申请号:CN201510372778.X
申请日:2015-06-30
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提出一种基于声纹的通讯方法、装置和系统,该基于声纹的通讯方法包括向服务端发送第一信息,并接收所述服务端发送的标识信息,所述标识信息是所述服务端接收到所述第一信息后生成的,所述第一信息是用户账号信息和语音信息中的一种;向所述服务端发送第二信息和所述标识信息,所述第二信息是所述用户账号信息和所述语音信息中的另一种。该方法能够提高基于声纹通讯的安全性。
-
公开(公告)号:CN107370610B
公开(公告)日:2020-12-11
申请号:CN201710761582.9
申请日:2017-08-30
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请提出一种会议同步方发和装置,其中方法包括:获取第一终端发送的同步会议申请请求,其中申请请求中包括当前会议的信息;根据当前会议的信息,确定与当前会议关联的处理资源及共享链接;将共享链接发送给第一终端;在接收到第一终端发送的语音数据时,利用处理资源对语音数据进行处理,生成与当前会议对应的会议内容。该方法通过会议信息确定处理资源及共享链接,以对语音数据进行处理生成会议内容,不仅实现了对会议内容的自动记录,还可将会议内容通过共享链接分享给其他用户,提高了会议同步的灵活性,提升了用户体验。
-
公开(公告)号:CN107731229A
公开(公告)日:2018-02-23
申请号:CN201710909504.9
申请日:2017-09-29
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G10L15/30 , G10L15/22 , G10L15/26 , G10L2015/227
Abstract: 本申请实施例公开了用于识别语音的方法和装置。该方法的一具体实施方式包括:接收用户通过终端发送的语音信息,同时获取所述用户的用户标识;对所述语音信息进行识别,得到第一识别文本;根据所述用户的用户标识确定与所述用户的用户标识关联存储的词语信息集合;根据确定的词语信息集合中的词语信息对所述第一识别文本进行处理,得到第二识别文本,并将所述第二识别文本发送到所述终端。该实施方式提高了语音识别的准确性,满足了用户的个性化需求。
-
公开(公告)号:CN107644095A
公开(公告)日:2018-01-30
申请号:CN201710899016.4
申请日:2017-09-28
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请实施例公开了用于搜索信息的方法和装置。该方法的一具体实施方式包括:响应于确定终端停止发送语音搜索信息,将从所述终端接收到的最终语音搜索信息进行语音识别,得到最终语音识别结果;根据所述最终语音识别结果从缓存中预先存储的待展示信息中选取最终待展示信息,其中,所述缓存中存储有至少一条基于中间语音识别结果获取的待展示信息,其中,所述中间语音识别结果是对所述终端发送的语音搜索信息进行实时语音识别得到的;将所述最终待展示信息发送到所述终端,以供所述终端进行展示。该实施方式通过从缓存中直接选取最终待展示信息,从而节省了根据最终语音识别结果获取待展示信息的时间,提高了语音搜索的速度。
-
-
-
-
-
-
-
-
-