-
公开(公告)号:CN108090038B
公开(公告)日:2022-01-14
申请号:CN201610993731.X
申请日:2016-11-11
Applicant: 科大讯飞股份有限公司
IPC: G06F40/211 , G06F40/289 , G10L15/06 , G10L15/26
Abstract: 本发明公开了一种文本断句方法及系统,该方法包括:预先收集少量文本数据及其对应的语音数据,构建基于文本断句特征和声学断句特征的长时记忆断句模型;在对文本断句时,获取待断句文本及其对应的语音数据;分别根据所述待断句文本及所述待断句文本对应的语音数据提取文本断句特征和声学断句特征;根据提取的文本断句特征、声学断句特征以及所述长时记忆断句模型,对所述待断句文本进行断句。本发明可以有效提高文本断句的准确度。
-
公开(公告)号:CN107480118B
公开(公告)日:2024-05-31
申请号:CN201710702071.X
申请日:2017-08-16
Applicant: 科大讯飞股份有限公司
IPC: G06F40/166 , G06F40/30 , G06F40/284 , G06F18/241 , G06F18/214
Abstract: 本发明公开了一种文本编辑方法及装置,该方法包括:获取待编辑的原始文本;接收用户编辑语音数据;对所述用户编辑语音数据进行语音识别,得到编辑命令;对所述编辑命令进行语义理解,以确定当前待编辑文本及编辑状态的取值;所述编辑状态用于描述是否能确定所述当前待编辑文本在原始文本中的位置;根据所述当前待编辑文本及编辑状态的取值确定是否执行所述编辑命令;如果是,则根据所述编辑命令对所述原始文本进行编辑;否则,与用户交互,以获取更多对应所述当前待编辑文本的编辑状态的取值。本发明可以提高文本编辑效率,并保证编辑操作的准确性。
-
公开(公告)号:CN107590121B
公开(公告)日:2020-09-11
申请号:CN201610539133.5
申请日:2016-07-08
Applicant: 科大讯飞股份有限公司
IPC: G06F40/30 , G06F40/117
Abstract: 本发明公开了一种文本规整方法及系统,该方法包括:接收待规整文本数据;对待规整文本数据进行分词,并对分词后的各词进行词性标注;提取各词的文本规整特征,所述文本规整特征包括:语义特征和泛化特征,所述语义特征包括每个词的词向量和词性向量,所述泛化特征用于描述文本数据中重复部分;将所述文本规整特征输入预先构建的文本规整模型,得到文本规整结果;根据所述文本规整结果,删除所述待规整文本数据中需要删除的词,得到规整后的文本数据。利用本发明,可有效提高文本规整效果。
-
公开(公告)号:CN110321534B
公开(公告)日:2023-11-24
申请号:CN201810262255.3
申请日:2018-03-28
Applicant: 科大讯飞股份有限公司
IPC: G06F40/166 , G06F40/30 , G06F40/284
Abstract: 本申请公开了一种文本编辑方法、装置、设备及可读存储介质,本申请获取到待编辑的原始文本数据及用户编辑命令,确定该编辑命令对应的编辑操作,以及根据原始文本数据,与用户编辑命令所包含的各词的语义相关性,从用户编辑命令中确定目标命令词,最后按照编辑操作,对原始文本数据中的目标命令词进行编辑。本申请方案用户仅需要输入编辑命令,即可实现自动对原始文本数据进行编辑的过程,极大减少了人工操作,提高了编辑效率。并且,本申请确定目标命令词时综合考虑了原始文本数据与用户编辑命令所包含各词的语义相关性,大大提高了目标命令词确定的准确度,能够更准确的按照用户的意愿完成整个文本编辑过程。
-
公开(公告)号:CN106373558B
公开(公告)日:2019-10-18
申请号:CN201510450586.6
申请日:2015-07-24
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种语音识别文本处理方法及系统,该方法包括:获取待识别语音数据;对所述语音数据进行语音识别,得到所述语音数据对应的语音识别结果,所述语音识别结果为语音数据对应的识别文本;对所述语音数据进行异常语音检测,以确定所述语音数据中的异常语音;对所述识别文本中对应所述异常语音的部分进行标记;将标记后的识别文本提供给用户。利用本发明,可以自动检测出异常语音数据的识别文本并标记出来,提示用户,降低对用户的误导。
-
公开(公告)号:CN110321534A
公开(公告)日:2019-10-11
申请号:CN201810262255.3
申请日:2018-03-28
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种文本编辑方法、装置、设备及可读存储介质,本申请获取到待编辑的原始文本数据及用户编辑命令,确定该编辑命令对应的编辑操作,以及根据原始文本数据,与用户编辑命令所包含的各词的语义相关性,从用户编辑命令中确定目标命令词,最后按照编辑操作,对原始文本数据中的目标命令词进行编辑。本申请方案用户仅需要输入编辑命令,即可实现自动对原始文本数据进行编辑的过程,极大减少了人工操作,提高了编辑效率。并且,本申请确定目标命令词时综合考虑了原始文本数据与用户编辑命令所包含各词的语义相关性,大大提高了目标命令词确定的准确度,能够更准确的按照用户的意愿完成整个文本编辑过程。
-
公开(公告)号:CN106373558A
公开(公告)日:2017-02-01
申请号:CN201510450586.6
申请日:2015-07-24
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种语音识别文本处理方法及系统,该方法包括:获取待识别语音数据;对所述语音数据进行语音识别,得到所述语音数据对应的语音识别结果,所述语音识别结果为语音数据对应的识别文本;对所述语音数据进行异常语音检测,以确定所述语音数据中的异常语音;对所述识别文本中对应所述异常语音的部分进行标记;将标记后的识别文本提供给用户。利用本发明,可以自动检测出异常语音数据的识别文本并标记出来,提示用户,降低对用户的误导。
-
公开(公告)号:CN108446410B
公开(公告)日:2022-05-17
申请号:CN201810531062.3
申请日:2018-05-29
Applicant: 科大讯飞股份有限公司
IPC: G06F16/9535 , G06F16/9536
Abstract: 本申请公开了一种信息推荐方法、装置、系统、设备及可读存储介质,其中服务端获取第一用户的意图,获取与第一用户的意图匹配的候选推荐信息集合,集合包含至少一条候选推荐信息,进一步将候选推荐信息集合发送给第二用户客户端,以供第二用户基于候选推荐信息集合确定所需向第一用户推荐的目标推荐信息。由于服务端能够及时获取第一用户的意图,并获取到与该意图匹配的候选推荐信息集合发送给第二用户客户端,这样当第二用户存在向第一用户进行信息推荐的需求时,可以直接基于服务端发送的与第一用户匹配的候选推荐信息集合,确定目标推荐信息,减少了信息检索耗时,占用时间更短,进而更加及时的进行信息推荐。
-
公开(公告)号:CN108446410A
公开(公告)日:2018-08-24
申请号:CN201810531062.3
申请日:2018-05-29
Applicant: 科大讯飞股份有限公司
IPC: G06F17/30
Abstract: 本申请公开了一种信息推荐方法、装置、系统、设备及可读存储介质,其中服务端获取第一用户的意图,获取与第一用户的意图匹配的候选推荐信息集合,集合包含至少一条候选推荐信息,进一步将候选推荐信息集合发送给第二用户客户端,以供第二用户基于候选推荐信息集合确定所需向第一用户推荐的目标推荐信息。由于服务端能够及时获取第一用户的意图,并获取到与该意图匹配的候选推荐信息集合发送给第二用户客户端,这样当第二用户存在向第一用户进行信息推荐的需求时,可以直接基于服务端发送的与第一用户匹配的候选推荐信息集合,确定目标推荐信息,减少了信息检索耗时,占用时间更短,进而更加及时的进行信息推荐。
-
公开(公告)号:CN108090038A
公开(公告)日:2018-05-29
申请号:CN201610993731.X
申请日:2016-11-11
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种文本断句方法及系统,该方法包括:预先收集少量文本数据及其对应的语音数据,构建基于文本断句特征和声学断句特征的长时记忆断句模型;在对文本断句时,获取待断句文本及其对应的语音数据;分别根据所述待断句文本及所述待断句文本对应的语音数据提取文本断句特征和声学断句特征;根据提取的文本断句特征、声学断句特征以及所述长时记忆断句模型,对所述待断句文本进行断句。本发明可以有效提高文本断句的准确度。
-
-
-
-
-
-
-
-
-