-
公开(公告)号:CN105206267B
公开(公告)日:2019-04-02
申请号:CN201510569945.X
申请日:2015-09-09
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种融合非确定性反馈的语音识别错误修正方法及系统,其中,方法包括:接收用户的非确定性反馈,获得所述非确定性反馈对应的所有字;计算所述非确定性反馈对应的所有字在用户已确认文字的约束下出现的概率;以及,根据计算的概率,将所述非确定性反馈对应的所有字的全部或部分按顺序显示给用户。本发明提高了修正效率并节省了人力;此外,还统一了反馈界面,用户体验更好。
-
公开(公告)号:CN109344389A
公开(公告)日:2019-02-15
申请号:CN201810929248.4
申请日:2018-08-15
Applicant: 中国科学院计算技术研究所
IPC: G06F17/27
Abstract: 本发明涉及一种汉盲对照双语语料库的构建方法和系统,包括:获取内容相同的汉语文本和盲文文本;分别将盲文文本和汉语文本进行切分处理,得到第一盲文句子集合和汉语句子集合;在第一盲文句子集合和汉语句子集合之间进行汉语盲文匹配处理,以在第一盲文句子集合中找到与汉语句子集合中汉语句子相匹配的盲文句子,保留匹配成功的汉语句子和盲文句子;将所有匹配成功的汉语句子和盲文句子按照篇章、句子、词语多级对照的要求生成汉盲双语语料库。本发明可由计算机自动从内容相同但不精确对应的汉语和盲文文件中自动对齐和抽取语料,生成篇章、句子、词语多级对照的汉盲双语语料库。相对于人工语料库构建方法,提高了效率、降低了成本。
-
公开(公告)号:CN105206267A
公开(公告)日:2015-12-30
申请号:CN201510569945.X
申请日:2015-09-09
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种融合非确定性反馈的语音识别错误修正方法及系统,其中,方法包括:接收用户的非确定性反馈,获得所述非确定性反馈对应的所有字;计算所述非确定性反馈对应的所有字在用户已确认文字的约束下出现的概率;以及,根据计算的概率,将所述非确定性反馈对应的所有字的全部或部分按顺序显示给用户。本发明提高了修正效率并节省了人力;此外,还统一了反馈界面,用户体验更好。
-
公开(公告)号:CN109241540B
公开(公告)日:2020-09-15
申请号:CN201810889881.5
申请日:2018-08-07
Applicant: 中国科学院计算技术研究所
IPC: G06F40/58 , G06F40/289
Abstract: 本发明涉及一种基于深度神经网络的汉盲自动转换方法和系统,包括:获取句子和词语级对照的汉盲双语语料库,利用汉盲双语语料库训练深度神经网络,得到用于对汉字串进行分词的分词模型,并利用汉盲双语语料库,得到用于对汉字进行标调的标调模型;获取待转换的汉字文本,使用分词模型将汉字文本按照盲文规则进行分词,得到多个字词,使用标调模型对字词进行标调,将标调后的字词转换为盲文。本发明采用训练好的模型直接将汉字串按照盲文规则进行分词。由此可充分利用汉字信息,避免对盲文串分词时因丢失汉字信息、同音字词互相混淆而影响分词效果的问题。采用深度神经网络模型和标调模型,可得到更高的转换准确率。
-
公开(公告)号:CN109344389B
公开(公告)日:2020-08-18
申请号:CN201810929248.4
申请日:2018-08-15
Applicant: 中国科学院计算技术研究所
IPC: G06F40/247
Abstract: 本发明涉及一种汉盲对照双语语料库的构建方法和系统,包括:获取内容相同的汉语文本和盲文文本;分别将盲文文本和汉语文本进行切分处理,得到第一盲文句子集合和汉语句子集合;在第一盲文句子集合和汉语句子集合之间进行汉语盲文匹配处理,以在第一盲文句子集合中找到与汉语句子集合中汉语句子相匹配的盲文句子,保留匹配成功的汉语句子和盲文句子;将所有匹配成功的汉语句子和盲文句子按照篇章、句子、词语多级对照的要求生成汉盲双语语料库。本发明可由计算机自动从内容相同但不精确对应的汉语和盲文文件中自动对齐和抽取语料,生成篇章、句子、词语多级对照的汉盲双语语料库。相对于人工语料库构建方法,提高了效率、降低了成本。
-
公开(公告)号:CN109241540A
公开(公告)日:2019-01-18
申请号:CN201810889881.5
申请日:2018-08-07
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种基于深度神经网络的汉盲自动转换方法和系统,包括:获取句子和词语级对照的汉盲双语语料库,利用汉盲双语语料库训练深度神经网络,得到用于对汉字串进行分词的分词模型,并利用汉盲双语语料库,得到用于对汉字进行标调的标调模型;获取待转换的汉字文本,使用分词模型将汉字文本按照盲文规则进行分词,得到多个字词,使用标调模型对字词进行标调,将标调后的字词转换为盲文。本发明采用训练好的模型直接将汉字串按照盲文规则进行分词。由此可充分利用汉字信息,避免对盲文串分词时因丢失汉字信息、同音字词互相混淆而影响分词效果的问题。采用深度神经网络模型和标调模型,可得到更高的转换准确率。
-
-
-
-
-