-
公开(公告)号:CN104715005B
公开(公告)日:2018-02-16
申请号:CN201410763914.3
申请日:2014-12-11
Applicant: 株式会社东芝
CPC classification number: G10L15/22 , G10L15/01 , G10L2015/228
Abstract: 根据实施例,信息处理设备包括存储器控制器、检测器、获取器、检索器、确定器、显示控制器、历史更新器、选择器和阈值更新器。存储器控制器在存储器中存储语音文本中的字符串、节点索引、识别得分和语音索引。检测器检测再现区段信息。获取器获取朗读信息和插入位置信息。检索器从语音索引中的多个字符串中指定字符串作为检索的目标字符串。当对应于由检索器获取的字符串的语音识别得分的值等于或大于显示阈值时,确定器确定显示该字符串。显示控制器在显示单元上显示所确定的字符串。历史更新器执行储存控制,以在候选历史存储器中存储候选历史数据。当由显示控制器显示的字符串受到选择操作时,选择器选择字符串。阈值更新器决定显示阈值。
-
公开(公告)号:CN104715005A
公开(公告)日:2015-06-17
申请号:CN201410763914.3
申请日:2014-12-11
Applicant: 株式会社东芝
CPC classification number: G10L15/22 , G10L15/01 , G10L2015/228
Abstract: 根据实施例,信息处理设备包括存储器控制器、检测器、获取器、检索器、确定器、显示控制器、历史更新器、选择器和阈值更新器。存储器控制器在存储器中存储语音文本中的字符串、节点索引、识别得分和语音索引。检测器检测再现区段信息。获取器获取朗读信息和插入位置信息。检索器从语音索引中的多个字符串中指定字符串作为检索的目标字符串。当对应于由检索器获取的字符串的语音识别得分的值等于或大于显示阈值时,确定器确定显示该字符串。显示控制器在显示单元上显示所确定的字符串。历史更新器执行储存控制,以在候选历史存储器中存储候选历史数据。当由显示控制器显示的字符串受到选择操作时,选择器选择字符串。阈值更新器决定显示阈值。
-
公开(公告)号:CN104240718A
公开(公告)日:2014-12-24
申请号:CN201410089873.4
申请日:2014-03-12
Applicant: 株式会社东芝
CPC classification number: G10L15/26 , G10L13/033 , G10L13/08 , G10L21/043
Abstract: 根据一个实施例,一种转录支持设备包括:第一语音获取单元、第二语音获取单元、识别器、文本获取单元、信息获取单元、确定单元和控制器。第一语音获取单元获取将被转录的第一语音。第二语音获取单元获取由用户发声的第二语音。识别器识别所述第二语音以产生第一文本。文本获取单元获取第二文本,所述第二文本通过由用户修正所述第一文本而获得。信息获取单元获取表示所述第一语音的重放部分的重放信息。确定单元基于第一语音、第二语音、第二文本及和重放信息来确定第一语音的重放速度。控制器以确定的重放速度来重放第一语音。
-
公开(公告)号:CN116072120A
公开(公告)日:2023-05-05
申请号:CN202211050256.4
申请日:2022-08-31
Applicant: 株式会社东芝
IPC: G10L15/26
Abstract: 本发明提供一种字幕生成装置、方法以及存储介质,在实时地根据声音辨识结果生成字幕时降低用于使字幕变得易于阅读的修正的负担。实施方式所涉及的字幕生成装置具备取得部、历史部、生成部、历史更新部以及提示部。取得部逐次地取得声音辨识结果的文本。历史部将文本保存为历史数据。生成部根据保存的一个以上的历史数据来推测文本的分割位置以及结合位置,并基于分割位置以及结合位置,根据一个以上的历史数据来生成字幕文本。历史更新部根据分割位置以及所述结合位置来更新历史数据。提示部提示字幕文本。
-
公开(公告)号:CN113362817A
公开(公告)日:2021-09-07
申请号:CN202010922258.2
申请日:2020-09-04
Applicant: 株式会社东芝
Abstract: 实施方式涉及声音识别纠错装置、声音识别纠错方法以及声音识别纠错程序。提供自动地纠正声音识别结果的错误的声音识别纠错技术。根据实施方式,纠错部计算作为对新的一系列的声音数据进行声音识别而得到的结果的纠错对象的声音识别结果列和修正网络保持部中保持的修正网络的差分,如果表示该差分的值在阈值以下,则使用修正网络进行针对纠错对象的声音识别结果列中的声音识别的错误部分的纠错,生成声音识别纠错结果列。
-
公开(公告)号:CN104298365A
公开(公告)日:2015-01-21
申请号:CN201410337928.9
申请日:2014-07-16
Applicant: 株式会社东芝
IPC: G06F3/023
CPC classification number: G06F3/0237 , G06F17/212 , G06F17/276 , G06F17/2785
Abstract: 按照一个实施例,字符输入设备包括第一获取器、确定器、第一生成器以及输出器。所述第一获取器接收来自用户的字符输入并获取输入字符串。所述确定器从所述输入字符串中推断所述用户所希望的文字符号以及所述文字符号之间的连接关系,并且确定路线,其中的每条路线代表具有很大可能作为所述用户所希望的符号候选的连接关系。所述第一生成器从包含于所述路线中的文字符号组中提取将要被输出的文字符号,并且产生布局信息,其用于输出所提取的文字符号作为所述符号候选。所述输出器输出所述布局信息。
-
公开(公告)号:CN113362817B
公开(公告)日:2024-08-27
申请号:CN202010922258.2
申请日:2020-09-04
Applicant: 株式会社东芝
Abstract: 实施方式涉及声音识别纠错装置、声音识别纠错方法以及声音识别纠错程序。提供自动地纠正声音识别结果的错误的声音识别纠错技术。根据实施方式,纠错部计算作为对新的一系列的声音数据进行声音识别而得到的结果的纠错对象的声音识别结果列和修正网络保持部中保持的修正网络的差分,如果表示该差分的值在阈值以下,则使用修正网络进行针对纠错对象的声音识别结果列中的声音识别的错误部分的纠错,生成声音识别纠错结果列。
-
公开(公告)号:CN110136720B
公开(公告)日:2022-10-04
申请号:CN201810918988.8
申请日:2018-08-14
Applicant: 株式会社东芝
Inventor: 芦川平
Abstract: 提供一种编辑支援装置、编辑支援方法以及程序。具体地掌握利用追加到发音词典的单词的声音识别结果的影响范围。实施方式的编辑支援装置具备抽出部、推测部、以及输出控制部。抽出部根据追加到在声音识别中使用的词典的单词的读音及记载的至少一方,从说话声音集合抽出与所述单词关联的关联说话声音。推测部推测调整所述单词的识别难易度的权重、和在被设定所述权重的情况下推测从所述关联说话声音识别的推测识别结果。输出控制部根据设定的所述权重,控制所述推测识别结果的输出。
-
公开(公告)号:CN110136720A
公开(公告)日:2019-08-16
申请号:CN201810918988.8
申请日:2018-08-14
Applicant: 株式会社东芝
Inventor: 芦川平
Abstract: 提供一种编辑支援装置、编辑支援方法以及程序。具体地掌握利用追加到发音词典的单词的声音识别结果的影响范围。实施方式的编辑支援装置具备抽出部、推测部、以及输出控制部。抽出部根据追加到在声音识别中使用的词典的单词的读音及记载的至少一方,从说话声音集合抽出与所述单词关联的关联说话声音。推测部推测调整所述单词的识别难易度的权重、和在被设定所述权重的情况下推测从所述关联说话声音识别的推测识别结果。输出控制部根据设定的所述权重,控制所述推测识别结果的输出。
-
公开(公告)号:CN104103273A
公开(公告)日:2014-10-15
申请号:CN201410090288.6
申请日:2014-03-12
Applicant: 株式会社东芝
CPC classification number: G10L15/26 , G10L15/01 , G10L2015/226
Abstract: 根据一个实施例,文本生成器包括识别器、选择器和生成单元。识别器被配置为识别所拾取的声音,并获取识别单元中识别的字符串和所识别的字符串的可信度。选择器被配置为基于关于转录精确度的参数和关于转录所需工作量的参数中的至少一个,选择至少一个所识别的字符串用于转录的句子。生成单元被配置为使用所选的识别字符串生成转录的句子。
-
-
-
-
-
-
-
-
-