-
公开(公告)号:CN117558015A
公开(公告)日:2024-02-13
申请号:CN202210928214.X
申请日:2022-08-03
Applicant: 微软技术许可有限责任公司
IPC: G06V30/412
Abstract: 根据本公开的实现,提供了表格结构识别的方案。根据该方案,基于第一特征图,确定包括表格的图像中的第一组参考点。第一特征图根据图像生成,并且第一组参考点是表格的第一类型分隔线上的候选点。基于第一特征图的至少一部分和第一组参考点的特征,在图像中确定针对表格的一组第一类型预测分隔线。至少基于该组第一类型预测分隔线,确定表格的结构。以此方式,可以从图像中恢复各种结构的表格。
-
公开(公告)号:CN116783649A
公开(公告)日:2023-09-19
申请号:CN202180092220.X
申请日:2021-11-15
Applicant: 微软技术许可有限责任公司
IPC: G10L15/06
Abstract: 提供了一种用于标识目标数据集的系统和方法,其被配置成促进包括在自动语音识别系统中的声学模型的准确度的改进。系统获得测试数据集,该测试数据集包括(i)具有自然语音话语的音频数据和(ii)该自然语音话语的转录。系统基于自然语音话语的转录来生成包括具有合成语音话语的音频数据的文本转语音数据集。系统将测试数据集和文本转语音数据集应用于声学模型以分别获得第一声学模型输出和第二声学模型输出。系统标识第一声学模型输出中的第一错误集和第二声学模型输出中的第二错误集。最终,声学模型错误率基于比较第一错误集和第二错误集被生成。
-
公开(公告)号:CN115004261A
公开(公告)日:2022-09-02
申请号:CN202080093448.6
申请日:2020-01-17
Applicant: 微软技术许可有限责任公司
IPC: G06V30/148 , G06V20/70
Abstract: 本公开的实现提供了用于文本行检测的解决方案。在该解决方案中,从图像中确定包括至少第一文本元素的第一部分的第一文本区域和包括至少第二文本元素的第二部分的第二文本区域。从第一文本区域中提取第一特征表示并且从第二文本区域中提取第二特征表示。第一特征表示和第二特征表示包括图像的图像特征表示或图像的语义特征表示中的至少一项。然后可以至少部分基于第一特征表示和第二特征表示来确定第一文本区域与第二文本区域之间的链接关系。链接关系可以指示第一文本元素和第二文本元素的第一部分和第二部分是否位于同一文本行中。以这种方式,通过检测文本区域并且基于其特征表示确定其链接关系,可以提高检测各种图像中的文本行的准确性和效率。
-
公开(公告)号:CN115004261B
公开(公告)日:2025-01-17
申请号:CN202080093448.6
申请日:2020-01-17
Applicant: 微软技术许可有限责任公司
IPC: G06V30/148 , G06V20/70
Abstract: 本公开的实现提供了用于文本行检测的解决方案。在该解决方案中,从图像中确定包括至少第一文本元素的第一部分的第一文本区域和包括至少第二文本元素的第二部分的第二文本区域。从第一文本区域中提取第一特征表示并且从第二文本区域中提取第二特征表示。第一特征表示和第二特征表示包括图像的图像特征表示或图像的语义特征表示中的至少一项。然后可以至少部分基于第一特征表示和第二特征表示来确定第一文本区域与第二文本区域之间的链接关系。链接关系可以指示第一文本元素和第二文本元素的第一部分和第二部分是否位于同一文本行中。以这种方式,通过检测文本区域并且基于其特征表示确定其链接关系,可以提高检测各种图像中的文本行的准确性和效率。
-
-
-