-
公开(公告)号:CN112257412B
公开(公告)日:2023-12-01
申请号:CN202011024707.8
申请日:2020-09-25
Applicant: 科大讯飞股份有限公司
IPC: G06F40/205 , G06F40/279
Abstract: 本申请公开了一种篇章解析方法、电子设备和存储装置,其中,篇章解析方法包括:获取待解析篇章;其中,待解析篇章包括若干段落;对若干段落进行识别,将属于同一主题类型且连续的段落,作为与主题类型对应的区段;分别确定与同一主题类型对应的区段之间的编辑关系。上述方案,能够加深篇章解析深度。
-
公开(公告)号:CN115512366A
公开(公告)日:2022-12-23
申请号:CN202211020224.X
申请日:2022-08-24
Applicant: 科大讯飞股份有限公司
IPC: G06V30/262 , G06V30/19 , G06V30/148
Abstract: 本申请实施例提供了一种文本提取方法、模型训练方法计算机设备及存储介质,该方法包括:获取目标图像,所述目标图像至少包括字符区域;对所述目标图像进行文本识别,得到若干文本行,各所述文本行包括若干字符;基于文本分类模型,识别各所述文本行的段落类型;根据各所述文本行的段落类型,对所述若干文本行进行拼接,得到目标文本,所述目标文本包括若干文本段落。通过识别各文本行的段落类型,根据各文本行的段落类型,可以将文本识别得到的文本行拼接成包含语义段落信息的自然段,更符合用户的阅读习惯。
-
公开(公告)号:CN110209772B
公开(公告)日:2021-10-08
申请号:CN201910521610.9
申请日:2019-06-17
Applicant: 科大讯飞股份有限公司
IPC: G06F16/33
Abstract: 本申请公开了一种文本处理方法、装置、设备及可存储介质,针对任一段材料文本,在获取该材料文本所属的目标业务场景后,进一步获取材料文本中包含的与目标业务场景相关的关键信息。基于目标业务场景下,文本片段的特征信息和关键信息的特征信息,确定关键要素间的依存关系。其中,关键要素包括关键信息和材料文本中所包含的与目标业务场景相关的文本片段。显然,关键要素包括的文本片段和关键信息均为对理解材料文本有价值的信息。所以,本方案提供的文本处理方法基于文本片段的特征信息和关键信息的特征信息,所确定的关键要素间的依存关系可以表征材料文本中的各有价值信息之间的联系。
-
公开(公告)号:CN112257412A
公开(公告)日:2021-01-22
申请号:CN202011024707.8
申请日:2020-09-25
Applicant: 科大讯飞股份有限公司
IPC: G06F40/205 , G06F40/279
Abstract: 本申请公开了一种篇章解析方法、电子设备和存储装置,其中,篇章解析方法包括:获取待解析篇章;其中,待解析篇章包括若干段落;对若干段落进行识别,将属于同一主题类型且连续的段落,作为与主题类型对应的区段;分别确定与同一主题类型对应的区段之间的编辑关系。上述方案,能够加深篇章解析深度。
-
公开(公告)号:CN110209772A
公开(公告)日:2019-09-06
申请号:CN201910521610.9
申请日:2019-06-17
Applicant: 科大讯飞股份有限公司
IPC: G06F16/33
Abstract: 本申请公开了一种文本处理方法、装置、设备及可存储介质,针对任一段材料文本,在获取该材料文本所属的目标业务场景后,进一步获取材料文本中包含的与目标业务场景相关的关键信息。基于目标业务场景下,文本片段的特征信息和关键信息的特征信息,确定关键要素间的依存关系。其中,关键要素包括关键信息和材料文本中所包含的与目标业务场景相关的文本片段。显然,关键要素包括的文本片段和关键信息均为对理解材料文本有价值的信息。所以,本方案提供的文本处理方法基于文本片段的特征信息和关键信息的特征信息,所确定的关键要素间的依存关系可以表征材料文本中的各有价值信息之间的联系。
-
-
-
-