-
公开(公告)号:CN103942182B
公开(公告)日:2018-04-27
申请号:CN201410177826.5
申请日:2014-04-29
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/21
Abstract: 本发明实施例公开了一种英文文本格式优化方法及装置,该方法包括:如果所述英文文本中相邻两行中前一行文本的行尾特征与后一行文本的行首特征满足预设行间修正条件,则对所述行尾特征与所述行首特征进行修正;和/或,如果所述英文文本的文本行包括预设的标题关键字集合中的标题关键字,则确定所述文本行为标题行;和/或,如果所述英文文本的文本行所包含的单词总数目小于或等于预设的最大单词数阈值,且所述文本行包含首字母为大字字母的单词的数目与所述单词总数目的比值大于或等于预设的第一比例阈值,则确定所述文本行为标题行。本发明实施例的技术方案能提高对英文阅读资源进行格式优化的效率,能节约成本。
-
公开(公告)号:CN103942182A
公开(公告)日:2014-07-23
申请号:CN201410177826.5
申请日:2014-04-29
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/21
Abstract: 本发明实施例公开了一种英文文本格式优化方法及装置,该方法包括:如果所述英文文本中相邻两行中前一行文本的行尾特征与后一行文本的行首特征满足预设行间修正条件,则对所述行尾特征与所述行首特征进行修正;和/或,如果所述英文文本的文本行包括预设的标题关键字集合中的标题关键字,则确定所述文本行为标题行;和/或,如果所述英文文本的文本行所包含的单词总数目小于或等于预设的最大单词数阈值,且所述文本行包含首字母为大字字母的单词的数目与所述单词总数目的比值大于或等于预设的第一比例阈值,则确定所述文本行为标题行。本发明实施例的技术方案能提高对英文阅读资源进行格式优化的效率,能节约成本。
-