图像倾斜校正的方法、装置、电子设备和存储介质

    公开(公告)号:CN111260569B

    公开(公告)日:2023-09-01

    申请号:CN202010027521.1

    申请日:2020-01-10

    Abstract: 本申请公开了一种图像倾斜校正的方法、装置、电子设备和存储介质,涉及图像处理领域。具体实现方案为:根据待处理图像中的文本行的外接矩形,对待处理图像进行旋转处理,得到待处理图像的初始校正图像,初始校正图像中的文本行的外接矩形与水平方向垂直或平行;若初始校正图像中的文本行中的文字方向非正立,则对初始校正图像进行旋转处理,得到待处理图像的校正图像,校正图像中的文本行的文字方向为正立。本申请中在根据文本行的外接矩形对图像进行旋转后,还能够根据图像中的文字方向对图像进行90度倍数的旋转处理,使得旋转后的图像中的文字方向均为正立。

    企业标识识别方法、装置、计算机设备及存储介质

    公开(公告)号:CN111475603B

    公开(公告)日:2023-07-04

    申请号:CN201910063094.X

    申请日:2019-01-23

    Abstract: 本申请提出一种企业标识识别方法、装置、计算机设备及存储介质,其中,方法包括:通过根据预设的企业品牌词集和预设的企业属性词集,计算待识别文本与不同企业标识对应的属性信息之间的文本相似度,将待识别文本输入预先训练得到的语义相似度模型,获取待识别文本与不同企业标识对应的属性信息之间的语义相似度,根据文本相似度和语义相似度,确定与待识别文本匹配的目标企业标识。由此,提高了企业标识识别的准确率,而且还提高企业标识识别召回率。

    页面信息处理方法、装置及设备

    公开(公告)号:CN112182448A

    公开(公告)日:2021-01-05

    申请号:CN201910605528.4

    申请日:2019-07-05

    Abstract: 本发明实施例提供一种页面信息处理方法、装置及设备,该方法包括:在至少一个网络页面中获取至少一个候选词组,每个候选词组中包括至少一个名词词性的词汇;获取每个候选词组的内部凝合度、外部自由度和重要程度,内部凝合度用于指示候选词组为一个完整词的概率,外部自由度用于指示候选词组与多个语言环境相匹配的概率,重要程度用于指示候选词将至少一个网络页面中的内容与其它内容区分开的概率;根据每个候选词组的内部凝合度、外部自由度和重要程度,在至少一个候选词组中确定产品词和服务词。提高了确定产品词和服务词的准确性。

    企业标识识别方法、装置、计算机设备及存储介质

    公开(公告)号:CN111475603A

    公开(公告)日:2020-07-31

    申请号:CN201910063094.X

    申请日:2019-01-23

    Abstract: 本申请提出一种企业标识识别方法、装置、计算机设备及存储介质,其中,方法包括:通过根据预设的企业品牌词集和预设的企业属性词集,计算待识别文本与不同企业标识对应的属性信息之间的文本相似度,将待识别文本输入预先训练得到的语义相似度模型,获取待识别文本与不同企业标识对应的属性信息之间的语义相似度,根据文本相似度和语义相似度,确定与待识别文本匹配的目标企业标识。由此,提高了企业标识识别的准确率,而且还提高企业标识识别召回率。

    图像倾斜校正的方法、装置、电子设备和存储介质

    公开(公告)号:CN111260569A

    公开(公告)日:2020-06-09

    申请号:CN202010027521.1

    申请日:2020-01-10

    Abstract: 本申请公开了一种图像倾斜校正的方法、装置、电子设备和存储介质,涉及图像处理领域。具体实现方案为:根据待处理图像中的文本行的外接矩形,对待处理图像进行旋转处理,得到待处理图像的初始校正图像,初始校正图像中的文本行的外接矩形与水平方向垂直或平行;若初始校正图像中的文本行中的文字方向非正立,则对初始校正图像进行旋转处理,得到待处理图像的校正图像,校正图像中的文本行的文字方向为正立。本申请中在根据文本行的外接矩形对图像进行旋转后,还能够根据图像中的文字方向对图像进行90度倍数的旋转处理,使得旋转后的图像中的文字方向均为正立。

    对象的行业类型识别方法和装置

    公开(公告)号:CN108733778A

    公开(公告)日:2018-11-02

    申请号:CN201810420223.1

    申请日:2018-05-04

    Abstract: 本发明提出一种对象的行业类型识别方法和装置,其中,方法包括:将待识别对象的文本信息输入用于生成段落向量的语言模型中进行学习,得到待识别对象的与行业类型相关的向量空间;根据每个待识别对象的向量空间,从所有的待识别对象中选取第一待识别对象作为训练样本对象,获取训练样本对象的标注数据;利用训练样本对象的向量空间和标注数据,对构建的行业类型识别模型进行训练,得到目标行业类型识别模型;针对除训练样本对象之外的每个第二待识别对象,将第二待识别对象的向量空间,输入到目标行业类型识别模型中进行学习,得到第二待识别对象所隶属的行业类型。该方法能够提升行业类型识别模型的识别结果的准确率。

    用于识别文本类型的方法、装置和设备

    公开(公告)号:CN107797982A

    公开(公告)日:2018-03-13

    申请号:CN201610798213.2

    申请日:2016-08-31

    CPC classification number: G06F17/27 G06F17/2715

    Abstract: 本申请公开了用于识别文本类型的方法、装置和设备。所述方法的一具体实施方式包括:对预先获取的文本进行预处理得到所述文本的关键词集合;计算所述关键词集合中的每个关键词在所述文本中的出现概率值;对于所述关键词集合中的每个关键词,将该关键词和与该关键词对应的出现概率值导入预先建立的文档主题生成模型,确定所述文档主题生成模型中预先设置的各个主题在所述文本的出现概率值;根据所述各个主题在所述文本中的出现概率值,识别所述文本所属的类型。该实施方式提高了识别文本类型的准确率。

    对评论进行排序的方法和装置及机器可读存储介质

    公开(公告)号:CN111859946B

    公开(公告)日:2023-09-29

    申请号:CN201910324798.8

    申请日:2019-04-22

    Abstract: 本发明实施例提供一种对评论进行排序的方法和装置及机器可读存储介质,属于文本处理技术领域。该方法包括:确定至少一个评论中每一评论的内容质量参数和时间影响因子;基于所述至少一个评论中的每一评论的所述内容质量参数和所述时间影响因子确定该评论的评分;以及基于所述至少一个评论中的每一评论的评分对所述至少一个评分进行排序。藉此,实现了对评论进行排序,并且在对评论进行排序时同时考虑了评论的内容质量和发表时间,实现了在对评论进行排序时既能将有价值的优质评论展现给客户又能保证评论的时效性。

    资质识别模板构建方法、装置、设备和存储介质

    公开(公告)号:CN111209909B

    公开(公告)日:2023-08-18

    申请号:CN202010033391.2

    申请日:2020-01-13

    Abstract: 本申请实施例公开了一种资质识别模板构建方法、装置、设备和存储介质,涉及数据采集技术领域。具体实现方案为:对资质样本图像进行字符识别,得到字符内容和字符位置信息;基于所述字符内容和所述字符位置信息,确定所述资质样本图像中的关键字段区域以及信息值区域;根据所述关键字段区域和所述信息值区域,构建资质识别模板。本申请实施例通过从资质样本图像中识别并抽取包括关键字段区域以及信息值区域的待识别区域,能够快速构建各类或各版本资质的资质识别模板,避免人工对资质识别模板的个性化定制等繁复流程,提高资质识别模板构建和更新效率,降低开发成本。

    对评论进行排序的方法和装置及机器可读存储介质

    公开(公告)号:CN111859946A

    公开(公告)日:2020-10-30

    申请号:CN201910324798.8

    申请日:2019-04-22

    Abstract: 本发明实施例提供一种对评论进行排序的方法和装置及机器可读存储介质,属于文本处理技术领域。该方法包括:确定至少一个评论中每一评论的内容质量参数和时间影响因子;基于所述至少一个评论中的每一评论的所述内容质量参数和所述时间影响因子确定该评论的评分;以及基于所述至少一个评论中的每一评论的评分对所述至少一个评分进行排序。藉此,实现了对评论进行排序,并且在对评论进行排序时同时考虑了评论的内容质量和发表时间,实现了在对评论进行排序时既能将有价值的优质评论展现给客户又能保证评论的时效性。

Patent Agency Ranking