-
公开(公告)号:CN111260569B
公开(公告)日:2023-09-01
申请号:CN202010027521.1
申请日:2020-01-10
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06V30/146 , G06V30/41 , G06T5/00
Abstract: 本申请公开了一种图像倾斜校正的方法、装置、电子设备和存储介质,涉及图像处理领域。具体实现方案为:根据待处理图像中的文本行的外接矩形,对待处理图像进行旋转处理,得到待处理图像的初始校正图像,初始校正图像中的文本行的外接矩形与水平方向垂直或平行;若初始校正图像中的文本行中的文字方向非正立,则对初始校正图像进行旋转处理,得到待处理图像的校正图像,校正图像中的文本行的文字方向为正立。本申请中在根据文本行的外接矩形对图像进行旋转后,还能够根据图像中的文字方向对图像进行90度倍数的旋转处理,使得旋转后的图像中的文字方向均为正立。
-
公开(公告)号:CN111475603B
公开(公告)日:2023-07-04
申请号:CN201910063094.X
申请日:2019-01-23
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/33
Abstract: 本申请提出一种企业标识识别方法、装置、计算机设备及存储介质,其中,方法包括:通过根据预设的企业品牌词集和预设的企业属性词集,计算待识别文本与不同企业标识对应的属性信息之间的文本相似度,将待识别文本输入预先训练得到的语义相似度模型,获取待识别文本与不同企业标识对应的属性信息之间的语义相似度,根据文本相似度和语义相似度,确定与待识别文本匹配的目标企业标识。由此,提高了企业标识识别的准确率,而且还提高企业标识识别召回率。
-
公开(公告)号:CN115170195A
公开(公告)日:2022-10-11
申请号:CN202210836126.7
申请日:2022-07-15
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06Q30/02
Abstract: 本公开提供了一种信息处理方法和装置,涉及深度学习、自然语言处理技术领域。具体实现方案为:获取信息竞价平台的当前时刻的当前信息、历史信息以及当前信息和历史信息的指标信息;基于当前信息、历史信息以及指标信息,确定信息竞价平台的下一时刻的属性环境状态;基于属性环境状态、当前信息、历史信息以及指标信息,检测信息竞价平台在下一时刻是否需要调整目标属性的属性值;响应于信息竞价平台在下一时刻需要调整目标属性的属性值,将属性环境状态和预设的属性调整目标发送给智能体,以使智能体基于属性环境状态和属性调整目标,向信息竞价平台发送属性值调整策略。该实施方式提高了目标属性的属性值调整的可靠性。
-
公开(公告)号:CN112182448A
公开(公告)日:2021-01-05
申请号:CN201910605528.4
申请日:2019-07-05
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/957 , G06F40/289
Abstract: 本发明实施例提供一种页面信息处理方法、装置及设备,该方法包括:在至少一个网络页面中获取至少一个候选词组,每个候选词组中包括至少一个名词词性的词汇;获取每个候选词组的内部凝合度、外部自由度和重要程度,内部凝合度用于指示候选词组为一个完整词的概率,外部自由度用于指示候选词组与多个语言环境相匹配的概率,重要程度用于指示候选词将至少一个网络页面中的内容与其它内容区分开的概率;根据每个候选词组的内部凝合度、外部自由度和重要程度,在至少一个候选词组中确定产品词和服务词。提高了确定产品词和服务词的准确性。
-
公开(公告)号:CN111475603A
公开(公告)日:2020-07-31
申请号:CN201910063094.X
申请日:2019-01-23
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/33
Abstract: 本申请提出一种企业标识识别方法、装置、计算机设备及存储介质,其中,方法包括:通过根据预设的企业品牌词集和预设的企业属性词集,计算待识别文本与不同企业标识对应的属性信息之间的文本相似度,将待识别文本输入预先训练得到的语义相似度模型,获取待识别文本与不同企业标识对应的属性信息之间的语义相似度,根据文本相似度和语义相似度,确定与待识别文本匹配的目标企业标识。由此,提高了企业标识识别的准确率,而且还提高企业标识识别召回率。
-
公开(公告)号:CN111260569A
公开(公告)日:2020-06-09
申请号:CN202010027521.1
申请日:2020-01-10
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了一种图像倾斜校正的方法、装置、电子设备和存储介质,涉及图像处理领域。具体实现方案为:根据待处理图像中的文本行的外接矩形,对待处理图像进行旋转处理,得到待处理图像的初始校正图像,初始校正图像中的文本行的外接矩形与水平方向垂直或平行;若初始校正图像中的文本行中的文字方向非正立,则对初始校正图像进行旋转处理,得到待处理图像的校正图像,校正图像中的文本行的文字方向为正立。本申请中在根据文本行的外接矩形对图像进行旋转后,还能够根据图像中的文字方向对图像进行90度倍数的旋转处理,使得旋转后的图像中的文字方向均为正立。
-
公开(公告)号:CN108733778A
公开(公告)日:2018-11-02
申请号:CN201810420223.1
申请日:2018-05-04
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明提出一种对象的行业类型识别方法和装置,其中,方法包括:将待识别对象的文本信息输入用于生成段落向量的语言模型中进行学习,得到待识别对象的与行业类型相关的向量空间;根据每个待识别对象的向量空间,从所有的待识别对象中选取第一待识别对象作为训练样本对象,获取训练样本对象的标注数据;利用训练样本对象的向量空间和标注数据,对构建的行业类型识别模型进行训练,得到目标行业类型识别模型;针对除训练样本对象之外的每个第二待识别对象,将第二待识别对象的向量空间,输入到目标行业类型识别模型中进行学习,得到第二待识别对象所隶属的行业类型。该方法能够提升行业类型识别模型的识别结果的准确率。
-
公开(公告)号:CN107797982A
公开(公告)日:2018-03-13
申请号:CN201610798213.2
申请日:2016-08-31
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/27
CPC classification number: G06F17/27 , G06F17/2715
Abstract: 本申请公开了用于识别文本类型的方法、装置和设备。所述方法的一具体实施方式包括:对预先获取的文本进行预处理得到所述文本的关键词集合;计算所述关键词集合中的每个关键词在所述文本中的出现概率值;对于所述关键词集合中的每个关键词,将该关键词和与该关键词对应的出现概率值导入预先建立的文档主题生成模型,确定所述文档主题生成模型中预先设置的各个主题在所述文本的出现概率值;根据所述各个主题在所述文本中的出现概率值,识别所述文本所属的类型。该实施方式提高了识别文本类型的准确率。
-
公开(公告)号:CN104539581B
公开(公告)日:2017-12-26
申请号:CN201410720667.9
申请日:2014-12-01
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提供了信息搜索实现方法、装置和网络端设备,其中的方法包括:建立与认证系统之间的套接字连接;接收搜索引擎传输来的检索结果认证请求;将所述检索结果认证请求封装为通用网关接口数据包,并通过所述套接字连接向认证系统发送所述通用网关接口数据包;接收认证系统传输来的被封装为通用网关接口数据包的检索结果认证响应,并去除所述检索结果认证响应的通用网关接口封装;向搜索引擎发送去除封装的检索结果认证响应。本发明提供的上述技术方案能够对检索结果进行实时认证,且尽可能的减小了检索结果实时认证过程对检索结果下发延时所产生的影响,有利于保证搜索引擎针对搜索引擎客户端而言具有较高的实时响应速度。
-
公开(公告)号:CN105117291A
公开(公告)日:2015-12-02
申请号:CN201510374333.5
申请日:2015-06-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F9/50
Abstract: 本发明提供一种调节消息推送执行体的运行数量的方法及系统,所述方法包括:读取消息推送执行体的基于服务端的负载信息的配置量;识别所述读取的配置量是否已更新;若识别为已更新,则根据所述读取的配置量调节所述消息推送执行体的运行数量。根据采用本发明提供的技术方案,可以基于服务端的负载信息对消息推送执行体的数量进行调节,从而实现根据下游服务端的实际处理能力动态调节消息推送执行体的数量,最大化利用机器资源以提高消息队列的推送性能。
-
-
-
-
-
-
-
-
-