-
公开(公告)号:CN108090400B
公开(公告)日:2021-08-24
申请号:CN201611036897.9
申请日:2016-11-23
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团公司
Abstract: 本发明实施例公开了一种图像文本识别的方法,所述方法包括:构建单行文本图像训练集;利用所述单行文本图像训练集训练预设的神经网络模型,得到单行文本识别模型;利用所述单行文本识别模型识别随机场景的单行文本图像,得到识别后的文本信息。如此,实现了对自然场景单行文本信息的有效识别,降低了人工分割的成本。本发明实施例还公开了一种图像文本识别的装置。
-
公开(公告)号:CN108615043B
公开(公告)日:2021-05-25
申请号:CN201611137674.1
申请日:2016-12-12
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团公司
IPC: G06K9/62
Abstract: 本发明实施例公开了一种视频分类方法及系统,所述方法包括:所述系统从输入视频中获取至少一个视频分段;所述系统根据各视频分段中的距离特性,获取各视频分段对应的关键帧;所述系统对各关键帧进行图像分类,获取各关键帧对应的静态分类集合;所述系统根据各视频分段对应的关键帧、各关键帧对应的静态分类集合及预设视频类别参数,获取所述输入视频的分类结果,采用关键帧进行视频分类解决视频分类准确性差的问题。
-
公开(公告)号:CN108108731B
公开(公告)日:2021-02-05
申请号:CN201611055485.X
申请日:2016-11-25
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团公司
Abstract: 本发明实施例公开了一种基于合成数据的文本检测方法,包括:对包含有单字图像数据集的正样本与包含有非文本图像数据集的负样本进行深度神经网络训练,得到文本检测的全卷积神经网络模型;利用文本检测的全卷积神经网络模型得到待检测图像的灰度图的概率图并进行阈值二值化,得到二值化概率图;对二值化概率图与待检测图像的灰度图进行图像操作,得到除去非文本背景区域的图像,并在该除去非文本背景区域的图像中提取候选文本框;获取不同尺度下的除去非文本背景区域的待检测图的候选文本框,形成候选文本框集,并利用分类器对其进行过滤,得到最终的文本框;本发明实施例同时还公开了一种基于合成数据的文本检测装置。
-
公开(公告)号:CN108090400A
公开(公告)日:2018-05-29
申请号:CN201611036897.9
申请日:2016-11-23
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团公司
CPC classification number: G06K9/00442 , G06K9/6256 , G06N3/084
Abstract: 本发明实施例公开了一种图像文本识别的方法,所述方法包括:构建单行文本图像训练集;利用所述单行文本图像训练集训练预设的神经网络模型,得到单行文本识别模型;利用所述单行文本识别模型识别随机场景的单行文本图像,得到识别后的文本信息。如此,实现了对自然场景单行文本信息的有效识别,降低了人工分割的成本。本发明实施例还公开了一种图像文本识别的装置。
-
公开(公告)号:CN108108731A
公开(公告)日:2018-06-01
申请号:CN201611055485.X
申请日:2016-11-25
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团公司
Abstract: 本发明实施例公开了一种基于合成数据的文本检测方法,包括:对包含有单字图像数据集的正样本与包含有非文本图像数据集的负样本进行深度神经网络训练,得到文本检测的全卷积神经网络模型;利用文本检测的全卷积神经网络模型得到待检测图像的灰度图的概率图并进行阈值二值化,得到二值化概率图;对二值化概率图与待检测图像的灰度图进行图像操作,得到除去非文本背景区域的图像,并在该除去非文本背景区域的图像中提取候选文本框;获取不同尺度下的除去非文本背景区域的待检测图的候选文本框,形成候选文本框集,并利用分类器对其进行过滤,得到最终的文本框;本发明实施例同时还公开了一种基于合成数据的文本检测装置。
-
公开(公告)号:CN108615043A
公开(公告)日:2018-10-02
申请号:CN201611137674.1
申请日:2016-12-12
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团公司
IPC: G06K9/62
CPC classification number: G06K9/6267 , G06K9/6212
Abstract: 本发明实施例公开了一种视频分类方法及系统,所述方法包括:所述系统从输入视频中获取至少一个视频分段;所述系统根据各视频分段中的距离特性,获取各视频分段对应的关键帧;所述系统对各关键帧进行图像分类,获取各关键帧对应的静态分类集合;所述系统根据各视频分段对应的关键帧、各关键帧对应的静态分类集合及预设视频类别参数,获取所述输入视频的分类结果,采用关键帧进行视频分类解决视频分类准确性差的问题。
-
公开(公告)号:CN118799935A
公开(公告)日:2024-10-18
申请号:CN202410219247.6
申请日:2024-02-28
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本申请公开了一种人脸关键点检测方法、装置、设备、介质及程序产品,涉及人工智能技术领域。人脸关键点检测方法包括:获取待检测视频,待检测视频包括至少一帧目标人脸图像;对于待检测视频中任一目标人脸图像,利用目标骨干网络架构对目标人脸图像进行特征提取,得到目标特征图;利用目标自注意力机制模块对目标特征图进行信息提取,得到目标全局信息;利用目标输出网络对目标全局信息进行检测,得到目标人脸图像中目标人脸关键点对应的目标关键点信息。根据本申请实施例,有利于提高人脸关键点检测结果的遮挡鲁棒性。
-
公开(公告)号:CN110956123B
公开(公告)日:2024-02-27
申请号:CN201911183179.8
申请日:2019-11-27
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06V30/413 , G06V10/82 , G06N3/08
Abstract: 本发明实施例涉及信息管理领域,公开了一种富媒体内容的审核方法、装置、服务器及存储介质,本发明中,一种富媒体内容的审核方法,包括:对待审核的富媒体内容进行场景分类,得到富媒体内容的场景类型;根据场景类型对富媒体内容进行与场景类型对应的审核;若富媒体内容包含违规内容,则输出内容违规的审核结果。本发明通过对富媒体内容进行场景分类,根据不同的场景采用对应的审核方法进行富媒体内容的审核,在保证了准确性的同时,极大的提高了效率,降低了人工成本。
-
公开(公告)号:CN117078814A
公开(公告)日:2023-11-17
申请号:CN202310990719.3
申请日:2023-08-07
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06T13/40 , G06N3/0464 , G06N3/08
Abstract: 本申请涉及数据增强领域,提供一种样本数据增强方法及装置,应用于控制器,该方法包括:监测子网络以获取子网络的状态;基于所述子网络的状态生成数据增强策略,并将所述数据增强策略发送至所述子网络,所述数据增强策略用于子网络根据所述数据增强策略处理样本数据集以对控制器反馈奖励,并根据所述数据增强策略转化状态;接收所述子网络反馈的奖励以继续监测子网络的状态,并在子网络反馈的奖励符合预设标准后停止监测。本申请提供的样本数据增强方法可以解决现有数据增强方法占用硬件资源较多,编码和实践环节较为复杂,使得数据增强效率低的技术问题。
-
公开(公告)号:CN116976987A
公开(公告)日:2023-10-31
申请号:CN202211265221.2
申请日:2022-10-17
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06Q30/0251 , G06Q30/0601 , G06F3/01
Abstract: 本申请实施例公开了一种广告推送方法、装置、设备及存储介质,其中,所述方法包括:获取环境信息和当前用户的用户信息,并确定所述环境信息对应的环境标签和用户信息对应的用户标签;基于所述环境标签、所述用户标签和广告推送策略,确定目标推送广告;向所述当前用户展示所述目标推送广告,并接收所述当前用户对所述目标推送广告的反馈信息;所述反馈信息用于表征所述当前用户对所述目标推送广告的喜好情况;基于所述反馈信息更新所述广告推送策略。
-
-
-
-
-
-
-
-
-