-
公开(公告)号:CN113221563B
公开(公告)日:2024-04-16
申请号:CN202110424249.5
申请日:2021-04-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/295 , G06F3/04842
Abstract: 本说明书实施例公开了一种PDF文档的标注方法、装置以及设备。方案包括:展示PDF文档,并接收用户在PDF文档中执行的框选操作;在框选操作对应的框选范围中抽取文本信息;针对文本信息标注其在PDF文档中的结构信息,得到文本信息对应的结构化单元;在结构化单元中选词以及对所选的词进行命名实体识别NER标注,得到标注结果,用于模型训练。
-
公开(公告)号:CN115311668A
公开(公告)日:2022-11-08
申请号:CN202211007444.9
申请日:2022-08-22
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V30/412 , G06V30/32
Abstract: 本说明书提供了测试文本图片的生成方法、装置及标注质量的确定方法。具体的,可以先对待标注的目标文本图片进行预处理,以获取目标文本图片中的文本字符数据和空白区域数据;再根据文本字符数据和空白区域数据,在目标文本图片中设置相应的埋点文本,从而可以高效地自动生成埋设有与原文本字符匹配度较高的埋点文本,且测试效果较好的测试文本图片,进而后续可以利用上述测试文本图片,通过相应测试,较为准确地确定出负责标注的目标对象的标注质量。
-
公开(公告)号:CN110968885A
公开(公告)日:2020-04-07
申请号:CN201911310374.2
申请日:2019-12-18
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本发明提供一种模型训练数据存储方法及装置、电子设备、存储介质,包括:获取模型训练数据;将所述模型训练数据分割为至少两个数据片段;对所述至少两个数据片段分别进行加密处理,得到至少两个加密数据片段;将所述至少两个加密数据片段存储在存储容器中;其中,所述至少两个加密数据片段中存在至少一个加密数据片段与其他加密数据片段存储在不同的存储容器中。本发明提供的模型训练数据存储方法及装置、电子设备、存储介质,通过上述对数据进行分割、加密和分隔存储的处理方式,对于单个的模型训练数据,在一定程度上避免了数据泄漏的风险。如果这些数据是用户隐私数据,则避免了用户隐私的泄露。
-
公开(公告)号:CN110865753B
公开(公告)日:2021-01-22
申请号:CN201911083930.7
申请日:2019-11-07
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F9/451
Abstract: 本说明书实施例提供一种应用消息的通知方法及装置。其中该通知方法的执行主体为终端设备,该方法包括:首先,响应于接收到应用消息的通知请求,对所述终端设备中显示的界面进行截取,得到若干截屏图片;接着,将若干截屏图片分别输入第一区域预测模型中,得到对应的若干第一显示区域;所述第一区域预测模型基于多张带标注的样本截屏图片而预先训练,所述标注对应于样本截屏图片中不包含重要内容的区域;然后,基于所述若干第一显示区域,确定目标显示区域,用于显示针对所述应用消息的通知内容。
-
公开(公告)号:CN111310866A
公开(公告)日:2020-06-19
申请号:CN202010384137.7
申请日:2020-05-09
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06K9/62
Abstract: 本说明书实施例提出了一种数据标注方法、装置、系统和终端设备,其中,上述数据标注方法中,第一终端设备接收标注平台服务器发送的待标注任务包,然后从待标注任务包中获取当前待标注的图片,并获取当前待标注的图片的访问链接,第一终端设备展示上述访问链接,以供第二终端设备根据上述访问链接,获得当前待标注的图片,进行描绘操作,从而可以实现将在第一终端设备上无法完成标注的图片发送到第二终端设备,对图片中标注对象的轮廓进行精准描绘。然后,第一终端设备获取第二终端设备的描绘信息,对上述描绘信息进行编号并输入与上述描绘信息对应的文本信息,从而完成当前待标注的图片的标注操作。
-
公开(公告)号:CN113221563A
公开(公告)日:2021-08-06
申请号:CN202110424249.5
申请日:2021-04-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/295 , G06F3/0484
Abstract: 本说明书实施例公开了一种PDF文档的标注方法、装置以及设备。方案包括:展示PDF文档,并接收用户在PDF文档中执行的框选操作;在框选操作对应的框选范围中抽取文本信息;针对文本信息标注其在PDF文档中的结构信息,得到文本信息对应的结构化单元;在结构化单元中选词以及对所选的词进行命名实体识别NER标注,得到标注结果,用于模型训练。
-
公开(公告)号:CN111310866B
公开(公告)日:2020-08-25
申请号:CN202010384137.7
申请日:2020-05-09
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06K9/62
Abstract: 本说明书实施例提出了一种数据标注方法、装置、系统和终端设备,其中,上述数据标注方法中,第一终端设备接收标注平台服务器发送的待标注任务包,然后从待标注任务包中获取当前待标注的图片,并获取当前待标注的图片的访问链接,第一终端设备展示上述访问链接,以供第二终端设备根据上述访问链接,获得当前待标注的图片,进行描绘操作,从而可以实现将在第一终端设备上无法完成标注的图片发送到第二终端设备,对图片中标注对象的轮廓进行精准描绘。然后,第一终端设备获取第二终端设备的描绘信息,对上述描绘信息进行编号并输入与上述描绘信息对应的文本信息,从而完成当前待标注的图片的标注操作。
-
公开(公告)号:CN110865753A
公开(公告)日:2020-03-06
申请号:CN201911083930.7
申请日:2019-11-07
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F3/0484 , G06F9/451 , H04M1/725
Abstract: 本说明书实施例提供一种应用消息的通知方法及装置。其中该通知方法的执行主体为终端设备,该方法包括:首先,响应于接收到应用消息的通知请求,对所述终端设备中显示的界面进行截取,得到若干截屏图片;接着,将若干截屏图片分别输入第一区域预测模型中,得到对应的若干第一显示区域;所述第一区域预测模型基于多张带标注的样本截屏图片而预先训练,所述标注对应于样本截屏图片中不包含重要内容的区域;然后,基于所述若干第一显示区域,确定目标显示区域,用于显示针对所述应用消息的通知内容。
-
-
-
-
-
-
-