-
公开(公告)号:CN111898613B
公开(公告)日:2020-12-25
申请号:CN202011054144.7
申请日:2020-09-30
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了半监督语义分割模型训练方法、识别方法和装置,根据实施例的半监督语义分割模型训练方法,首先通过获取人工对第一图像中的待标注对象进行标注后得到的第一监督数据,进而通过第一监督数据训练得到对待标注对象的识别率相对较高的全监督语义分割模型。利用全监督语义分割模型对未经过人工标注的第二图像中的待标注对象进行标注,得到第二监督数据。再利用经过人工标注得到的第一监督数据和经过全监督语义分割模型标注得到的第二监督数据训练半监督语义分割模型,并利用半监督语义分割模型对第一图像、第二图像和随机扰动项进行识别,得到第三监督数据。最后通过第一、第二和第三监督数据对半监督语义分割模型再次训练。
-
公开(公告)号:CN112070069A
公开(公告)日:2020-12-11
申请号:CN202011245258.X
申请日:2020-11-10
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06K9/00 , G06K9/62 , G06F16/58 , G06F16/583 , G06F16/587 , G06N3/04
Abstract: 本说明书实施例提供了遥感图像的识别方法和装置。根据实施例的方法,首先需要得到待识别的遥感图像和文本识别参考数据,并对遥感图像和文本识别参考数据分别进行特征提取得到图像特征和文本特征。然后将图像特征和文本特征进行融合,得到融合特征,进而利用图像识别模型对融合特征进行识别得到遥感图像的识别结果。如此采用多源信息融合的方式,利用文本特征对图像特征进行筛选,能够提升遥感图像的识别精度。
-
公开(公告)号:CN111931873A
公开(公告)日:2020-11-13
申请号:CN202011040050.4
申请日:2020-09-28
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了图像识别方法和装置。根据实施例的方法,首先需要对待识别图像分别进行两次降尺寸处理,其中一个分支得到保留有待识别图像的全局语义及上下文关系的全局特征,另一个分支得到损失了待识别图像的全局语义但是保留有局部细节的多个第一局部特征。然后利用两个分支协同工作,在特征层面进行了特征共享,使得两个分支能够共享信息,同时关注各自擅长的部分,有效地利用待识别图像的整体和局部信息完成对待识别图像的识别。
-
公开(公告)号:CN111737419A
公开(公告)日:2020-10-02
申请号:CN202010759810.0
申请日:2020-07-31
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/33 , G06F16/332 , G06F16/35 , G06F16/36 , G06N5/04
Abstract: 本说明书实施例提供一种机器阅读理解中的数值推理方法和装置。方法包括:获取当前问题和当前文本;确定当前问题和当前文本中包括的各实体和各数字,以及各数字分别对应的类型;构建关系网络图,包括对应于各实体的实体节点,和对应于各数字的数字节点,在相同类型的数字节点之间,以及具有预设关系的实体节点和数字节点之间,通过连接边形成邻居;确定当前问题对应的第一问题表征向量,以及关系网络图中各节点的初始表征向量;基于各节点的初始表征向量,对所述关系网络图中的各节点进行预定次数的迭代,以得到各节点的更新表征向量。能够提高机器阅读理解中的数值推理处理复杂问题的能力。
-
公开(公告)号:CN111291552B
公开(公告)日:2020-08-14
申请号:CN202010384219.1
申请日:2020-05-09
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/232 , G06F40/30
Abstract: 本说明书实施例公开了一种文本内容修正的方法及系统。所述方法包括:获取待检测文本;生成所述待检测文本中各个字符对应的语义向量;对于每个所述语义向量,确定该语义向量在修正矩阵中对应的修正向量,进而将所述修正向量对应的字符作为修正后的字符;所述修正矩阵包括所述字符集中各字符的修正向量,其基于词嵌入矩阵和混淆特征矩阵生成;所述混淆特征矩阵基于所述词嵌入矩阵和混淆关系图,通过混淆模型获得;所述混淆关系图表示字符之间的符号近似关系;所述词嵌入矩阵包括字符集中各字符的词嵌入向量。
-
公开(公告)号:CN114925813B
公开(公告)日:2024-10-18
申请号:CN202210573722.0
申请日:2022-05-25
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/045 , G06N3/0464 , G06N3/084 , G06V10/774 , G06V10/764 , G06V10/25 , G06V10/82
Abstract: 本说明书实施例提供一种目标检测系统的训练方法,所述目标检测系统包括主干网络和头部网络,所述主干网络包括若干卷积层和若干自注意力层,所述方法包括:将训练图片输入所述目标检测系统,其中,利用所述若干卷积层对所述训练图片进行卷积处理,得到卷积表征;利用所述若干注意力层基于所述卷积表征进行自注意力处理,得到特征图;利用所述头部网络处理所述特征图,得到所述训练图片中目标对象的检测结果;基于所述训练图片对应的对象标注数据以及所述检测结果,确定各个神经网络层各自的梯度范数;针对所述各个神经网络层,根据所述梯度范数的平均数和其自身的梯度范数,更新其网络参数。
-
公开(公告)号:CN118092632A
公开(公告)日:2024-05-28
申请号:CN202211489297.3
申请日:2022-11-25
Applicant: 支付宝(杭州)信息技术有限公司 , 阿里巴巴(中国)有限公司
IPC: G06F3/01 , G06Q30/0601 , G06Q30/0207 , G06N20/00
Abstract: 本说明书实施例提供一种数字人推荐方法和推荐系统。数字人推荐系统包括计算机模拟的数字人,相应的推荐方法包括:获取当前的状态数据,所述状态数据融合有目标用户的用户信息、所在场景的场景信息,以及所述目标用户与所述数字人的交互历史信息;数字人中的智能体,根据强化学习得到的当前策略,将所述状态数据映射为备选动作集中的目标动作,其中所述备选动作集中的备选动作对应于待推荐的内容类别,所述目标动作对应于目标内容类别;所述数字人与所述目标用户进行目标交互,所述目标交互用于推荐所述目标内容类别。从而通过数字人为目标用户进行个性化推荐。
-
公开(公告)号:CN117764038A
公开(公告)日:2024-03-26
申请号:CN202311751326.3
申请日:2023-12-18
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/166 , G06F16/35 , G06N3/0455 , G06N3/0895
Abstract: 本说明书实施例提供一种训练迁移模型的方法,进行文本风格迁移的方法和对应装置。其中迁移模型包括,编码解耦网络,重组网络和解码器。训练过程包括:将第一文本输入编码解耦网络,得到与内容相关的内容表征,以及与风格相关的第一风格表征;其中第一文本具有风格标签。通过重组网络,分别施加风格标签对应的正向风格向量和与之相反的反向风格向量,得到第二风格表征和第三风格表征。然后,将第二风格表征和第三风格表征分别与内容表征组合后进行解码,得到第二文本和第三文本。通过分类器得到第三文本的风格类别的预测结果。从而通过预测损失,更新迁移模型,预测损失包括,第一文本和第二文本之间的重构损失,以及第三文本的分类损失。
-
公开(公告)号:CN116524188A
公开(公告)日:2023-08-01
申请号:CN202310486635.6
申请日:2023-04-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06V10/26 , G06V20/13 , G06V10/764 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N3/08 , G06N3/0455 , G06N3/09 , G06N5/04
Abstract: 公开了一种用于对遥感影像执行语义分割的方法,包括:使用语义分割网络对遥感影像执行语义分割,使用知识推理模块基于遥感领域知识图谱对语义分割结果执行知识推理,以及将知识推理得到的消息作为辅助信息输入至语义分割网络,对遥感影像再次执行语义分割。还公开了用于对遥感影像执行语义分割的系统、装置和介质。
-
公开(公告)号:CN116011547A
公开(公告)日:2023-04-25
申请号:CN202310092429.7
申请日:2023-01-17
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/08 , G06N3/0464 , G06F18/22
Abstract: 本说明书实施例提供了基于残差的深度学习方法及神经网络模型。其中,神经网络模型包括多个网络层,每个网络层包括卷积层、动态残差模块和样本表征调整模块,动态残差模块包括相似度子模块。在深度学习方法中,获取训练样本的初始表征;神经网络模型中的各个网络层按照以下方式执行,直至针对神经网络模型的学习完成:将初始表征以及当前网络层中待处理的第一样本表征输入至当前网络层中的相似度子模块,输出相似度表征;将第一样本表征输入当前网络层中的卷积层,输出第二样本表征;以及将第二样本表征、动态残差以及初始表征输入样本表征调整模块,输出第三样本表征。
-
-
-
-
-
-
-
-
-