半监督语义分割模型训练方法、识别方法和装置

    公开(公告)号:CN111898613B

    公开(公告)日:2020-12-25

    申请号:CN202011054144.7

    申请日:2020-09-30

    Abstract: 本说明书实施例提供了半监督语义分割模型训练方法、识别方法和装置,根据实施例的半监督语义分割模型训练方法,首先通过获取人工对第一图像中的待标注对象进行标注后得到的第一监督数据,进而通过第一监督数据训练得到对待标注对象的识别率相对较高的全监督语义分割模型。利用全监督语义分割模型对未经过人工标注的第二图像中的待标注对象进行标注,得到第二监督数据。再利用经过人工标注得到的第一监督数据和经过全监督语义分割模型标注得到的第二监督数据训练半监督语义分割模型,并利用半监督语义分割模型对第一图像、第二图像和随机扰动项进行识别,得到第三监督数据。最后通过第一、第二和第三监督数据对半监督语义分割模型再次训练。

    机器阅读理解中的数值推理方法和装置

    公开(公告)号:CN111737419A

    公开(公告)日:2020-10-02

    申请号:CN202010759810.0

    申请日:2020-07-31

    Abstract: 本说明书实施例提供一种机器阅读理解中的数值推理方法和装置。方法包括:获取当前问题和当前文本;确定当前问题和当前文本中包括的各实体和各数字,以及各数字分别对应的类型;构建关系网络图,包括对应于各实体的实体节点,和对应于各数字的数字节点,在相同类型的数字节点之间,以及具有预设关系的实体节点和数字节点之间,通过连接边形成邻居;确定当前问题对应的第一问题表征向量,以及关系网络图中各节点的初始表征向量;基于各节点的初始表征向量,对所述关系网络图中的各节点进行预定次数的迭代,以得到各节点的更新表征向量。能够提高机器阅读理解中的数值推理处理复杂问题的能力。

    一种文本内容修正的方法和系统

    公开(公告)号:CN111291552B

    公开(公告)日:2020-08-14

    申请号:CN202010384219.1

    申请日:2020-05-09

    Abstract: 本说明书实施例公开了一种文本内容修正的方法及系统。所述方法包括:获取待检测文本;生成所述待检测文本中各个字符对应的语义向量;对于每个所述语义向量,确定该语义向量在修正矩阵中对应的修正向量,进而将所述修正向量对应的字符作为修正后的字符;所述修正矩阵包括所述字符集中各字符的修正向量,其基于词嵌入矩阵和混淆特征矩阵生成;所述混淆特征矩阵基于所述词嵌入矩阵和混淆关系图,通过混淆模型获得;所述混淆关系图表示字符之间的符号近似关系;所述词嵌入矩阵包括字符集中各字符的词嵌入向量。

    目标检测系统的训练方法及装置

    公开(公告)号:CN114925813B

    公开(公告)日:2024-10-18

    申请号:CN202210573722.0

    申请日:2022-05-25

    Abstract: 本说明书实施例提供一种目标检测系统的训练方法,所述目标检测系统包括主干网络和头部网络,所述主干网络包括若干卷积层和若干自注意力层,所述方法包括:将训练图片输入所述目标检测系统,其中,利用所述若干卷积层对所述训练图片进行卷积处理,得到卷积表征;利用所述若干注意力层基于所述卷积表征进行自注意力处理,得到特征图;利用所述头部网络处理所述特征图,得到所述训练图片中目标对象的检测结果;基于所述训练图片对应的对象标注数据以及所述检测结果,确定各个神经网络层各自的梯度范数;针对所述各个神经网络层,根据所述梯度范数的平均数和其自身的梯度范数,更新其网络参数。

    训练迁移模型,文本风格迁移的方法和装置

    公开(公告)号:CN117764038A

    公开(公告)日:2024-03-26

    申请号:CN202311751326.3

    申请日:2023-12-18

    Abstract: 本说明书实施例提供一种训练迁移模型的方法,进行文本风格迁移的方法和对应装置。其中迁移模型包括,编码解耦网络,重组网络和解码器。训练过程包括:将第一文本输入编码解耦网络,得到与内容相关的内容表征,以及与风格相关的第一风格表征;其中第一文本具有风格标签。通过重组网络,分别施加风格标签对应的正向风格向量和与之相反的反向风格向量,得到第二风格表征和第三风格表征。然后,将第二风格表征和第三风格表征分别与内容表征组合后进行解码,得到第二文本和第三文本。通过分类器得到第三文本的风格类别的预测结果。从而通过预测损失,更新迁移模型,预测损失包括,第一文本和第二文本之间的重构损失,以及第三文本的分类损失。

    基于残差的深度学习方法及神经网络模型

    公开(公告)号:CN116011547A

    公开(公告)日:2023-04-25

    申请号:CN202310092429.7

    申请日:2023-01-17

    Abstract: 本说明书实施例提供了基于残差的深度学习方法及神经网络模型。其中,神经网络模型包括多个网络层,每个网络层包括卷积层、动态残差模块和样本表征调整模块,动态残差模块包括相似度子模块。在深度学习方法中,获取训练样本的初始表征;神经网络模型中的各个网络层按照以下方式执行,直至针对神经网络模型的学习完成:将初始表征以及当前网络层中待处理的第一样本表征输入至当前网络层中的相似度子模块,输出相似度表征;将第一样本表征输入当前网络层中的卷积层,输出第二样本表征;以及将第二样本表征、动态残差以及初始表征输入样本表征调整模块,输出第三样本表征。

Patent Agency Ranking