语句生成方法、装置及存储介质
    11.
    发明公开

    公开(公告)号:CN117291181A

    公开(公告)日:2023-12-26

    申请号:CN202210693429.8

    申请日:2022-06-17

    Abstract: 本申请实施例公开了一种语句生成方法、装置及存储介质,属于人工智能技术领域。在本申请实施例中,在通过第一语句生成模型生成参考语句的多个第一候选相似语句后,可以基于用户对至少一个第一候选相似语句的修改操作来获得至少一个第二候选相似语句,进而利用该至少一个第二候选相似语句来对第一语句生成模型进行更新。也即,本申请实施例可以通过用户修改后的候选相似语句来实时优化语句生成模型,在此基础上,基于优化后的语句生成模型和参考语句能够生成更多高质量的相似语句,从而实现对语料库的有效扩充。

    一种语料标注方法、装置及相关设备

    公开(公告)号:CN115249018A

    公开(公告)日:2022-10-28

    申请号:CN202111582918.8

    申请日:2021-12-22

    Abstract: 本申请提供了一种语料标注方法,语料标注装置获取用户通过客户端提供的语料集合,该语料集合包括用户期望被标注的多种语义类别的语料,并确定语料集合中属于目标语义类别的人工标注语料以及自动标注语料,并获取针对该人工标注语料的人工标注结果,从而根据该人工标注语料的人工标注结果,对自动标注语料进行自动标注,该人工标注结果以及自动标注语料对应的自动标注结果用于作为训练数据对推理模型进行训练。如此,通过对部分语料进行自动标注,可以提高生成标注语料的效率、降低人力成本,同时,领域专家可以仅需对每一语义类别下的少量语料进行人工标注,从而可以减少人工标注的语料数量。此外,本申请还提供了对应的装置及相关设备。

    远程监督命名实体识别数据的降噪方法及装置

    公开(公告)号:CN114757190A

    公开(公告)日:2022-07-15

    申请号:CN202011564259.0

    申请日:2020-12-25

    Abstract: 本申请实施例提供一种远程监督命名实体识别数据的降噪方法及装置,涉及自然语言处理领域,能够提升降噪性能。该方法包括:获取多个标注语料集以及该多个标注语料集各自的总体噪声率,一个标注语料集包含多个标注语料,该多个标注语料是对多个语料进行命名实体标注得到的结果;然后将该多个标注语料集作为训练集,基于该多个标注语料集各自的总体噪声率,训练得到目标神经网络模型;并基于目标神经网络模型,确定第一标注语料集包含的多个标注语料的置信度;以及根据第一标注语料集包含的多个标注语料的置信度以及第一标注语料集的总体噪声率,确定第一标注语料集中的噪声语料,并且删除第一标注语料集中的噪声语料。

    模型训练的方法、装置以及计算设备

    公开(公告)号:CN119692417A

    公开(公告)日:2025-03-25

    申请号:CN202311607988.3

    申请日:2023-11-27

    Abstract: 本申请提供了一种模型训练的方法、装置以及计算设备,该方法包括:接收用户输入的第一模型的配置参数的多个取值,该第一模型的配置参数包括该第一模型的训练参数和/或模型参数;根据第二模型预测得到该配置参数的多个取值分别对应的该第一模型的多个训练指标数据,该第一模型的训练指标数据包括该第一模型的训练过程数据和/或服务器训练该第一模型所消耗的硬件指标数据;从第一模型的多个训练指标数据中确定目标训练指标数据,并将该配置参数的多个取值中与该目标训练指标数据对应的目标取值发送给该用户;接收该用户确认的该目标取值,并基于该目标取值对该第一模型进行训练。该方法可以提高模型的训练速度和训练效率。

    一种数字人绑定评估方法
    15.
    发明公开

    公开(公告)号:CN119068158A

    公开(公告)日:2024-12-03

    申请号:CN202311218488.0

    申请日:2023-09-20

    Abstract: 一种数字人绑定评估方法,涉及计算机视觉技术领域。方法包括获取待测数字人模型和标准数字人模型,待测数字人模型描述有通过目标绑定方法对骨骼和/或表情基绑定的不同点位,标准数字人模型用于表征绑定效果评估标准;通过目标驱动方式,分别驱动待测数字人模型和标准数字人模型,得到待测驱后数据和标准驱后数据,待测驱后数据用于表征待测数字人被驱动所形成的动画,标准驱后数据用于表征标准数字人模型被驱动所形成的动画;对待测驱后数据与标准驱后数据进行相似度评估,得到评估数据,以通过评估数据表征目标绑定方法对待测数字人模型的绑定效果。这样,可以实现客观、统一的数字人绑定效果评估。

    数字人视频的生成方法、装置、设备及存储介质

    公开(公告)号:CN118870137A

    公开(公告)日:2024-10-29

    申请号:CN202310429308.7

    申请日:2023-04-20

    Abstract: 本申请公开了一种数字人视频的生成方法、装置、设备及存储介质,属于人工智能技术领域。该方法包括:获取数字人对应的单张对象图像,响应于针对对象图像中对象属性的调整指令,生成用于展示对象属性调整后数字人状态的数字人图像资源,数字人图像资源包括至少一张数字人图像;用音频驱动数字人图像资源中的数字人做出与音频内容匹配的口型,以生成以对象属性调整后的状态表达音频内容的数字人视频。本申请提供了一种支持灵活编辑对象属性的数字人视频生成流程,基于输入的单张对象图像,无需更多操作,即可根据用户需求来调整数字人呈现的对象属性,生成自然、真实性强的数字人视频,提升用户体验,降低生成过程中提高真实性所需的操作成本。

    一种虚拟形象的管理方法及相关系统

    公开(公告)号:CN118521684A

    公开(公告)日:2024-08-20

    申请号:CN202310486823.9

    申请日:2023-04-28

    Abstract: 本申请提供了一种虚拟形象的管理方法,应用于人工智能(AI)技术领域,由虚拟形象的管理系统执行,该系统用于生成虚拟形象,虚拟形象为具有表情或动作的对象生物体的图像化表示,该方法包括:接收用户配置的包括第一对象的纹理信息的虚拟形象模板,获取用于驱动所述虚拟形象模板的视频数据和音频数据,从视频数据中提取第二对象的面部特征或动作特征,从音频数据中提取第二对象的面部特征或动作特征,将视频数据中提取的面部特征或动作特征以及音频数据中的提取的面部特征或动作特征映射至虚拟形象模板,获得所述虚拟形象。如此可以实现自然、真实地生成数字人等虚拟形象,提升生成效果,能够满足业务需求。

    唇语识别方法和装置、模型的训练方法和装置

    公开(公告)号:CN117351555A

    公开(公告)日:2024-01-05

    申请号:CN202210751554.X

    申请日:2022-06-28

    Abstract: 本申请实现方式公开了一种唇语识别方法,包括:获取待识别的多人说话视频;将多人说话视频输入至预设的目标唇语识别模型,由目标唇语识别模型提取多人说话视频的每帧图像中各人员的人脸图像,并根据人脸图像,得到每帧图像中各人员作为说话人的可能性信息,以及根据可能性信息,从每帧图像中筛选出目标说话人,并提取目标说话人的唇部图像,根据唇部图像,得到目标说话人的说话内容。如此,可以先识别出多人说话场景中潜在的真正的目标说话人,然后只需要对真正的目标说话人的唇语进行识别,即可以实现对多人说话视频中的说话人以及对应说话内容的准确识别。本申请实现方式还公开了一种唇语识别装置、唇语识别模型的训练方法和装置。

    虚拟人视频生成方法和装置
    19.
    发明公开

    公开(公告)号:CN117011401A

    公开(公告)日:2023-11-07

    申请号:CN202210457342.0

    申请日:2022-04-27

    Abstract: 本申请公开了一种虚拟人视频生成方法和装置,该方法包括:获取驱动文本;基于驱动文本和第一视频的动作标注,获取与驱动文本对应的动作类型,其中,动作标注中包括第一视频中的人物的多个动作类型;基于动作类型,从第一视频中提取出与驱动文本对应的动作表示;基于动作表示,生成虚拟人视频。通过本申请,可以自动生成人物动作准确、可控并符合预设动作规范的虚拟人视频,且可以通过调整动作规范来实现虚拟人动作的个性化定制。

    视频时刻检索模型的训练方法、装置、设备及存储介质

    公开(公告)号:CN115481279A

    公开(公告)日:2022-12-16

    申请号:CN202110594901.8

    申请日:2021-05-28

    Abstract: 本申请公开了一种视频时刻检索模型的训练方法、装置、设备及存储介质,属于人工智能技术领域。该方法通过第一视频时刻检索模型得到样本数据的预测置信信息和预测视频帧边界后,获取该样本数据的平滑标签,该平滑标签能够模糊参考视频帧边界,减少噪声对模型训练的影响,通过样本数据的平滑标签、预测置信信息、预测视频帧边界和对应的参考视频帧边界,获取该样本视频的第一损失,并基于第一损失符合条件的样本视频,训练第二视频时刻检索模型,避免在训练过程中出现同一个模型的误差累积现象,进一步提升模型训练效果,因此,本申请提出的方法能够减少噪声对模型训练的不利影响,同时提升模型训练效果,从而有效提高视频时刻检索模型的准确率。

Patent Agency Ranking