-
公开(公告)号:CN119206397A
公开(公告)日:2024-12-27
申请号:CN202411335740.0
申请日:2024-09-24
Applicant: 中国移动通信集团浙江有限公司 , 中国移动通信集团有限公司 , 中国移动(浙江)创新研究院有限公司 , 浙江移动信息系统集成有限公司
IPC: G06V10/774 , G06V10/772 , G06V10/80 , G06V10/82 , G06V10/74 , G06N3/045 , G06N3/08 , G06N3/0895
Abstract: 本申请涉及人工智能技术领域,提供一种模型训练方法、装置、设备、存储介质及程序产品。方法包括:将样本图像输入至图像编码模块,获得图像特征;将样本文本输入至文本编码模块,获得文本特征;从预构建的融合提示向量词典中获取样本文本对应的融合提示向量,并将融合提示向量和文本特征输入至向量替换模块,获得混合文本特征;将图像特征和混合文本特征输入至检测器模块,训练视觉提示开集检测模型。通过上述方式,可避免模型出现过拟合或者评估失真的情况,提高视觉提示开集检测模型的泛化性能,降低模型训练开销。
-
公开(公告)号:CN119445205A
公开(公告)日:2025-02-14
申请号:CN202411443367.0
申请日:2024-10-16
Applicant: 中国移动通信集团浙江有限公司 , 中国移动通信集团有限公司 , 中国移动(浙江)创新研究院有限公司 , 浙江移动信息系统集成有限公司
IPC: G06V10/764 , G06V10/40 , G06V10/774
Abstract: 本发明提供一种目标检测方法、装置、设备、存储介质和计算机程序产品,涉及人工智能技术领域,该方法包括:获取待检测文本和待检测图像;将待检测文本和待检测图像输入开集目标检测模型,得到开集目标检测模型输出的检测结果;其中,开集目标检测模型包括图像信息与文本信息的混合模块,混合模块包括多层多头自注意力机制和多层基于类别引导的多头交叉注意力机制,混合模块用于对第一图像类别特征向量与待检测文本的文本特征进行增强,得到第一强化文本特征。本发明通过在开集目标检测模型中引入混合模块,将图像类别特征向量与文本特征相结合,使文本特征带有图像语义信息,从而减少语义歧义带来的影响,提高模型的零样本和少样本推理能力。
-
公开(公告)号:CN119026663A
公开(公告)日:2024-11-26
申请号:CN202411107391.7
申请日:2024-08-13
Applicant: 中国移动通信集团浙江有限公司 , 中国移动通信集团有限公司 , 中国移动(浙江)创新研究院有限公司 , 浙江移动信息系统集成有限公司
IPC: G06N3/082
Abstract: 本发明提供一种单次网络剪枝方法、装置、设备、介质及产品,方法包括:获取单个网络层中权重矩阵对应的剪枝掩码矩阵;将权重矩阵中第一列确定为当前剪枝列;基于剪枝掩码矩阵,对当前剪枝列的权重进行修剪;基于当前剪枝列中已修剪的权重,确定权重矩阵中待更新列的待更新权重;基于海森矩阵的逆矩阵,对待更新权重进行更新;将当前剪枝列的下一列确定为当前剪枝列,并迭代执行权重修剪和权重更新的步骤,直至当前剪枝列为倒数第二列;基于剪枝掩码矩阵,对权重矩阵中最后一列的权重进行修剪,以获得网络层剪枝后的权重矩阵。本发明提供的单次网络剪枝方法,降低了算法的计算复杂度,从而减少计算资源和时间的成本,有效提高单次网络剪枝的效率。
-
公开(公告)号:CN118823380A
公开(公告)日:2024-10-22
申请号:CN202410783011.5
申请日:2024-06-18
Applicant: 中国移动通信集团浙江有限公司 , 中国移动通信集团有限公司 , 中国移动(浙江)创新研究院有限公司 , 浙江移动信息系统集成有限公司
IPC: G06V10/46 , G06V40/10 , G06N3/0442 , G06V10/82 , G06N3/08 , G06N3/0464
Abstract: 本发明提供一种人体关键点检测方法、装置、电子设备及存储介质,涉及人工智能技术领域,该方法通过关键点检测模型中的主干网络,提取待检测图像中的人体区域特征,滤除待检测图像中的背景信息,为后续操作提供准确的数据。通过特征提取网络中的门注意力单元,利用人体区域特征,提取到待检测图像中的细化关键点表示,为关键点位置检测网络对人体关键点位置信息的准确预测提供依据,保证人体关键点位置信息的准确性。采用的门注意力单元中应用较少的卷积模块,可以降低关键点检测模型的结构参数量,进而提升关键点检测模型的预测效率,有助于实现人体关键点位置信息的快速实时检测。人体关键点位置信息可用于运动评估、姿态检测等下游任务使用。
-
公开(公告)号:CN118866008A
公开(公告)日:2024-10-29
申请号:CN202410936570.5
申请日:2024-07-12
Applicant: 中国移动通信集团浙江有限公司 , 中国移动通信集团有限公司 , 中国移动(浙江)创新研究院有限公司 , 浙江移动信息系统集成有限公司
Abstract: 本申请涉及计算机领域,提供一种异常语音识别方法、装置、设备、介质及产品。该方法包括:基于调优后的自动语音识别模型将待识别语音转换为文本;在文本的文本困惑度大于预设阈值时,基于文本修正模型对文本进行修正得到修正文本;将修正文本输入至异常语义识别模型中,得到待识别语音的识别结果;识别结果包括待识别语音是否异常和/或待识别语音的异常类型;自动语音识别模型是基于在异常文本中确定的异常词汇进行调优的。本申请通过调优后的自动语音识别模型进行文本转换,提高了文本转换的准确度;通过将低质量文本进行修正后再输入异常语义识别模型中,可以使异常语义识别模型更易识别异常文本,提高了异常语音识别的准确度。
-
公开(公告)号:CN118798134A
公开(公告)日:2024-10-18
申请号:CN202410409906.2
申请日:2024-04-07
Applicant: 中国移动通信集团浙江有限公司 , 中国移动通信集团有限公司 , 中国移动(浙江)创新研究院有限公司 , 浙江移动信息系统集成有限公司
IPC: G06F40/16 , G06F40/284 , G06N20/00 , G06F16/38
Abstract: 本申请公开了一种内容生成方法、装置、电子设备和可读存储介质,属于计算机领域。包括:获取目标文本,目标文本包括用于指示内容生成的关键词;向人工智能生成内容模型输入目标文本;通过人工智能生成内容模型得到与目标文本相匹配的目标生成内容;其中,在通过人工智能生成内容模型得到目标生成内容的过程中,人工智能生成内容模型基于第一向量和第二向量,生成目标结果,目标结果用于得到目标生成内容;第一向量为人工智能生成内容模型基于所述目标文本生成的向量,第二向量为从向量数据库中获取的与目标文本相关联的向量,向量数据库获取所述第二向量的时间比获取用于训练人工智能生成内容模型的历史数据的时间更晚。
-
公开(公告)号:CN118708339A
公开(公告)日:2024-09-27
申请号:CN202410766522.6
申请日:2024-06-14
Applicant: 中国移动通信集团浙江有限公司 , 中国移动通信集团有限公司 , 中国移动(浙江)创新研究院有限公司 , 浙江移动信息系统集成有限公司
Abstract: 本发明提供一种多模态语言模型的部署方法、装置、设备、介质和产品,属于人工智能技术领域,该方法包括:对编码器簇集合中的任一编码器簇、映射器簇集合中的任一映射器簇以及生成式语言模型集合中的任一生成式语言模型进行动态组合;对于任一多模态推理任务,从所有组合中选择任一符合需求约束的组合构成多模态语言模型,对多模态语言模型进行部署,以执行多模态推理任务。本发明通过编码器簇、映射器簇和生成式语言模型的动态组合构建多模态语言模型执行多模态推理任务,且编码器簇之间可复用部分编码器,映射器簇之间可复用部分映射器,使得各个计算性能高的模块被充分复用,以节约计算性能高的模块所占用的冗余算力、内存等资源。
-
公开(公告)号:CN118860657A
公开(公告)日:2024-10-29
申请号:CN202411039357.0
申请日:2024-07-31
Applicant: 中国移动通信集团浙江有限公司 , 中国移动通信集团有限公司 , 中国移动(浙江)创新研究院有限公司 , 浙江移动信息系统集成有限公司
IPC: G06F9/50 , G06F9/48 , G06F18/2321
Abstract: 本申请涉及计算机领域,提供一种任务分解方法、装置、设备、介质及产品。其中方法包括:获取待分解任务的各个任务元;基于各个任务元的自身属性和各个任务元之间的相关性确定各个任务元之间的初始截断距离;基于最小化基尼指数的自适应截断距离选择机制对初始截断距离进行优化,得到优化结果;基于优化结果将待分解任务拆解为各个子任务。本申请通过将各个任务元的自身属性和各个任务元之间的相关性转变成任务元间的距离关系,通过最小化基尼指数将密度峰值聚类算法进行改进,可以将待分解任务拆分为合适粒度的子任务,提高了任务分解效率和分解准确度,提高了任务处理效率。
-
公开(公告)号:CN118799010A
公开(公告)日:2024-10-18
申请号:CN202311345742.3
申请日:2023-10-17
Applicant: 中国移动通信集团浙江有限公司 , 中国移动通信集团有限公司 , 中国移动(浙江)创新研究院有限公司 , 浙江移动信息系统集成有限公司
IPC: G06Q30/0601 , G06F16/735 , G06F16/75 , G06F16/783 , G06F18/2415 , G06N3/0442
Abstract: 本发明提供一种视频推荐营销方法、装置、电子设备及存储介质,涉及计算机技术领域,该方法包括:基于多个用户的用户数据,构建各用户对应的用户画像;用户画像包括多种维度的属性标签;针对每个用户,基于多种维度的属性标签和至少两个业务目标需求,确定各业务目标需求对应的用户特征向量;将各用户特征向量输入至需求预测模型,得到需求预测模型输出的各业务目标需求对应的概率值;需求预测模型是基于样本用户特征向量进行训练得到的;概率值表示用户满足业务目标需求的概率;基于各概率值,对用户进行视频推荐营销。通过构建包括多种维度的属性标签的用户画像,使得用户画像更加丰富完整,提升视频营销的成功率。
-
公开(公告)号:CN118798298A
公开(公告)日:2024-10-18
申请号:CN202410293153.3
申请日:2024-03-14
Applicant: 中国移动通信集团浙江有限公司 , 中国移动通信集团有限公司 , 中国移动(浙江)创新研究院有限公司 , 浙江移动信息系统集成有限公司
Abstract: 本申请涉及人工智能技术领域,提供一种模型的缩放因子确定方法、装置、设备、产品及存储介质。方法包括:基于模型的初始缩放因子和模型的损失值,确定扩大梯度;基于扩大梯度的反向传播结果,迭代更新初始缩放参数的上限值和下限值;基于最终更新后的上限值和下限值,确定模型的缩放因子。本申请根据扩大梯度的反向传播结果,迭代更新初始缩放参数的上限值和下限值,减少了确定缩放参数的上限值和下限值的模型迭代次数,简化了确定缩放参数的上限值和下限值的流程;根据更新后的上限值和更新后的下限值,确定缩放因子,提高了确定缩放因子的准确性,根据扩大梯度的反向传播结果,确定缩放因子,减少了确定缩放因子的迭代次数,提高了确定缩放因子的效率。
-
-
-
-
-
-
-
-
-