-
公开(公告)号:CN117315313B
公开(公告)日:2024-12-03
申请号:CN202210335746.2
申请日:2022-03-30
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/764 , G06V10/82 , G06V10/42 , G06V10/44 , G06V10/774 , G06N3/045 , G06N3/0464 , G06N3/09
Abstract: 本公开提供了一种多任务识别方法、训练方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及深度学习、图像处理、计算机视觉技术领域,可应用于人脸等场景。具体实现方案为:根据待识别图像,得到第一中间特征数据,其中,第一中间特征数据包括第一辅助特征数据和第一类别特征数据,第一辅助特征数据是用于辅助待识别图像的多任务识别的数据;根据第一辅助特征数据和第一类别特征数据,得到待识别图像的任务概率值和类别概率值;根据待识别图像的任务概率值和类别概率值,得到待识别图像的多任务识别结果。
-
公开(公告)号:CN112149266B
公开(公告)日:2024-09-24
申请号:CN202011149553.5
申请日:2020-10-23
Applicant: 北京百度网讯科技有限公司
IPC: G06F30/18 , G06F30/27 , G06F113/02 , G06F119/20
Abstract: 本申请实施例公开了确定网络模型量化策略的方法、装置、设备以及存储介质,涉及计算机视觉、深度学习等人工智能技术领域,具体可用于图像处理场景。该方法包括:采用针对目标硬件的网络模型的量化策略搜索空间的配置信息,生成量化策略搜索空间;采用量化策略搜索空间,生成量化策略编码生成器;采用量化策略编码生成器,随机生成量化策略编码;对量化策略编码进行解码,得到待选量化策略;根据对应于待选量化策略的网络模型的量化精度损失,确定用于目标硬件的网络模型的目标量化策略,从而提高网络模型在目标硬件上的精度,改善网络模型的适配效果。
-
公开(公告)号:CN118568240A
公开(公告)日:2024-08-30
申请号:CN202410889692.3
申请日:2024-07-03
Applicant: 北京百度网讯科技有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/338 , G06F16/35 , G06F40/216
Abstract: 本公开提供了一种基于大模型的问答信息生成方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于人机交互等场景。具体实现方案为:根据提问文本和与提问文本相关联的图像,生成初始应答文本;确定针对图像的图像内容的第一描述文本;确定针对图像中对象的第二描述文本;以及根据提问文本、第一描述文本和第二描述文本,基于大模型对初始应答文本进行修正,得到目标应答文本。
-
公开(公告)号:CN116611477B
公开(公告)日:2024-05-17
申请号:CN202310638785.4
申请日:2023-05-31
Applicant: 北京百度网讯科技有限公司
IPC: G06N3/0464 , G06N3/0455 , G06N3/082
Abstract: 本公开提供了一种数据剪枝方法和序列模型的训练方法、装置、设备和介质,涉及人工智能领域,具体涉及计算机视觉、自然语言处理和深度学习等技术领域,可应用于图像分类、OCR、文本抽取和问答系统等场景。数据剪枝方法包括:获取针对目标计算单元的输入标记序列;输入标记序列中的每个标记指示多媒体数据中一个数据单元的特征;根据设置于目标计算单元之前的注意力单元生成的注意力矩阵,对输入标记序列进行剪枝处理,得到剪枝后标记序列和被剪枝标记;将剪枝后标记序列输入目标计算单元,得到目标计算单元输出的计算后标记序列;以及组合计算后标记序列和被剪枝标记,得到设置于目标计算单元之后的在后计算单元的输入数据。
-
公开(公告)号:CN115482395B
公开(公告)日:2024-02-20
申请号:CN202211219250.5
申请日:2022-09-30
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06N20/00
Abstract: 本公开提供了一种深度学习模型的训练方法,涉及人工智能技术领域,尤其涉及深度学习、图像处理、计算机视觉等技术领域,可应用于人脸识别场景下。具体实现方案为:根据样本图像的第一特征和第一深度学习模型的第一分类网络的权重信息,确定注意力特征,其中,第一特征是利用第一深度学习模型的第一特征提取网络处理样本图像得到的;将注意力特征输入第一分类网络,得到注意力增强后的分类结果;以及根据注意力增强后的分类结果,训练第二深度学习模型。本公开还提供了一种深度学习模型的训练方法、图像分类方法、装置、电子设备和存储介质。
-
公开(公告)号:CN111783951B
公开(公告)日:2024-02-20
申请号:CN202010606935.X
申请日:2020-06-29
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/82 , G06V10/764 , G06N3/045 , G06N3/084
Abstract: 本申请公开了基于超网络的模型获取方法、装置、设备及存储介质,涉及深度学习、计算机视觉和图像处理。具体实现方案为:获取至少两个超网络,至少两个超网络对应的网络结构相同,至少两个超网络的参数不同;基于至少两个超网络的参数,训练目标子网络,得到损失函数,目标子网络为随机从网络结构的搜索空间中选择的子网络;根据损失函数,更新至少两个超网络的参数;根据更新后的至少两个超网络,确定目标模型。在基于超网络的模型获取过程中通过自监督对超网络的参数的反向传播,来提升目标模型的性能,使得目标模型的精度较高,且处理图像的速度较快;进一步地,目标模型在硬件上的处理速度快就能使用较便宜的芯片,从而节省部署成本。
-
公开(公告)号:CN111563592B
公开(公告)日:2023-12-15
申请号:CN202010383358.2
申请日:2020-05-08
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请涉及人工智能领域,公开了基于超网络的神经网络模型生成方法和装置。该方法包括:获取经过训练的候选超网络集合;从各候选超网络中分别采样出多个子网络,获取从各候选超网络中采样出的子网络的性能;对每一个候选超网络,对从候选超网络中采样出的子网络的性能进行排序,作为子网络对应的神经网络模型结构在候选超网络中的性能排序;基于各子网络对应的神经网络模型结构在候选超网络中的性能排序,确定各子网络对应的神经网络模型结构的综合性能排序;根据各子网络对应的神经网络模型结构的综合性能排序,确定出至少一个子网络对应的神经网络模型结构作为目标神经网络模型的结构。该方法实现了目标神经网络模型结构的优化。
-
公开(公告)号:CN114898266B
公开(公告)日:2023-12-08
申请号:CN202210526829.X
申请日:2022-05-12
Applicant: 北京百度网讯科技有限公司
IPC: G06V20/40 , G06N3/0464 , G06N3/084 , G06V10/74 , G06V10/762 , G06V10/82
Abstract: 本公开提供了一种训练方法、图像处理方法、装置、电子设备以及存储介质,涉及人工智能技术领域,尤其涉及深度学习、图像处理、计算机视觉技术领域,可应用于OCR、人脸等识别场景。具体实现方案为:从第一视频序列中确定目标对象的第一对象图像;根据第一对象图像,确定目标对象的第一样本图像对;基于对比损失函数和第一样本图像对训练深度学习模型,得到预训练模型。
-
公开(公告)号:CN111582452B
公开(公告)日:2023-10-27
申请号:CN202010387565.5
申请日:2020-05-09
Applicant: 北京百度网讯科技有限公司
IPC: G06N3/0464 , G06N3/08
Abstract: 本申请涉及人工智能领域,公开了生成神经网络模型的方法和装置。该方法包括:基于目标神经网络模型的结构构建超网络,超网络的各层包括分别与目标神经网络模型的各层对应的候选结构单元集合,且候选结构单元集合包括目标神经网络模型的结构中对应层的网络结构单元以及至少一个与目标神经网络模型的结构中对应层的网络结构单元相似的候选结构单元;初始化超网络,并基于预设域的样本数据和超网络各层对应的候选结构单元集合训练超网络;将训练完成的超网络中与目标神经网络模型对应的目标子网络的参数同步至目标神经网络模型。该方法实现了目标神经网络模型的优化。
-
公开(公告)号:CN111340220B
公开(公告)日:2023-10-20
申请号:CN202010116709.3
申请日:2020-02-25
Applicant: 北京百度网讯科技有限公司
IPC: G06N3/0985 , G06N3/084 , G06N3/044 , G06N3/045 , G06N3/0464
Abstract: 本公开涉及人工智能领域。本公开的实施例公开了用于训练预测模型的方法和装置。该预测模型用于预测神经网络结构的性能,该方法包括通过采样操作训练预测模型;采样操作包括:从已训练完成的超网络中采样出子网络,并对采样出的子网络进行训练,得到训练完成的子网络的性能信息;基于训练完成的子网络和对应的性能信息构建样本数据,并利用样本数据训练预测模型;响应于确定当前采样操作中训练得到的预测模型的精度不满足预设的条件,执行下一次采样操作,并在下一次采样操作中增加采样的子网络的数量。该方法可以降低神经网络模型结构的搜索成本。
-
-
-
-
-
-
-
-
-