-
公开(公告)号:CN115482809B
公开(公告)日:2023-08-11
申请号:CN202211137975.X
申请日:2022-09-19
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供一种关键词检索方法、装置、电子设备以及存储介质,涉及语音识别的技术领域,具体涉及语音关键词检索技术领域,可应用于客服业务质检等场景。方案包括:对语音数据进行解码,得到语音数据的文本和解码帧数据,解码帧数据包括文本中每个文字对应的解码帧;针对文本中每个文字,基于该文字的解码帧的时间戳和该文字的相邻文字的解码帧的时间戳,计算该文字的时间信息;对文本进行关键词检索,响应于文本包含有预设的目标关键词,基于目标关键词中的文字的时间信息确定目标关键词的时间信息;生成包含目标关键词和目标关键词的时间信息的检索结果。上述方法在不引入过多的额外模型的基础上,即可准确地获取到目标关键词的时间信息。
-
公开(公告)号:CN113963167B
公开(公告)日:2022-05-27
申请号:CN202111268767.9
申请日:2021-10-29
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/40 , G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本公开提供了应用于目标检测的方法、装置、电子设备、存储介质及计算机程序产品,具体涉及计算机视觉和深度学习技术,可用于目标检测场景下。具体实现方案为:在预设卷积网络的每个模块中添加用于确定不同卷积通道的注意力的第一网络,得到特征提取网络;基于用于聚合不同路径的特征图的第二网络和用于融合不同特征图的第三网络,得到特征处理网络;通过预设训练集训练基于特征提取网络和特征处理网络得到的初始目标检测网络,得到训练后的目标检测网络。本公开提供了一种可适用于移动终端的目标检测网络的具体得到方式,提高了目标检测网络的准确度。
-
公开(公告)号:CN113947144A
公开(公告)日:2022-01-18
申请号:CN202111202517.5
申请日:2021-10-15
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了用于对象检测的方法、装置、设备、介质和程序产品,涉及深度学习领域。具体实现方案为:获取待检测图像;基于待检测图像,经由经训练的、用于对象检测的神经网络模型中的多个特征提取网络,生成多个特征图,其中多个特征提取网络顺序连接,多个特征提取网络中在后的特征提取网络的输入数据基于在前的特征提取网络的输出数据和输入数据;以及基于多个特征图,经由神经网络模型中的对象检测网络,生成对象检测结果。由此,能够实现多尺度特征融合,增强多尺度特征提取能力。
-
公开(公告)号:CN112148960B
公开(公告)日:2024-03-22
申请号:CN201910572735.4
申请日:2019-06-27
Applicant: 北京百度网讯科技有限公司
IPC: G06F16/9535
Abstract: 本发明实施例提出一种关注点的类别确定方法、装置、设备及存储介质,其中方法包括:获取单个用户的预定关注点,并获取所述预定关注点的各个关联关注点;根据所述预定关注点属于预定类别的全局性概率、所述各个关联关注点属于所述预定类别的全局性概率、以及所述预定关注点与所述各个关联关注点的关联程度,确定所述预定关注点属于所述预定类别的个性化概率;其中,所述全局性概率为:在全局用户的行为数据中,所述预定关注点或关联关注点属于所述预定类别的概率;所述个性化概率为:在所述单个用户的行为数据中,所述预定关注点属于所述预定类别的概率。本发明实施例能够针对单个用户确定关注点属于不同类别的概率。
-
公开(公告)号:CN115482809A
公开(公告)日:2022-12-16
申请号:CN202211137975.X
申请日:2022-09-19
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供一种关键词检索方法、装置、电子设备以及存储介质,涉及语音识别的技术领域,具体涉及语音关键词检索技术领域,可应用于客服业务质检等场景。方案包括:对语音数据进行解码,得到语音数据的文本和解码帧数据,解码帧数据包括文本中每个文字对应的解码帧;针对文本中每个文字,基于该文字的解码帧的时间戳和该文字的相邻文字的解码帧的时间戳,计算该文字的时间信息;对文本进行关键词检索,响应于文本包含有预设的目标关键词,基于目标关键词中的文字的时间信息确定目标关键词的时间信息;生成包含目标关键词和目标关键词的时间信息的检索结果。上述方法在不引入过多的额外模型的基础上,即可准确地获取到目标关键词的时间信息。
-
公开(公告)号:CN115132186B
公开(公告)日:2024-12-27
申请号:CN202210893335.5
申请日:2022-07-27
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种端到端语音识别模型训练方法、语音解码方法、装置、电子设备、计算机可读存储介质,涉及语音识别,自然语音处理、深度学习等人工智能技术领域。该方法的一具体实施方式包括:获取多个样本语音文件,并将各样本语音文件打包至样本文件块中,然后,生成该样本文件块的地址信息,接下来,利用数据加载器读取该地址信息,生成批量数据集,最后,基于该批量数据集对初始端到端语音识别模型进行训练,得到端到端语音识别模型。应用该实施方式提供的提升对初始端到端语音识别模型进行训练时的训练效率,提升训练得到的端到端语音识别模型质量。
-
公开(公告)号:CN112541784B
公开(公告)日:2024-04-09
申请号:CN202011420995.9
申请日:2020-12-08
Applicant: 北京百度网讯科技有限公司
IPC: G06Q30/0207
Abstract: 本申请涉及自然语言处理领域和数据识别领域,公开了会员识别方法和装置:通过获取用户处理目标资源的历史权限信息和目标资源对应的会员权限信息,然后将历史权限信息和目标资源对应的会员权限信息进行匹配,判断历史权限信息是否包括会员权限信息,最后响应于确定历史权限信息包括会员权限信息,则识别用户为目标资源的会员,能够基于用户的历史权限信息和目标资源的会员权限信息实现判断用户是否为会员,不需要获取会员的注册隐私数据,根据用户的历史权限信息即可实现识别用户是否为会员,提高了会员识别的准确性和灵活性。
-
-
公开(公告)号:CN113963167A
公开(公告)日:2022-01-21
申请号:CN202111268767.9
申请日:2021-10-29
Applicant: 北京百度网讯科技有限公司
IPC: G06V10/40 , G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本公开提供了应用于目标检测的方法、装置、电子设备、存储介质及计算机程序产品,具体涉及计算机视觉和深度学习技术,可用于目标检测场景下。具体实现方案为:在预设卷积网络的每个模块中添加用于确定不同卷积通道的注意力的第一网络,得到特征提取网络;基于用于聚合不同路径的特征图的第二网络和用于融合不同特征图的第三网络,得到特征处理网络;通过预设训练集训练基于特征提取网络和特征处理网络得到的初始目标检测网络,得到训练后的目标检测网络。本公开提供了一种可适用于移动终端的目标检测网络的具体得到方式,提高了目标检测网络的准确度。
-
公开(公告)号:CN113626707A
公开(公告)日:2021-11-09
申请号:CN202110918608.2
申请日:2021-08-11
Applicant: 北京百度网讯科技有限公司
IPC: G06F16/9535 , G06F16/33
Abstract: 本公开提供了一种兴趣描述信息获得方法、装置、电子设备及存储介质,涉及大数据处理技术领域,尤其涉及信息挖掘技术领域。具体方案为:获得用户的多个行为信息;确定各个行为信息对应的不同层级的兴趣领域,所述兴趣领域包括父级兴趣领域和子级兴趣领域,每一父级兴趣领域包含至少一子级兴趣领域;针对每一父级兴趣领域,利用对应于该父级兴趣领域的行为信息,确定所述用户对该父级兴趣领域下各个子级兴趣领域的兴趣强度,获得所确定的各个兴趣强度的统计结果,作为所述用户对该父级兴趣领域的兴趣描述信息。应用本公开的方案可以提高兴趣描述信息的准确度。
-
-
-
-
-
-
-
-
-