-
公开(公告)号:CN117636864A
公开(公告)日:2024-03-01
申请号:CN202211001392.4
申请日:2022-08-19
Applicant: 成都鼎桥通信技术有限公司
Abstract: 本申请提供一种指令语音识别方法、装置、设备及存储介质。该方法包括:获取指令语音经过声学特征提取后的初始指令文本向量;初始指令文本向量包括指令语音对应的指令文本中各孤立文字的初始向量;获取预设指令集对应的目标向量集;目标向量集由预设指令集中各孤立文字在预设字典中对应的词向量组成;采用预设掩码值对初始指令文本向量中不属于目标向量集的初始向量进行掩码操作,以获得目标指令文本向量;将目标指令文本向量转换为目标指令文本,以识别出指令语音对应的目标指令。本申请的方案,提高了指令识别的正确率和效率。
-
公开(公告)号:CN117689684A
公开(公告)日:2024-03-12
申请号:CN202211057793.1
申请日:2022-08-31
Applicant: 成都鼎桥通信技术有限公司
IPC: G06T7/246 , G06V20/40 , G06V40/16 , G06V10/80 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本申请提供一种人脸跟踪方法、装置、设备及存储介质,该方法获取视频流;对视频流进行目标检测处理和特征提取处理,得到视频流中的至少一个目标信息,其中,每个目标信息包括一个目标的身份识别号和目标的特征;根据每个目标的身份识别号和特征,建立跟踪队列和丢失队列;对每个目标进行跟踪,确定每个目标的跟踪情况;根据跟踪情况,对跟踪列表进行更新,得到目标跟踪列表;根据目标跟踪列表,确定推出目标。
-
公开(公告)号:CN116152691A
公开(公告)日:2023-05-23
申请号:CN202111375363.X
申请日:2021-11-19
Applicant: 成都鼎桥通信技术有限公司
Abstract: 本申请提供一种图像检测方法、装置、设备和存储介质,通过获取视频流,视频流中的每一帧图像均包括车牌号码,车牌号码处于车牌检测框中,再根据视频流中的帧顺序,依次对比视频流中第i帧图像和跟踪清单中的候选图像,确定出跟踪清单中与第i帧图像的车牌号码一致的第一候选图像,并将第i帧图像记为第二候选图像,第i帧图像中的车牌号码为目标车牌,跟踪清单中包括至少一个候选图像,i为大于1的整数,之后根据第一候选图像和第二候选图像,确定出目标车牌对应的目标图像,将目标图像作为目标车牌对应的新的第一候选图像,并输出新的第一候选图像。该技术方案从每帧图像的检测出发,实现了更加准确的对车牌图像进行检测。
-
公开(公告)号:CN118865991A
公开(公告)日:2024-10-29
申请号:CN202310471573.1
申请日:2023-04-27
Applicant: 成都鼎桥通信技术有限公司
IPC: G10L21/0208 , G10L21/0224 , G10L21/0232
Abstract: 本申请提供一种语音降噪方法、装置、电子设备和存储介质。该方法包括:获取待降噪语音数据;对待降噪语音数据进行时频变换,得到时频谱;将时频谱和待降噪语音数据的时域振幅信息输入预设语音降噪模型进行处理,得到降噪后的时频谱;对降噪后的时频谱进行反时频变换得到目标语音数据。本申请的方法,改善了语音降噪效果。
-
公开(公告)号:CN116343278A
公开(公告)日:2023-06-27
申请号:CN202111598499.7
申请日:2021-12-24
Applicant: 成都鼎桥通信技术有限公司
Abstract: 本发明实施例提供的一种基于视频图像的人脸跟踪方法、装置、设备及介质。在该方法中,首先筛选出有效检测框,再根据有效检测框和跟踪目标得到空间匹配代价函数矩阵,进而结合匈牙利最大匹配算法进行匹配得到匹配结果。若匹配结果有多组,继续获取人脸特征匹配代价函数矩阵,再次结合匈牙利最大匹配算法进行匹配得到匹配结果。最后根据匹配结果刷新跟踪参数以及更新跟踪队列。本方案通过得到空间匹配代价函数矩阵和人脸特征匹配代价函数矩阵以及利用匈牙利最大匹配算法进行匹配得到匹配结果,有效降低了人脸跟踪的失败率。
-
-
-
-