-
公开(公告)号:CN116863951A
公开(公告)日:2023-10-10
申请号:CN202311055231.8
申请日:2023-08-21
Applicant: 上海富瀚微电子股份有限公司
Abstract: 本发明公开了一种声源定位及语音增强方法、装置,属于音频信号处理技术领域,该声源定位方法,包括以下步骤:对多个麦克风进行两两配对,根据麦克风对的位置、所需的定位精度获得至少部分的所述麦克风对中两个麦克风之间的频域相位补偿斜率张量;基于所述频域相位补偿斜率张量计算至少部分的所述麦克风对的频域互相关系数;使用分位数法扫描待拾取的空间范围,将各所述频域互相关系数之和最大的位置记为目标位置。通过设置相应的增益因子和补偿因子作用在求和结果和差分结果上,从而分别解决低频指向性差和环境噪声的问题,且可以灵活选择麦克风对的组合,提升定位效果和语音增强效果。
-
公开(公告)号:CN116600122A
公开(公告)日:2023-08-15
申请号:CN202310671467.8
申请日:2023-06-07
Applicant: 上海富瀚微电子股份有限公司
IPC: H04N19/147 , H04N19/124 , H04N19/176 , H04N19/19
Abstract: 本发明提供一种码率控制方法,包括:获取待编码视频帧,基于指数型率失真模型进行当前视频帧的比特数分配,计算当前视频帧的拉格朗日参数;将当前视频帧划分为N个编码块,预测当前视频帧内每个编码块的比特数所占权重值;根据权重值计算每个编码块的压缩码率;计算每个编码块的拉格朗日参数;每个编码块的拉格朗日参数是关于各自编码块的压缩码率的指数型函数;计算每个编码块量化过程中所需要的量化参数,从而实现在编码过程中完成码率控制;重复上述步骤完成下一个视频帧的编码过程。本发明的码率控制方法,通过引进拉格朗日参数λ这个中间变量,R‑λ模型和λ‑QP模型同源,均源于指数型率失真模型,该模型在码率控制上更加平稳,主观质量更优。
-
公开(公告)号:CN116311418A
公开(公告)日:2023-06-23
申请号:CN202211729604.0
申请日:2022-12-30
Applicant: 上海富瀚微电子股份有限公司
IPC: G06V40/16 , G06V10/774 , G06V10/82
Abstract: 本发明提供了一种轻量化多任务人脸属性训练方法,该方法包括:获取人脸属性数据集,并对所述人脸属性数据集进行预处理;建立人脸属性识别主干网络,并通过所述人脸属性识别主干网络对预处理后的人脸属性数据集进行处理,以提取各个人脸属性特征;根据各个所述人脸属性特征建立对应的人脸属性分支模型和对应的loss函数;训练各人脸属性分支模型,并根据各loss函数输出结果监控各人脸属性分支模型的学习情况。本发明能够充分运用开源数据集,无需复杂模型和大量的标注工作即可快速获取较为准确的人脸属性识别结果。
-
公开(公告)号:CN116189290A
公开(公告)日:2023-05-30
申请号:CN202211735182.8
申请日:2022-12-30
Applicant: 上海富瀚微电子股份有限公司
Abstract: 本发明提供了一种挥手检测方法及装置,对包含连续多帧待测图像的实时视频序列进行逐帧处理,用人形检测框将所述待测图像中的若干个人像分别框选出来;将前后帧待测图像中的人形检测框进行匹配,使前后帧待测图像中用于表示相同人像的人形检测框相互对应;获取所述人形检测框中的多个人体关键点,所述人体关键点用于表征人像的姿态;以及,在连续的设定帧数内的所述待测图像中,根据所选取的人形检测框中人体关键点的位置变化情况判断相应的人像是否存在挥手运动。本发明通过将同一人像在连续多帧待测图像中对应的多个人形检测框对应起来,实现了实时视频序列中持续性地多人挥手检测,提高了检测灵敏度,同时降低了误检率。
-
公开(公告)号:CN115862652A
公开(公告)日:2023-03-28
申请号:CN202211485063.1
申请日:2022-11-24
Applicant: 上海富瀚微电子股份有限公司
IPC: G10L21/0208 , G10L21/0216 , G10K11/178
Abstract: 本发明公开了一种频域幅值自适应滤波器设计方法及装置、电子设备,该方法包括:对时域参考信号与麦克风信号进行时频分析,得到各自的频域幅值;基于参考信号频域幅值与滤波器得到回声频域幅值初步估计信号,并获得残差信号;利用残差信号与参考信号对滤波器系数进行更新,得到本帧滤波器最优解;基于本帧滤波器最优解与参考信号重新进行回声估计,得到回声频域幅值二次估计;基于回声频域幅值二次估计和麦克风信号频域幅值得到维纳滤波系数,根据获得的维纳滤波系数对麦克风信号滤波得到自适应滤波输出信号。
-
公开(公告)号:CN115550650A
公开(公告)日:2022-12-30
申请号:CN202211185140.1
申请日:2022-09-27
Applicant: 上海富瀚微电子股份有限公司
IPC: H04N19/122 , H04N19/124 , H04N19/146 , H04N19/184
Abstract: 本发明公开了一种有效调节参考帧图像压缩率的方法及装置、电子设备,该方法包括:S1,将待压缩的参考帧图像分成若干n×n小块;S2,根据所述待压缩的参考帧图像的总数据量和目标压缩率要求,初始化n×n块的目标比特数,并得到每个像素所占用的目标比特数;S3,根据得到的每个像素所占用的目标比特数计算目标码率权重参数λreal;S4,根据量化参数与目标码率权重参数关系计算量化参数,以进行编码量化;S5,完成当前n×n块的编码过程,得到当前n×n块的每个像素的实际编码比特数;S6,根据实际编码比特数计算实际码率权重参数;S7,对参考帧图像特征相关的参数进行更新以及更新剩余可分配比特数,并返回步骤S2。
-
公开(公告)号:CN114596874A
公开(公告)日:2022-06-07
申请号:CN202210203571.X
申请日:2022-03-03
Applicant: 上海富瀚微电子股份有限公司
IPC: G10L21/0216 , G10L21/0232
Abstract: 本发明公开了一种基于多麦克风的风噪抑制方法及装置,所述方法包括如下步骤:步骤S1,根据各麦克风的低频能量大小选择输出麦克风信号;步骤S2,根据所述输出麦克风信号与其他麦克风信号每个频点的能量大小关系对所述输出麦克风信号的风噪频点进行抑制;步骤S3,将主麦克风与其他麦克风信号进行差分,取低频信号进行风噪检测与风噪大小估计,结合风噪连续性特点进行风噪抑制。
-
公开(公告)号:CN113011433A
公开(公告)日:2021-06-22
申请号:CN201911330355.6
申请日:2019-12-20
Applicant: 杭州海康威视数字技术股份有限公司 , 上海富瀚微电子股份有限公司
Abstract: 本申请实施例提供了一种滤波参数调整方法及装置,涉及图像处理技术领域,其中,上述方法包括:获得第一图像与参考图像间的帧差信息,其中,所述参考图像为:基于在所述第一图像之前采集的图像确定的图像;获得对所述第一图像进行目标检测的结果,其中,所述结果包括:被检测出目标所在区域和被检测出目标的类型;根据所述帧差信息和所述结果,确定所述第一图像中的各个前景区域;根据各个前景区域,调整用于对所述第一图像进行滤波处理的滤波参数,其中,所述滤波参数包括:滤波区域信息、时空域滤波权重、滤波方式和滤波器系数中的至少一种。应用本申请实施例提供的方案调整滤波参数,能够提高滤波效果。
-
公开(公告)号:CN112862697A
公开(公告)日:2021-05-28
申请号:CN202110019978.2
申请日:2021-01-07
Applicant: 上海富瀚微电子股份有限公司
Abstract: 本申请公开了一种高动态范围图像压缩的方法及装置,该方法包括:对高动态范围图像的亮区和暗区进行滤波得到亮区滤波结果和暗区滤波结果,对亮区滤波结果和暗区滤波结果进行加权平均得到亮度滤波结果,对亮度滤波结果进行直方图调整映射得到亮度映射图像,对高动态范围图像进行滤波弱强度和中强度计算得到滤波弱强度结果和滤波中强度结果,根据滤波弱强度结果和滤波中强度结果对高动态范围图像进行细节提取和细节增强得到高动态范围图像的高频细节增强信息和中频细节增强信息,根据亮度映射图像、高频细节增强信息和中频细节增强信息对高动态范围图像进行压缩得到压缩输出图像。通过实施本申请,能解决现有方案中存在的图像光晕的问题。
-
公开(公告)号:CN111563441A
公开(公告)日:2020-08-21
申请号:CN202010357800.4
申请日:2020-04-29
Applicant: 上海富瀚微电子股份有限公司
Abstract: 本发明提供一种目标检测的锚点生成匹配办法,通过调整锚点的密度,使目标检测中的最小目标尺寸处于第1层检测特征图上锚点所能检测得的目标尺寸范围内,进而确定第1层检测特征图上的锚点尺寸和密度,再根据第1层检测特征图上匹配的目标尺寸范围,从而确定第2层检测特征图上的锚点尺寸和密度,以此往复确定所有不同层检测特征图上的锚点尺寸和密度。本发明的目标检测的锚点生成匹配办法,生成的锚点与目标进行匹配,具有均衡性和完备性。
-
-
-
-
-
-
-
-
-