-
公开(公告)号:CN109710966A
公开(公告)日:2019-05-03
申请号:CN201811341590.9
申请日:2018-11-12
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 南京大学 , 江苏南大电子信息技术股份有限公司
IPC: G06F17/50
Abstract: 本发明公开了一种基于散射声功率的服务机器人圆柱形机身设计方法,首先确定机器人发声系统的频率下限和预期的声功率级增益,然后建立机器人机身声辐射模型,计算不同机身半径时的辐射声功率,得到声功率级增益随机身半径和频率乘积的变化曲线,最后根据声功率变化曲线、低频截止频率和预期的声功率增益,确定机身半径的最小值。本发明可以快速确定机器人圆柱形外壳所需的截面直径,提高发声系统的辐射声功率,改善交互的听音体验。
-
公开(公告)号:CN109697990A
公开(公告)日:2019-04-30
申请号:CN201811341603.2
申请日:2018-11-12
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 南京大学 , 江苏南大电子信息技术股份有限公司
IPC: G10L25/60
Abstract: 本发明公开了一种基于虚拟低音算法主观评价的客观评价方法,将语义细分法和系统范畴法这两种常用的主观评价方法进行了结合,利用多元线性回归分析在PEAQ中BV版本的11个模型输出参量MOVs以及PEAQ的两个输出值ODG、DI和音频频谱重心ASC基础上提出。本发明性能好,能准确地评价虚拟低音算法效果的好坏。
-
公开(公告)号:CN109616129A
公开(公告)日:2019-04-12
申请号:CN201811342149.2
申请日:2018-11-13
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 南京大学 , 江苏南大电子信息技术股份有限公司 , 马鞍山艾德声电子技术有限公司
IPC: G10L19/005 , G10L19/07 , G10L19/26
Abstract: 本发明公开了一种用于提升语音丢帧补偿性能的混合多描述正弦编码器方法,编码器框架结构由三个编码器组成,分别为多描述正弦编码器、参数编码器一和参数编码器二,其中多描述正弦编码器是核心编解码器,参数编码器一和参数编码器二为发送端丢包补偿用辅助编码器,引入两帧的信号延迟,增加了混合多描述正弦编码器的编解码器对网络丢包的鲁棒性。本发明通过牺牲相关冗余度提高人机交互通讯语音丢帧纠错能力,有效的提升人机交互数据丢失时的语音质量。
-
公开(公告)号:CN113990335B
公开(公告)日:2024-12-31
申请号:CN202111260920.3
申请日:2021-10-28
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 南京大学 , 江苏南大电子信息技术股份有限公司
IPC: G10L19/16
Abstract: 本发明公开了一种基于压缩感知的音频编解码方法,本发明音频编码中的待量化信号类型是压缩感知的稀疏分解后的降维信号,解码输出端需要进行稀疏分解的音频信号重构操作,编解码过程中采用区间能量方式进行自适应压缩感知编码。基于子带能量的自适应压缩感知能量加权,采用子带能量统计的方式对音频信号进行自适应压缩感知能量加权;自适应压缩感知稀疏分解,采用基于音频信号特征的稀疏变换矩阵和观测矩阵,本发明解决了实际音频通信系统中的低复杂度、低存储量的音频编码问题。
-
公开(公告)号:CN118258379A
公开(公告)日:2024-06-28
申请号:CN202410677669.8
申请日:2024-05-29
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 江苏南大电子信息技术股份有限公司
Abstract: 本发明提出一种多传感器融合的机器人同步定位方法及系统,该方法通过视觉图像的帧间特征点匹配来估计相机的位姿,并通过相机位姿对激光雷达点云数据的运动畸变进行修正,以提高后续建图的准确性。在建图过程中,通过视觉词袋加速回环检测,大大提高了回环检测的速度。
-
公开(公告)号:CN113905323B
公开(公告)日:2024-01-23
申请号:CN202111261650.8
申请日:2021-10-28
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 南京大学 , 江苏南大电子信息技术股份有限公司
Abstract: 本发明公开了一种适用于服务型机器人播放音频时的感知声源高度修正方法,包括以下步骤:服务型机器人本地设备存储了各种头相关传递函数HRTF构成头相关传递函数HRTF数据库,各种头相关传递函数HRTF涵盖了不同的高度听觉高度信息,服务型机器人根据多模传感交互方式获取人机交互主体听者的高度信息,根据生理高度特征对头相关传递函数HRTF进行匹配,然后对匹配的头相关传递函数HRTF进行微调,卷积本地音频数据,并输出给服务型机器人放音设备。本发明能够有效地实时修正服务型机器人的人机交互声音高度问题,解决了不同的服务型机器人和不同的听者在使用服务型机器人进行人机交互式时的虚拟声像的差异化问题。
-
公开(公告)号:CN116189644A
公开(公告)日:2023-05-30
申请号:CN202310474330.3
申请日:2023-04-28
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 江苏南大电子信息技术股份有限公司
IPC: G10K11/172 , G10K11/178
Abstract: 本发明属于声学降噪技术领域。涉及一种亚波长的宽带柱面声波吸收体,由N个吸收胞元环形阵列而成,4≤N≤20;其中,每一个所述吸收胞元包含M个具有不同共振频率的共振器环形阵列而成,2≤M≤10;所述吸收胞元包括前、后、顶、底、左、右六块板,各个板之间相互连接组成一封闭腔体;该封闭腔体由M‑1个隔板分隔以形成具有M个共振器的腔体,2≤M≤10;在每个共振器的两块隔板之间的前面板一上均设有开口用以形成声学共振;每个吸收元胞元之间通过左侧壁板一及右侧壁板一相互连接以形成吸收体。本发明的吸收体能高效地吸收频率范围为180~240 Hz的柱面声波,针对柱面声源产生的辐射噪声具有良好的宽频带抑制作用。
-
公开(公告)号:CN111192291B
公开(公告)日:2022-11-11
申请号:CN201911242648.9
申请日:2019-12-06
Applicant: 东南大学 , 南京南大电子智慧型服务机器人研究院有限公司 , 江苏南大电子信息技术股份有限公司
Abstract: 本发明公开了一种基于级联回归与孪生网络的目标跟踪方法,在第一帧,将指定的目标图像及以目标图像为中心构建的搜索区域分别输入以孪生网络构成的特征提取网络,分别得到目标图像与搜索区域的特征图。将得到的不同层次的特征图按设计的Attention机制融合,并一同输入到后续的级联区域推荐网络之中。经过级联区域推荐网络之后得到各个锚框的分类及位置预测信息,并得到锚框的预测得分图。通过非极大值抑制以及添加余弦窗等操作筛选出得分最高的锚框,并根据回归的得到的位置信息得到最终的预测框。本发明与传统算法相比上述算法具有精度高,鲁棒性强以及运行效率高的优点。
-
公开(公告)号:CN113707133A
公开(公告)日:2021-11-26
申请号:CN202111258859.9
申请日:2021-10-28
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 南京大学 , 江苏南大电子信息技术股份有限公司
Abstract: 本发明公开了一种基于声环境感知的服务机器人语音输出增益获取方法,首先确定语言可懂度指标,然后测量单位幅度信号驱动时,机器人发声系统在目标位置处产生的语声级零敏度SS;获取服务机器人工作场所的混响时间T60;使用机器人自身的传声器获取所在场景的背景噪声级NL;根据语言可懂度指标、混响时间T60、语音背景噪声级NL代入语言可懂度预测模型得到目标位置的期望语声级SPL;根据语声级零敏度SS和期望语声级SPL实时得到语音输出增益。本发明在机器人所处复杂声环境中时可考虑反射声和背景噪声的影响,有效提升机器人发声时的语音可懂度,并降低对周边环境的影响。
-
公开(公告)号:CN113421541B
公开(公告)日:2021-10-29
申请号:CN202110964906.5
申请日:2021-08-23
Applicant: 南京南大电子智慧型服务机器人研究院有限公司 , 江苏南大电子信息技术股份有限公司 , 南京敏嘉数据科技有限公司
IPC: G10K11/178
Abstract: 本发明公开了一种基于系数平滑的频域有源噪声控制系统,包括依次连接的后端控制滤波器、系数平滑器、前端控制滤波器,所述系数平滑器根据得到的后端控制滤波器时域系数对前端控制滤波器时域系数进行平滑,并更新前端控制滤波器,限制因系数变化过大带来的系统杂音,进而提高有源噪声控制系统的稳定性和有效性。本发明解决了使用频域算法的有源噪声控制系统出现的杂音问题。
-
-
-
-
-
-
-
-
-