基于信号协方差矩阵重构的实时声源分离方法和装置

    公开(公告)号:CN117037836A

    公开(公告)日:2023-11-10

    申请号:CN202311278673.9

    申请日:2023-10-07

    Abstract: 基于信号协方差矩阵重构的实时声源分离方法与装置,其方法包括:检测到多个声源信号时,采用指数平滑方法计算混合信号的协方差矩阵;对混合信号的协方差矩阵作特征值分解,利用特征值计算不同频率分量的噪声功率;利用主要特征值向量构成的子空间和理论导向矢量,计算声源的导向矢量;利用混合信号协方差矩阵的特征值向量和特征值,计算混合信号协方差矩阵的逆矩阵;利用混合信号协方差矩阵的逆矩阵和声源的导向矢量,计算每个声源的功率,并按照协方差矩阵的定义重构每个声源的信号协方差矩阵;利用每个声源的信号协方差矩阵和信号的理论导向矢量,计算分离系数矩阵;基于混合声信号向量与分离系数矩阵得到分离后的声源信号。

    一种基于语音和图像的说话人数目估计方法和系统

    公开(公告)号:CN117011924A

    公开(公告)日:2023-11-07

    申请号:CN202311278365.6

    申请日:2023-10-07

    Abstract: 一种基于语音和图像的说话人数目估计方法和系统,其方法包括:获取图像数据和麦克风阵列数据;检测图像中人脸数量;根据人脸数量生成one‑hot向量;使用麦克风阵列数据计算频域谱;将频域信号输入到噪声估计神经网络中估计噪声嵌入空间中的噪声向量;将噪声向量和频域信号输入到神经网络中估计人声嵌入空间的人声向量;将人脸数量的one‑hot向量和人声向量融合成一个混合向量;将混合向量通过多层全连接层;将全连接层结果输出到说话人数嵌入空间估计说话人数向量;将说话人数向量输入到softmax分类器中,估计出说话人个数。本发明提升了噪声环境下说话人数目估计的准确性和抗干扰能力。

    一种音视频多模态的关键词唤醒方法及装置

    公开(公告)号:CN116631380B

    公开(公告)日:2023-11-07

    申请号:CN202310909532.6

    申请日:2023-07-24

    Abstract: 本发明公开了一种音视频多模态的关键词唤醒方法及装置,该方法包括:获取图像序列和音频序列;对所述图像序列进行嘴唇检测处理并提取检测到的嘴唇部分图像,将提取出的嘴唇图像序列利用嘴唇特征提取神经网络进行处理,得到图像特征;对所述音频序列做音频特征提取,将提取到的音频特征利用音频特征处理神经网络进行处理,得到音频高维特征;对所述图像特征和所述音频高维特征进行特征融合;将融合得到的音视频特征利用多模特征处理神经网络进行处理,得到多模高维特征;将所述图像特征、音频高维特征和多模高维特征融合成一个混合高维特征;基于所述混合高维特征,利用关键词唤醒分类器判断是否需要唤醒。

    基于奇异值分解计算协方差矩阵的波束成形方法和系统

    公开(公告)号:CN116846440A

    公开(公告)日:2023-10-03

    申请号:CN202310852044.6

    申请日:2023-07-11

    Abstract: 基于奇异值分解计算协方差矩阵的波束成形方法和系统,其方法包括:计算观测信号的协方差矩阵;对观测信号的协方差矩阵作奇异值分解,利用奇异值计算噪声功率;利用左奇异向量矩阵、右奇异向量矩阵和奇异值,计算观测信号协方差矩阵的逆矩阵;利用观测信号协方差矩阵的逆矩阵和干扰信号的理论导向矢量,按照协方差矩阵的定义计算干扰噪声协方差矩阵;利用计算的干扰噪声协方差矩阵,加上球面扩展噪声协方差矩阵和对角加载量,重新计算干扰噪声协方差矩阵;利用重新计算的干扰噪声协方差矩阵和目标信号的理论导向矢量,采用MVDR方法,计算波束成形的滤波系数矩阵;基于传感器阵列接收到的信号向量与滤波系数矩阵得到波束增强的目标信号。

    一种物体的抓取方法、装置、存储介质及电子设备

    公开(公告)号:CN116330306B

    公开(公告)日:2023-08-15

    申请号:CN202310631265.0

    申请日:2023-05-31

    Abstract: 本说明书公开了一种物体的抓取方法、装置、存储介质及电子设备,预先建立通用模型库,获取目标物体的深度图像及普通图像,以确定该目标物体的特征,根据该目标物体的特征,在预先建立的通用模型库中确定出与该目标物体匹配的通用模型,作为目标通用模型,根据该目标物体的特征及该目标通用模型,建立该目标物体的三维点云模型,以确定该目标物体的姿态,再根据该姿态及该三维点云模型,确定该目标物体的抓取点,根据该抓取点控制抓取设备抓取该目标物体。本方法通过目标物体的不同类型的图像,确定目标物体的特征,根据该特征及目标通用模型确定目标物体的姿态,以确定抓取点,根据该抓取点抓取目标物体,提高了抓取未知物体的准确性和稳定性。

    知识图谱实体链接方法、装置、计算机设备及存储介质

    公开(公告)号:CN116561339A

    公开(公告)日:2023-08-08

    申请号:CN202310522687.4

    申请日:2023-05-10

    Abstract: 本申请涉及一种知识图谱实体链接方法、装置、计算机设备及存储介质,该方法包括:基于问题样本、实体提及样本、知识图谱实体正样本和知识图谱实体邻接子图样本,获取训练数据正样本;基于问题样本、实体提及样本、知识图谱实体负样本和对应的知识图谱实体邻接子图样本,获取训练数据负样本;基于训练数据正样本、训练数据负样本对实体链接初始模型进行训练,得到实体链接模型;将用户问题、实体提及、候选知识图谱实体和对应的知识图谱实体邻接子图输入训练完成的实体链接模型,确定与实体提及链接的目标知识图谱实体,解决了相关技术中存在的问答场景中实体一致性模型效果不佳,实体链接准确性较低的问题。

    手术机器人和手术系统
    17.
    发明授权

    公开(公告)号:CN116058974B

    公开(公告)日:2023-07-14

    申请号:CN202310196969.X

    申请日:2023-02-23

    Abstract: 本公开是关于一种手术机器人和手术系统。手术机器人包括安装座和设置于安装座上的固定组件、导向组件和捻送组件。固定组件用于将输尿管软镜固定安装于安装座。导向组件位于捻送组件和固定组件之间,并与输尿管软镜的工作通道连通。捻送组件用于夹紧并驱动钬激光光纤,以使得钬激光光纤穿过导向组件后在输尿管软镜的工作通道内往复移动。本公开中的手术机器人能够在手术过程中,通过捻送组件实现钬激光光纤在输尿管软镜中的进给,而无需额外的手术助手,并且保证了手术的精密性,提高了手术效率。

    一种双麦克风语音增强方法和系统

    公开(公告)号:CN115831145B

    公开(公告)日:2023-06-27

    申请号:CN202310123145.X

    申请日:2023-02-16

    Abstract: 本发明公开一种双麦克风语音增强方法和系统,该方法包括:步骤一,对两个麦克风通道的信号进行分帧,加窗,快速傅里叶变换的操作,使得信号从时域转换到频域;步骤二,利用互相关函数对两个通道在频域的信号进行语音活跃检测,若检测为无语音段,则更新噪声互功率谱;若检测为有语音段,则对语音信号进行降噪处理;步骤三,使用降噪后的语音信号来估计晚期混响功率谱,并抑制混响,即使用晚期混响功率谱对降噪后的语音信号做去混响处理;步骤四,将降噪去混响后的信号从频域转换回时域后输出。本发明进行语音活跃检测、噪声互功率谱更新和噪声抑制,同时进行去混响处理,增加了混响抑制的有效性;结合降噪抑制和混响抑制,有效的提高了语音质量。

    一种多粒度中文文本纠错方法和装置

    公开(公告)号:CN116127952A

    公开(公告)日:2023-05-16

    申请号:CN202310088091.8

    申请日:2023-01-16

    Abstract: 一种多粒度中文文本纠错方法,包括:对待纠错的中文文本进行预处理;构建名词知识库和文本纠错训练语料;使用预训练语言模型对输入待纠错的文本进行向量编码,并融合文本的语音信息,得到字符向量序列;基于神经网络检测文本中的字粒度和词粒度错误,得到错误字集合和错误词集合;对检测得到的字粒度和词粒度的错误分别进行纠正,得到字、词粒度错误的候选替换字、词;使用多任务学习的方式联合训练整个模型;将字、词粒度纠正结果进行融合,得到纠错后的文本。本发明还包括一种多粒度中文文本纠错装置。本发明可以有效地对文本中的多粒度(字粒度和词粒度)错误进行纠错,并采用多任务学习的方式训练整个模型,具有很好的纠错准确性和实用性。

    一种机器人任务自主决策执行的方法和装置

    公开(公告)号:CN116089609A

    公开(公告)日:2023-05-09

    申请号:CN202211629245.1

    申请日:2022-12-19

    Abstract: 本发明公开了一种机器人任务自主决策执行的方法,包括以下步骤:将机器人相关知识分类别构建,包括静态知识和动态知识;根据静态知识和动态知识,将不同类别的知识采用不同形式表达,构建出多层次的多模态知识图谱;采用差异化存储知识的方式对多模态知识图谱进行存储,使得不同类别知识间相互关联;机器人基于关联的多模态知识图谱,实现任务的自主决策执行,这样通过分类存储各类知识,便于机器人基于各类知识的自主决策。

Patent Agency Ranking