Patent search ap:("之江实验室") AND inv:"李特" Page 3

21.

发明授权
基于信号协方差矩阵重构的实时声源分离方法和装置有权

公开(公告)号：CN117037836B

公开(公告)日：2023-12-29

申请号：CN202311278673.9

申请日：2023-10-07

Applicant: 之江实验室

Inventor： 朱世强 , 肖永雄 , 宛敏红 , 宋伟 , 付强 , 李特 , 顾建军

IPC: G10L21/0272 , G10L25/27 , G10L25/21

Abstract: 基于信号协方差矩阵重构的实时声源分离方法与装置，其方法包括：检测到多个声源信号时，采用指数平滑方法计算混合信号的协方差矩阵；对混合信号的协方差矩阵作特征值分解，利用特征值计算不同频率分量的噪声功率；利用主要特征值向量构成的子空间和理论导向矢量，计算声源的导向矢量；利用混合信号协方差矩阵的特征值向量和特征值，计算混合信号协方差矩阵的逆矩阵；利用混合信号协方差矩阵的逆矩阵和声源的导向矢量，计算每个声源的功率，并按照协方差矩阵的定义重构每个声源的信号协方差矩阵；利用每个声源的信号协方差矩阵和信号的理论导向矢量，计算分离系数矩阵；基于混合声信号向量与分离系数矩阵得到分离后的声源信

22.

发明公开
基于信号协方差矩阵重构的实时声源分离方法和装置有权

公开(公告)号：CN117037836A

公开(公告)日：2023-11-10

申请号：CN202311278673.9

申请日：2023-10-07

Applicant: 之江实验室

Inventor： 朱世强 , 肖永雄 , 宛敏红 , 宋伟 , 付强 , 李特 , 顾建军

IPC: G10L21/0272 , G10L25/27 , G10L25/21

Abstract: 基于信号协方差矩阵重构的实时声源分离方法与装置，其方法包括：检测到多个声源信号时，采用指数平滑方法计算混合信号的协方差矩阵；对混合信号的协方差矩阵作特征值分解，利用特征值计算不同频率分量的噪声功率；利用主要特征值向量构成的子空间和理论导向矢量，计算声源的导向矢量；利用混合信号协方差矩阵的特征值向量和特征值，计算混合信号协方差矩阵的逆矩阵；利用混合信号协方差矩阵的逆矩阵和声源的导向矢量，计算每个声源的功率，并按照协方差矩阵的定义重构每个声源的信号协方差矩阵；利用每个声源的信号协方差矩阵和信号的理论导向矢量，计算分离系数矩阵；基于混合声信号向量与分离系数矩阵得到分离后的声源信号。

23.

发明公开
基于奇异值分解计算协方差矩阵的波束成形方法和系统审中-实审

公开(公告)号：CN116846440A

公开(公告)日：2023-10-03

申请号：CN202310852044.6

申请日：2023-07-11

Applicant: 之江实验室

Inventor： 肖永雄 , 宋伟 , 宛敏红 , 付强 , 李特 , 顾建军 , 朱世强

IPC: H04B7/06 , H04B7/08

Abstract: 基于奇异值分解计算协方差矩阵的波束成形方法和系统，其方法包括：计算观测信号的协方差矩阵；对观测信号的协方差矩阵作奇异值分解，利用奇异值计算噪声功率；利用左奇异向量矩阵、右奇异向量矩阵和奇异值，计算观测信号协方差矩阵的逆矩阵；利用观测信号协方差矩阵的逆矩阵和干扰信号的理论导向矢量，按照协方差矩阵的定义计算干扰噪声协方差矩阵；利用计算的干扰噪声协方差矩阵，加上球面扩展噪声协方差矩阵和对角加载量，重新计算干扰噪声协方差矩阵；利用重新计算的干扰噪声协方差矩阵和目标信号的理论导向矢量，采用MVDR方法，计算波束成形的滤波系数矩阵；基于传感器阵列接收到的信号向量与滤波系数矩阵得到波束增强的目标信号。

24.

发明公开
一种位姿的确定方法、装置、设备及存储介质审中-实审

公开(公告)号：CN116309823A

公开(公告)日：2023-06-23

申请号：CN202310090212.2

申请日：2023-01-17

Applicant: 之江实验室 , 山东大学

Inventor： 李特 , 李佳宸 , 金立 , 陈文轩 , 谢康 , 秦学英

IPC: G06T7/73 , G06T7/246 , G06T7/13

Abstract: 本说明书公开了一种位姿的确定方法、装置、设备及存储介质，可以通过补偿模型根据相机采集到的二维图像中包含有目标物的指定区域图像的图像信息，确定出目标物的轮廓特征，以及根据包含有目标物的指定区域图像在整个二维图像中的图像位置信息，确定目标物的二维位置特征，从而可以根据确定出的目标物的轮廓特征、二维位置特征以及通过预设的跟踪算法确定出的目标物的初始位姿，预测出通过预设的跟踪算法确定出的初始位姿与在采集二维图像时目标物的实际位姿之间的位姿偏差，进而可以根据预测出的位姿偏差对通过预设的跟踪算法确定出的目标物的初始位姿进行补偿，以提升通过三维跟踪算法估算出的二维图像中物体对应的位姿的准确性。

25.

发明公开
基于提示学习的弱监督语义分割方法与装置审中-实审

公开(公告)号：CN116091774A

公开(公告)日：2023-05-09

申请号：CN202310171401.2

申请日：2023-02-16

Applicant: 之江实验室 , 华中科技大学

Inventor： 李特 , 顾建军 , 朱良辉 , 邹雅 , 王兴刚

IPC: G06V10/26 , G06V10/774 , G06V10/82 , G06V20/70 , G06N3/0895

Abstract: 本发明公开了一种基于提示学习的弱监督语义分割方法，包括：把图像和通过可学习的提示适配器的类别文本进行编码生成特征嵌入embeddings，然后将两者进行查询query，从而使图像以及其图像级别对应的类别标签作为训练数据；使用注意力进行查询，利用上一步生成的query和图像embeddings结果，添加一个transformer来在图像embeddings和query之间做一个自注意力；在训练过程中计算损失函数进行更新权重，将弱监督语义分割WSSS损失分为两部分:第一部分是seedingloss，第二部分是边界损失。本发明提出的WeakCLIP方法非常简单且高效。本发明还提供了相应的基于提示学习的弱监督语义分割装置。

26.

发明公开
基于ZED立体相机的行人空间信息感知方法及装置审中-实审

公开(公告)号：CN115546829A

公开(公告)日：2022-12-30

申请号：CN202211187402.8

申请日：2022-09-28

Applicant: 之江实验室

Inventor： 寄珊珊 , 李特 , 朱世强 , 孟启炜 , 王文 , 宛敏红

IPC: G06V40/10 , G06V10/62

Abstract: 本发明公开了基于ZED立体相机的行人空间信息感知方法及装置，主要用于展厅等公共场景下导览机器人对行人的空间位置及移动速度的智能感知。利用ZED双目视觉相机采集场景下的实时数据并上传至云端服务器；将预处理后RGB数据输入到部署好的人体关键点检测网络获取人体关键点二维信息，根据行人上半身主干区域的人体二维关键点信息生成行人包围框；对连续多帧下的多目标行人进行持续跟踪；结合点云数据获取相应区域的人体关键点三维空间坐标，并计算行人空间位置及移动速度；最后导览机器人根据获取到的行人空间信息进行本体移动控制，完成自主跟随及避障等智能导览任务，从而增加导览机器人的灵活性，提升参观者的交互体验。

27.

发明授权
一种基于视频流的行人运动速度智能感知方法有权

公开(公告)号：CN112598709B

公开(公告)日：2022-11-01

申请号：CN202011559927.0

申请日：2020-12-25

Applicant: 之江实验室

Inventor： 寄珊珊 , 李特 , 孟启炜 , 朱世强 , 顾建军

IPC: G06T7/246 , G06T7/73 , G06T7/80 , G06V40/10

Abstract: 本发明公开了一种基于视频流的行人运动速度智能感知方法，该方法包括：采用摄像头标定方法获取摄像头内部参数和外部参数，建立图像坐标系到空间坐标系的坐标转换模型；获取监控摄像头下的实时视频流并进行行人目标检测及跟踪，得到行人ID和相应的图像坐标系下的行人检测框粗定位结果；利用人体部件分割模型对得到的行人目标进行部件分割，获取图像坐标系下的行人脚点精定位结果；利用坐标转换模型实现行人脚点从图像坐标系到真实世界中的空间坐标系的位置信息解算，结合视频流帧间隔时间计算行人的运动速度，实现基于摄像头视频流的行人运动速度智能感知方法。

28.

发明公开
一种基于三元组的多模态协同场景识别方法有权

公开(公告)号：CN115115868A

公开(公告)日：2022-09-27

申请号：CN202210386333.7

申请日：2022-04-13

Applicant: 之江实验室 , 中国科学院信息工程研究所

Inventor： 朱世强 , 李特 , 操晓春 , 赵博文 , 李京知

IPC: G06V10/764 , G06N3/04 , G06N3/08 , G06V10/774

Abstract: 本发明公开了一种基于三元组的多模态协同场景识别方法，涉及深度学习下的计算机视觉与自然语言处理领域，针对单模态识别方法在复杂场景中体现出的局限性，提出为每个样本匹配一个由图像、文本型摘要和实例信息三种模态的标注数据构成的三元组，分别进行三个分支的神经网络学习训练，通过综合考量多种模态下的特征信息，在不引入额外数据收集成本的情况下提升场景识别的准确率。

29.

发明授权
一种基于物体3D位姿视觉跟踪的增强现实方法及装置有权

公开(公告)号：CN114092526B

公开(公告)日：2022-06-28

申请号：CN202210073191.9

申请日：2022-01-21

Applicant: 之江实验室

Inventor： 李特 , 王彬 , 顾建军 , 曹昕 , 李佳宸 , 秦学英

IPC: G06T7/246 , G06T7/215 , G06T7/73 , G06T7/80 , G06T19/00

Abstract: 本发明公开了一种基于物体3D位姿视觉跟踪的增强现实方法及装置，该方法包括：获取第一相机视角下的第一能量函数和第二相机视角下的第二能量函数，并计算目标物体当前帧和上一帧在物体中心坐标系下的位姿变换增量；根据位姿变换增量，更新目标物体在第一相机视角下的位姿，得到第一位姿；将位姿变换增量发送至第二处理单元，以使得第二处理单元根据位姿变换增量，更新目标物体在第二相机视角下的位姿，得到第二位姿；将第一位姿发送至显示设备，以使得显示设备获取自身在世界坐标系下的第三位姿并根据第一位姿、第三位姿和第四位姿计算目标物体当前帧在显示设备坐标系下的第五位姿，其中第四位姿为第一相机在世界坐标系下的位姿。

30.

发明公开
一种基于自注意力机制的通用图像目标检测方法和装置有权

公开(公告)号：CN113902926A

公开(公告)日：2022-01-07

申请号：CN202111477045.4

申请日：2021-12-06

Applicant: 之江实验室

Inventor： 李特 , 王世杰 , 朱世强 , 顾建军 , 王兴刚

IPC: G06V10/44 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08

Abstract: 本发明公开一种基于自注意力机制的通用图像目标检测方法，该方法是基于DETR模型的改进，其包括对将含边界框标注的训练集图像输入图像特征提取网络，获得图像特征；将图像特征依次通过多头十字交叉注意力模块和多方向交叉注意力模块，获得解码器输出增强目标查询向量；将增强目标查询向量分别通过模型的分类层和回归层得到目标图像物体边界框和物体类别概率；计算网络整体损失对模型进行训练，得到目标检测模型；利用上述模型对待检测图像进行目标检测。本发明相比于DETR模型，在保证目标检测准确的同时，加快模型训练速度，减小模型的计算复杂度，提高模型灵活性与实用性。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification