-
公开(公告)号:CN116058974A
公开(公告)日:2023-05-05
申请号:CN202310196969.X
申请日:2023-02-23
Applicant: 之江实验室
Abstract: 本公开是关于一种手术机器人和手术系统。手术机器人包括安装座和设置于安装座上的固定组件、导向组件和捻送组件。固定组件用于将输尿管软镜固定安装于安装座。导向组件位于捻送组件和固定组件之间,并与输尿管软镜的工作通道连通。捻送组件用于夹紧并驱动钬激光光纤,以使得钬激光光纤穿过导向组件后在输尿管软镜的工作通道内往复移动。本公开中的手术机器人能够在手术过程中,通过捻送组件实现钬激光光纤在输尿管软镜中的进给,而无需额外的手术助手,并且保证了手术的精密性,提高了手术效率。
-
公开(公告)号:CN116010566A
公开(公告)日:2023-04-25
申请号:CN202211629271.4
申请日:2022-12-19
Applicant: 之江实验室
IPC: G06F16/332 , G06F16/36 , G06F40/30 , G06F16/338 , G06F16/33 , G06F16/35 , G06N3/0442 , G06N3/0464 , G10L15/26 , G10L13/08
Abstract: 本发明公开了一种基于知识图谱的问答方法和系统,包括:将获取的音频数据转换为问答文本;利用基于双向LSTM构建的主语判断模型对问答文本进行主语判断并确认主语;采用基于spacy框架并结合主语在问答文本中的前后语义特征,链接主语在知识图谱中的标准主语实体;利用基于CNN构建关系预测模型对问答文本进行关系判断并筛选概率值高的至少2个关系;依据标准主语实体和每个关系在知识图谱中进行检索,确定每个目标实体节点,并对所有目标实体节点排序确认最终目标实体节点作为答案,并将答案转换成语音输出。该方法和系统实现计算资源需求最小化。
-
公开(公告)号:CN115933387A
公开(公告)日:2023-04-07
申请号:CN202211493655.8
申请日:2022-11-25
Applicant: 之江实验室
IPC: G05B13/04 , G06V10/774 , G06V10/82 , G06N3/0475 , G06N3/096 , G06T7/80
Abstract: 本发明涉及一种基于视觉语言预训练模型的机器人操控方法、装置及介质,所述方法包括:获取实时的视觉感知信息和自然语言指令,将该视觉感知信息和自然语言指令作为一操控策略深度学习网络模型的输入,获得对应的机器人动作指令;其中,所述操控策略深度学习网络模型的训练过程包括以下步骤:搭建机器人操控的仿真环境,在该仿真环境中生成第一训练数据集,构建包含视觉语言预训练的操控策略深度学习网络模型对操控策略深度学习网络模型进行预训练;采集真实场景数据集并处理,生成第二训练数据集,对经预训练的操控策略深度学习网络模型进行小样本迁移训练,微调模型参数,获得最终的操控策略深度学习网络模型。与现有技术相比,本发明具有可方便实现多任务作业、具有泛化能力等优点。
-
公开(公告)号:CN115879421A
公开(公告)日:2023-03-31
申请号:CN202310120728.7
申请日:2023-02-16
Applicant: 之江实验室
IPC: G06F40/166 , G06F40/284 , G06F40/117 , G06N3/0499 , G06N3/08
Abstract: 本发明公开了一种增强BART预训练任务的句子排序方法及装置,包括如下步骤:步骤1、从文本资源中提取有序的句子作为原始训练数据;步骤2、对原始训练数据进行预处理;步骤3、用预处理后的训练数据训练BART模型;步骤4、将待排序的句子输入到训练完成的模型中进行预测排序。设计词性标注预训练任务、句子掩盖预训练任务、句子删除预训练任务、句子填充预训练任务和句子旋转预训练任务进一步增强BART模型对句子语义和句间关系的特征提取能力。设计的预训练任务是一种多任务学习的训练方法,也是一种位置可控的句子排序方法,将排序控制信息通过句子标签序列的形式加到输入字符串中,模型会根据输入的排序控制信息进行句子排序。
-
公开(公告)号:CN115862130A
公开(公告)日:2023-03-28
申请号:CN202211433342.3
申请日:2022-11-16
Applicant: 之江实验室
IPC: G06V40/20 , G06V40/10 , G06V10/40 , G06V10/764 , G06V10/774 , G06V20/52 , G06V10/82 , G06V20/40 , G06N3/0464 , G06N3/047 , G06N3/084
Abstract: 基于人体姿态及其躯干运动场的行为识别方法,包括:获取多人人体彩色图像作为输入;采用目标检测网络从所述多人人体彩色图像中检测二维人体包围框,采用二维人体姿态估计网络从截取的图像中计算二维人体姿态;基于二维人体姿态分别计算关键点热图和躯干运动场,拼接这两种模态作为人体姿态表征;将人体姿态表征作为输入,建立姿态网络用于提取人体行为特征,输出分类器中概率最大的行为类别;采集多人人体彩色图像序列、二维人体姿态以及对应的类别标签作为训练数据集,采用随机梯度下降的优化方法对姿态网络进行预训练优化。本发明减少了复杂背景下行为动作在时间序列的歧义性,提高了低采样帧率下的行为识别的准确率。
-
公开(公告)号:CN115831145A
公开(公告)日:2023-03-21
申请号:CN202310123145.X
申请日:2023-02-16
Applicant: 之江实验室
IPC: G10L21/0232 , G10L21/0264 , G10L25/21
Abstract: 本发明公开一种双麦克风语音增强方法和系统,该方法包括:步骤一,对两个麦克风通道的信号进行分帧,加窗,快速傅里叶变换的操作,使得信号从时域转换到频域;步骤二,利用互相关函数对两个通道在频域的信号进行语音活跃检测,若检测为无语音段,则更新噪声互功率谱;若检测为有语音段,则对语音信号进行降噪处理;步骤三,使用降噪后的语音信号来估计晚期混响功率谱,并抑制混响,即使用晚期混响功率谱对降噪后的语音信号做去混响处理;步骤四,将降噪去混响后的信号从频域转换回时域后输出。本发明进行语音活跃检测、噪声互功率谱更新和噪声抑制,同时进行去混响处理,增加了混响抑制的有效性;结合降噪抑制和混响抑制,有效的提高了语音质量。
-
公开(公告)号:CN115827844A
公开(公告)日:2023-03-21
申请号:CN202211609811.2
申请日:2022-12-12
Applicant: 之江实验室
IPC: G06F16/332 , G06F16/36 , G06F40/295
Abstract: 一种基于Sparql语句生成的知识图谱问答方法,包括:将本体层的知识图谱和实例层的知识图谱映射到向量空间,学习每个概念、实体和关系的向量表示;通过命名实体识别算法识别出自然语言查询语句中的所有实体,并通过实体链接算法将问题中的实体链接到知识图谱实例层中的实体;在训练集中检索K个与查询问题相似的问题以及相应的Sparql语句;对问题和候选Sparql语句信息集进行编码,并采用多头注意力机制融合它们的信息;获取基于问题的本体编码,检索基于问题的本体子图以及相应的编码,并融合信息;采用transformer的Decoder部分作为生成模型,使用问题的编码、相应Sparql语句的编码以及本体子图的编码生成基于问题的Sparql语句;执行生成的Sparql语句,查询并返回问题的答案。
-
公开(公告)号:CN115578461B
公开(公告)日:2023-03-10
申请号:CN202211419607.4
申请日:2022-11-14
Applicant: 之江实验室
Abstract: 本发明公开了一种基于双向RGB‑D特征融合的物体姿态估计方法及装置,该方法的核心创新点为特征双向融合模块,通过将RGB与点云特征投影到标准空间以实现对齐,互补和相互增强的作用,提升了最终RGB‑D特征的显著性与代表性。此外,本发明还创新性地引入了感兴趣区域检测,特征恒等映射与残差融合,多任务协同训练,关键点投票与聚类,最小二乘法姿态解算等关键方法,极大改善了传统物体六自由度姿态估计中存在的抗干扰能力弱,精度不足等痛点问题。经多个实际场景测试,本发明可在杂乱环境下,高鲁棒性和高精度地实现对遮挡物体的六自由度姿态估计。
-
公开(公告)号:CN115731940A
公开(公告)日:2023-03-03
申请号:CN202211570644.5
申请日:2022-12-08
Applicant: 之江实验室
IPC: G10L21/0208 , G10L25/27
Abstract: 本发明公开了语音信号单通道去混响方法及装置、终端、可读存储介质,该方法包括:获取单通道时域信号并进行分帧、加窗、傅里叶变换,得到单通道频域信号;利用前D帧单通道频域信号,计算晚期混响权重系数;根据单通道频域信号和对应的晚期混响权重系数,估计后验信噪比和先验信噪比;利用上一帧增强后语音信号和上一帧频域信号,计算当前帧语音存在概率;利用上一帧增益控制参数和当前帧语音存在概率,计算增益控制参数;根据先验信噪比、后验信噪比,计算得到增益函数;利用增益控制参数、增益函数和单通道频域信号,估计增强后的语音频域信号;将增强后的语音频域信号与设定门限比较并根据比较结果进行更新,做逆傅里叶变换转换到时域并输出。
-
公开(公告)号:CN115014362B
公开(公告)日:2022-11-15
申请号:CN202210946915.6
申请日:2022-08-09
Applicant: 之江实验室
IPC: G01C21/20
Abstract: 本发明属于单机器人全覆盖路径规划领域,涉及一种基于合成单元的牛耕式全覆盖路径规划方法和装置,该方法包括:步骤一,基于机器人的平面目标作业区域,构建坐标系化的栅格地图;步骤二,对栅格地图进行按行划分,生成若干个基本路径片段集合并对两两基本路径片段集合之间进行判断后合并处理得到合成单元,同时确定机器人遍历起始单元;步骤三,基于合成单元间的相邻关系,生成拓扑地图,机器人利用所述拓扑地图,采用基于贪心算法的方式,通过三次求解旅行商问题,得到机器人的最终规划路径。本发明降低了规划最终路径的重复率,解决了现有方法在旅行商问题求解时,需要进行多次求解,严重影响了机器人的作业效率的问题。
-
-
-
-
-
-
-
-
-