-
公开(公告)号:CN116070173B
公开(公告)日:2023-07-18
申请号:CN202310237418.3
申请日:2023-03-07
Applicant: 之江实验室
Abstract: 本发明公开了一种跨模态任务指令理解的指读方法及系统,包括:对采集的音频数据进行语音识别得到文本数据;基于文本数据进行第一层任务分类得到第一层任务标签;在第一层任务标签为问题回答时,依据捕获图像确定指尖位置及指向信息;基于捕获图像进行目标检测得到候选视觉实体,基于指尖位置及指向信息从候选视觉实体中筛选目标视觉实体;依据目标视觉实体进行第二层任务分类确定第二层任务标签;依据第二层任务标签进行第二层任务规划并执行二层任务,该方法和系统通过将视觉确认与实体确认作为补充,以捕获缺失的代词指代对象信息,实现指代消解,帮助完成对跨模态指令的任务理解。
-
公开(公告)号:CN116058974B
公开(公告)日:2023-07-14
申请号:CN202310196969.X
申请日:2023-02-23
Applicant: 之江实验室
Abstract: 本公开是关于一种手术机器人和手术系统。手术机器人包括安装座和设置于安装座上的固定组件、导向组件和捻送组件。固定组件用于将输尿管软镜固定安装于安装座。导向组件位于捻送组件和固定组件之间,并与输尿管软镜的工作通道连通。捻送组件用于夹紧并驱动钬激光光纤,以使得钬激光光纤穿过导向组件后在输尿管软镜的工作通道内往复移动。本公开中的手术机器人能够在手术过程中,通过捻送组件实现钬激光光纤在输尿管软镜中的进给,而无需额外的手术助手,并且保证了手术的精密性,提高了手术效率。
-
公开(公告)号:CN115831145B
公开(公告)日:2023-06-27
申请号:CN202310123145.X
申请日:2023-02-16
Applicant: 之江实验室
IPC: G10L21/0232 , G10L21/0264 , G10L25/21
Abstract: 本发明公开一种双麦克风语音增强方法和系统,该方法包括:步骤一,对两个麦克风通道的信号进行分帧,加窗,快速傅里叶变换的操作,使得信号从时域转换到频域;步骤二,利用互相关函数对两个通道在频域的信号进行语音活跃检测,若检测为无语音段,则更新噪声互功率谱;若检测为有语音段,则对语音信号进行降噪处理;步骤三,使用降噪后的语音信号来估计晚期混响功率谱,并抑制混响,即使用晚期混响功率谱对降噪后的语音信号做去混响处理;步骤四,将降噪去混响后的信号从频域转换回时域后输出。本发明进行语音活跃检测、噪声互功率谱更新和噪声抑制,同时进行去混响处理,增加了混响抑制的有效性;结合降噪抑制和混响抑制,有效的提高了语音质量。
-
公开(公告)号:CN116226616A
公开(公告)日:2023-06-06
申请号:CN202211559342.8
申请日:2022-12-06
Applicant: 之江实验室
IPC: G06F18/10 , G06F18/213 , G06F18/24 , G06F18/23 , G06N20/00
Abstract: 本发明公开了一种针对快速射电暴的科研数据分析平台,包括数据管理模块:用于结构化、标准化、规范化地管理快速射电暴相关科研数据;快速射电暴搜寻模块:用于搜寻射电望远镜观测数据中的快速射电暴,并截取快速射电暴样本存储至数据库中;快速射电暴样本分析模块:基于天文数据分析算法组件,对快速射电暴样本进行深入分析,并传输分析结果至可视化模块;可视化模块:基于真实星系分布构建3D天球模型,将快速射电暴数据及分析结果展现在天球模型对应位置上。本发明提供快速射电暴数据获取、管理和共享功能,建设丰富的标准化数据分析能力,实现分析结果可视化,大幅提高数据获取及分析效率,促进天文成果共享,加速科研成果产出。
-
公开(公告)号:CN116127952A
公开(公告)日:2023-05-16
申请号:CN202310088091.8
申请日:2023-01-16
Applicant: 之江实验室
IPC: G06F40/232 , G06F40/126 , G06F18/25 , G06F16/332 , G06F40/216 , G06F16/35 , G06F40/169 , G06F18/22
Abstract: 一种多粒度中文文本纠错方法,包括:对待纠错的中文文本进行预处理;构建名词知识库和文本纠错训练语料;使用预训练语言模型对输入待纠错的文本进行向量编码,并融合文本的语音信息,得到字符向量序列;基于神经网络检测文本中的字粒度和词粒度错误,得到错误字集合和错误词集合;对检测得到的字粒度和词粒度的错误分别进行纠正,得到字、词粒度错误的候选替换字、词;使用多任务学习的方式联合训练整个模型;将字、词粒度纠正结果进行融合,得到纠错后的文本。本发明还包括一种多粒度中文文本纠错装置。本发明可以有效地对文本中的多粒度(字粒度和词粒度)错误进行纠错,并采用多任务学习的方式训练整个模型,具有很好的纠错准确性和实用性。
-
公开(公告)号:CN116089609A
公开(公告)日:2023-05-09
申请号:CN202211629245.1
申请日:2022-12-19
Applicant: 之江实验室
Abstract: 本发明公开了一种机器人任务自主决策执行的方法,包括以下步骤:将机器人相关知识分类别构建,包括静态知识和动态知识;根据静态知识和动态知识,将不同类别的知识采用不同形式表达,构建出多层次的多模态知识图谱;采用差异化存储知识的方式对多模态知识图谱进行存储,使得不同类别知识间相互关联;机器人基于关联的多模态知识图谱,实现任务的自主决策执行,这样通过分类存储各类知识,便于机器人基于各类知识的自主决策。
-
公开(公告)号:CN116058974A
公开(公告)日:2023-05-05
申请号:CN202310196969.X
申请日:2023-02-23
Applicant: 之江实验室
Abstract: 本公开是关于一种手术机器人和手术系统。手术机器人包括安装座和设置于安装座上的固定组件、导向组件和捻送组件。固定组件用于将输尿管软镜固定安装于安装座。导向组件位于捻送组件和固定组件之间,并与输尿管软镜的工作通道连通。捻送组件用于夹紧并驱动钬激光光纤,以使得钬激光光纤穿过导向组件后在输尿管软镜的工作通道内往复移动。本公开中的手术机器人能够在手术过程中,通过捻送组件实现钬激光光纤在输尿管软镜中的进给,而无需额外的手术助手,并且保证了手术的精密性,提高了手术效率。
-
公开(公告)号:CN116010566A
公开(公告)日:2023-04-25
申请号:CN202211629271.4
申请日:2022-12-19
Applicant: 之江实验室
IPC: G06F16/332 , G06F16/36 , G06F40/30 , G06F16/338 , G06F16/33 , G06F16/35 , G06N3/0442 , G06N3/0464 , G10L15/26 , G10L13/08
Abstract: 本发明公开了一种基于知识图谱的问答方法和系统,包括:将获取的音频数据转换为问答文本;利用基于双向LSTM构建的主语判断模型对问答文本进行主语判断并确认主语;采用基于spacy框架并结合主语在问答文本中的前后语义特征,链接主语在知识图谱中的标准主语实体;利用基于CNN构建关系预测模型对问答文本进行关系判断并筛选概率值高的至少2个关系;依据标准主语实体和每个关系在知识图谱中进行检索,确定每个目标实体节点,并对所有目标实体节点排序确认最终目标实体节点作为答案,并将答案转换成语音输出。该方法和系统实现计算资源需求最小化。
-
公开(公告)号:CN115933387A
公开(公告)日:2023-04-07
申请号:CN202211493655.8
申请日:2022-11-25
Applicant: 之江实验室
IPC: G05B13/04 , G06V10/774 , G06V10/82 , G06N3/0475 , G06N3/096 , G06T7/80
Abstract: 本发明涉及一种基于视觉语言预训练模型的机器人操控方法、装置及介质,所述方法包括:获取实时的视觉感知信息和自然语言指令,将该视觉感知信息和自然语言指令作为一操控策略深度学习网络模型的输入,获得对应的机器人动作指令;其中,所述操控策略深度学习网络模型的训练过程包括以下步骤:搭建机器人操控的仿真环境,在该仿真环境中生成第一训练数据集,构建包含视觉语言预训练的操控策略深度学习网络模型对操控策略深度学习网络模型进行预训练;采集真实场景数据集并处理,生成第二训练数据集,对经预训练的操控策略深度学习网络模型进行小样本迁移训练,微调模型参数,获得最终的操控策略深度学习网络模型。与现有技术相比,本发明具有可方便实现多任务作业、具有泛化能力等优点。
-
公开(公告)号:CN115879421A
公开(公告)日:2023-03-31
申请号:CN202310120728.7
申请日:2023-02-16
Applicant: 之江实验室
IPC: G06F40/166 , G06F40/284 , G06F40/117 , G06N3/0499 , G06N3/08
Abstract: 本发明公开了一种增强BART预训练任务的句子排序方法及装置,包括如下步骤:步骤1、从文本资源中提取有序的句子作为原始训练数据;步骤2、对原始训练数据进行预处理;步骤3、用预处理后的训练数据训练BART模型;步骤4、将待排序的句子输入到训练完成的模型中进行预测排序。设计词性标注预训练任务、句子掩盖预训练任务、句子删除预训练任务、句子填充预训练任务和句子旋转预训练任务进一步增强BART模型对句子语义和句间关系的特征提取能力。设计的预训练任务是一种多任务学习的训练方法,也是一种位置可控的句子排序方法,将排序控制信息通过句子标签序列的形式加到输入字符串中,模型会根据输入的排序控制信息进行句子排序。
-
-
-
-
-
-
-
-
-