一种音视频多模态的关键词唤醒方法及装置

    公开(公告)号:CN116631380A

    公开(公告)日:2023-08-22

    申请号:CN202310909532.6

    申请日:2023-07-24

    Abstract: 本发明公开了一种音视频多模态的关键词唤醒方法及装置,该方法包括:获取图像序列和音频序列;对所述图像序列进行嘴唇检测处理并提取检测到的嘴唇部分图像,将提取出的嘴唇图像序列利用嘴唇特征提取神经网络进行处理,得到图像特征;对所述音频序列做音频特征提取,将提取到的音频特征利用音频特征处理神经网络进行处理,得到音频高维特征;对所述图像特征和所述音频高维特征进行特征融合;将融合得到的音视频特征利用多模特征处理神经网络进行处理,得到多模高维特征;将所述图像特征、音频高维特征和多模高维特征融合成一个混合高维特征;基于所述混合高维特征,利用关键词唤醒分类器判断是否需要唤醒。

    一种语义不同措辞相似的句子生成方法、装置及设备

    公开(公告)号:CN116227466B

    公开(公告)日:2023-08-18

    申请号:CN202310501928.7

    申请日:2023-05-06

    Abstract: 本发明公开了一种语义不同措辞相似的句子生成方法、装置及设备,包括生成、筛选与输入句子语义不同措辞相似的句子;生成句子包括关键词替换和模型生成,关键词替换是选择原句中的关键词进行替换生成结果,模型生成是利用生成模型生成结果;再通过通顺判断、语义不同判断、措辞相似判断和质量评分对过滤得到的句子进行筛选。本发明提出了一种新的自然语言处理任务,可以计算句子间措辞相似度、计算句子间结构差异和筛选优质的生成结果;丰富了自然语言处理研究的任务,有利于问答系统的测试、高质量负例数据的生成和增强模型对语言的理解。

    一种基于Sparql语句生成的知识图谱问答方法和系统

    公开(公告)号:CN115827844B

    公开(公告)日:2023-08-08

    申请号:CN202211609811.2

    申请日:2022-12-12

    Abstract: 一种基于Sparql语句生成的知识图谱问答方法,包括:将本体层的知识图谱和实例层的知识图谱映射到向量空间,学习每个概念、实体和关系的向量表示;通过命名实体识别算法识别出自然语言查询语句中的所有实体,并通过实体链接算法将问题中的实体链接到知识图谱实例层中的实体;在训练集中检索K个与查询问题相似的问题以及相应的Sparql语句;对问题和候选Sparql语句信息集进行编码,并采用多头注意力机制融合它们的信息;获取基于问题的本体编码,检索基于问题的本体子图以及相应的编码,并融合信息;采用transformer的Decoder部分作为生成模型,使用问题的编码、相应Sparql语句的编码以及本体子图的编码生成基于问题的Sparql语句;执行生成的Sparql语句,查询并返回问题的答案。

    一种描述机器人能力的知识本体设计方法和装置

    公开(公告)号:CN116451563A

    公开(公告)日:2023-07-18

    申请号:CN202310295522.8

    申请日:2023-03-22

    Abstract: 本发明公开了一种描述机器人能力的知识本体设计方法和装置,包括:设计对机器人按照运动方式分类的分类本体知识;设计机器人的组件本体知识;设计机器人的动作本体知识;设计机器人的通用任务本体知识;设计机器人的关系本体知识,其中,关系本体知识用于将上述分类本体知识、组件本体知识、动作本体知识以及通用任务本体知识中的至少两者进行关联连接。该方法通过本体工程描述机器人以及场景动作任务,可以提高机器人任务的通用性,泛化机器人任务,让机器人可以根据自身硬件结构、软件能力以及场景信息进行动作推理判断,进行动态任务执行,具有良好的科研及工程价值。

    一种基于意图一致性的文本纠错方法、装置和介质

    公开(公告)号:CN116136957B

    公开(公告)日:2023-07-07

    申请号:CN202310410370.1

    申请日:2023-04-18

    Abstract: 本发明公开了一种基于意图一致性的文本纠错方法、装置和介质,该方法包括:收集原始纠错数据进行预处理和标注,构建文本纠错模型的纠错数据集;构建基于神经网络的文本纠错模型,将待纠错文本输入至文本纠错模型输出第一字符概率分布;使用第一字符概率分布及其对应的真实标签计算纠错损失值作为第一损失值;使用第一字符概率分布计算基于意图一致性得分的纠错损失值作为第二损失值;基于第一损失值和第二损失值,以两阶段训练的方式训练文本纠错模型,以获取训练好的最终的文本纠错模型;将待纠错文本输入训练得到的文本纠错模型进行纠错,输出纠错后文本。本发明可以有效地降低文本纠错模型的误纠率,提高纠错准确率,具有很强的实用性。

    一种基于情感分类的视频情感定位方法

    公开(公告)号:CN115761569B

    公开(公告)日:2023-07-04

    申请号:CN202211288216.3

    申请日:2022-10-20

    Abstract: 一种基于情感分类的视频情感定位方法,包括:通过人脸识别模型进行视频预处理,将人脸识别的检测结果作为情感定位网络训练集;建立情感定位网络,使用卷积神经网络提取图像局部特征,建立多分支图像特征,使用视觉transformer算法获取情感类别;判断各帧之间情感类别关系,删除误检或者异常结果;将相同表情识别结果,且时序距离较近作为视频中情感定位候选片段;基于情感类别获取的情感定位片段,获取视频候选片段特征,过滤判断错误候选片段;输出模型对视频情感定位结果,具体包括情感片段首尾时间及对应情感类别。本发明能够改善定位片段预设鲁棒性不佳的缺点,保证情感分类准确性的同时提升视频情感定位速率。

    进给机构和手术机器人
    188.
    发明公开

    公开(公告)号:CN116269780A

    公开(公告)日:2023-06-23

    申请号:CN202310183726.2

    申请日:2023-02-23

    Abstract: 本公开是关于一种进给机构和手术机器人。进给机构用于驱动输尿管软镜移动。进给机构包括固定座、第一滑动件、第二滑动件、驱动组件以及进给传感器。第一滑动件安装于固定座。第二滑动件安装于固定座,并且用于安装输尿管软镜。驱动组件安装于固定座,并且与第一滑动件连接。驱动组件用于驱动第一滑动件移动。进给传感器分别与第一滑动件以及第二滑动件固定连接,第一滑动件通过进给传感器带动第二滑动件移动。进给传感器用于检测第二滑动件在移动过程中所受阻力。通过这种设计,当第二滑动件在移动中受到的阻力发生变化时,进给传感器产生阻力信号,并传递至用户操作界面,用户根据该阻力信号来调整输尿管软镜的进给。

    手势识别方法、电子装置、手势识别系统和存储介质

    公开(公告)号:CN116246344A

    公开(公告)日:2023-06-09

    申请号:CN202310190451.5

    申请日:2023-02-24

    Abstract: 本申请涉及一种手势识别方法、电子装置、手势识别系统和存储介质,通过根据目标对象的三维姿态信息,构建目标对象的左右两侧躯干中至少其中一侧躯干的投影平面,以及确定左右两手中至少其中一只手的指向向量;确定第一手的指向向量与第一躯干的投影平面之间的空间位置关系,第一手为左右两手中最靠近第一躯干的手;根据空间位置关系确定第一手是否处于指向状态,解决了相关技术中无法准确区分左右手指向手势的问题,实现了独立并行地识别左右手指向手势。

    一种语义不同措辞相似的句子生成方法、装置及设备

    公开(公告)号:CN116227466A

    公开(公告)日:2023-06-06

    申请号:CN202310501928.7

    申请日:2023-05-06

    Abstract: 本发明公开了一种语义不同措辞相似的句子生成方法、装置及设备,包括生成、筛选与输入句子语义不同措辞相似的句子;生成句子包括关键词替换和模型生成,关键词替换是选择原句中的关键词进行替换生成结果,模型生成是利用生成模型生成结果;再通过通顺判断、语义不同判断、措辞相似判断和质量评分对过滤得到的句子进行筛选。本发明提出了一种新的自然语言处理任务,可以计算句子间措辞相似度、计算句子间结构差异和筛选优质的生成结果;丰富了自然语言处理研究的任务,有利于问答系统的测试、高质量负例数据的生成和增强模型对语言的理解。

Patent Agency Ranking