一种基于中文分词优化的中文语音合成方法、电子设备及存储介质

    公开(公告)号:CN116741140A

    公开(公告)日:2023-09-12

    申请号:CN202310773458.X

    申请日:2023-06-28

    Abstract: 本发明公开了一种基于中文分词优化的中文语音合成方法:首先利用基于加权自蒸馏的中文分词模型CWS‑WSD将医疗服务机器人交互过程中产生的回复文本进行分词,明确文本中的词汇边界,然后根据分词结果插入相应的停顿标志符,最后将插入标识符后的文本送入Tacotron2进行语音合成。本发明通过在语音合成过程中事先对中文文本进行中文分词,来为文本加入词汇边界,进而在生成的语音中对应地加入停顿来缓解前述提到的歧义和交互质量的问题。

    一种软硬件结合的视觉深度学习模型推理加速方法

    公开(公告)号:CN115034394A

    公开(公告)日:2022-09-09

    申请号:CN202210817062.6

    申请日:2022-07-12

    Abstract: 本发明公开了一种软硬件结合的视觉深度学习模型推理加速方法,包括:S1、根据视觉任务,训练原始深度学习模型;S2、针对所有网络层,利用权值大小挑选不重要的滤波器;S3、移除当前层不重要滤波器,判断剪枝前后模型精度;S4、进行判断模型精度下降是否明显;S5、机型判断是否所有层处理完毕;S6、进行全局优化网络,计算模型精度;S7、模型部署TensorRT&多线程处理。根据本发明,能够运用在任何需要部署到边缘设备的视觉深度学习模型中,在基本保持模型推理精度的同时,有效提升模型的推理速度。

    一种基于改进型角度估计的机械臂抓取方法

    公开(公告)号:CN115213902A

    公开(公告)日:2022-10-21

    申请号:CN202210840815.5

    申请日:2022-07-18

    Abstract: 本发明公开了一种基于改进型角度估计的机械臂抓取方法,包括:S1、将机器人放入非结构化场景中进行目标物体信息采集;S2、通过one‑stage检测器对步骤S1中的目标物体信息采集进行检测,输出目标物体的边界框信息;S3、将步骤S1中的目标物体信息与步骤S2中边界框信息进行结合,通过K‑means++算法将框内所有像素点的深度值聚类为三类,将聚类中心值作为抓取点到相机成像镜头的距离;S4、将上述的聚类中心的点坐标和剔除异常点的深度信息根据相应的运算得到真实世界中的抓取坐标;S5、使用Canny检测图像信息,并求解最小外接矩阵,获取物体主方向角度。根据本发明,能够迅速在复杂场景中获取物体抓取角度。

    一种面向非结构场景中垃圾拾取任务的高效感知方法

    公开(公告)号:CN115187905A

    公开(公告)日:2022-10-14

    申请号:CN202210835850.8

    申请日:2022-07-15

    Abstract: 工作场景感知是机器人高效实现指定任务的重要前提,得益于深度学习的发展,现有方法可实现高性能的工作场景感知,但要求较高的计算能力导致这些方法难以部署于低算力的平台上,本发明针对移动机器人在非结构化场景中的垃圾拾取任务,构建了一个包含12类垃圾的数据集,并以此提供一种面向非结构场景中垃圾拾取任务的高效感知方法,该方法在YOLOv4目标检测的基础上,设计了一种基于K‑means++聚类的深度信息优化方法,并结合图像形态学变化和Canny边缘检测算法实现物体角度估计,实验结果表明了本发明方法准确率高、实时性强,对于非结构化场景中的干扰信息(如背景、物体材质等)具有一定的鲁棒性。

Patent Agency Ranking