Patent search ap:("上海理工大学") AND inv:"米金鹏" Page 1

1.

发明公开
一种基于中文分词优化的中文语音合成方法、电子设备及存储介质审中-实审

公开(公告)号：CN116741140A

公开(公告)日：2023-09-12

申请号：CN202310773458.X

申请日：2023-06-28

Applicant: 上海理工大学

Inventor： 马致远 , 刘高飞 , 潘美琦 , 米金鹏 , 唐宋 , 刘丹

IPC: G10L13/02 , G10L13/06

Abstract: 本发明公开了一种基于中文分词优化的中文语音合成方法：首先利用基于加权自蒸馏的中文分词模型CWS‑WSD将医疗服务机器人交互过程中产生的回复文本进行分词，明确文本中的词汇边界，然后根据分词结果插入相应的停顿标志符，最后将插入标识符后的文本送入Tacotron2进行语音合成。本发明通过在语音合成过程中事先对中文文本进行中文分词，来为文本加入词汇边界，进而在生成的语音中对应地加入停顿来缓解前述提到的歧义和交互质量的问题。

2.

发明公开
一种软硬件结合的视觉深度学习模型推理加速方法审中-实审

公开(公告)号：CN115034394A

公开(公告)日：2022-09-09

申请号：CN202210817062.6

申请日：2022-07-12

Applicant: 上海理工大学

Inventor： 刘丹 , 米金鹏 , 唐宋 , 包震伟

IPC: G06N5/04 , G06N3/04 , G06N3/08 , G06T1/20

Abstract: 本发明公开了一种软硬件结合的视觉深度学习模型推理加速方法，包括：S1、根据视觉任务，训练原始深度学习模型；S2、针对所有网络层，利用权值大小挑选不重要的滤波器；S3、移除当前层不重要滤波器，判断剪枝前后模型精度；S4、进行判断模型精度下降是否明显；S5、机型判断是否所有层处理完毕；S6、进行全局优化网络，计算模型精度；S7、模型部署TensorRT&多线程处理。根据本发明，能够运用在任何需要部署到边缘设备的视觉深度学习模型中，在基本保持模型推理精度的同时，有效提升模型的推理速度。

3.

发明公开
一种应用于跨领域场景的多模型协同学习行为识别方法审中-实审

公开(公告)号：CN119360269A

公开(公告)日：2025-01-24

申请号：CN202411381144.6

申请日：2024-09-29

Applicant: 上海理工大学

Inventor： 刘丹 , 李秋燕 , 包震伟 , 沈周立 , 彭爱 , 夏学敏 , 马致远 , 米金鹏 , 唐宋

IPC: G06V20/40 , G06V10/44 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/096

Abstract: 本发明公开了一种应用于跨领域场景的多模型协同学习行为识别方法，步骤包括：模型预训练、输出伪标签集、模型更新、模型部署。本发明方法本通过融合历史预测信息，以及跨模型集成等技术缓解了现有方法中伪标签预测不稳定的现象。相较于现有方法，目标域伪标签质量提升较大，进而取得更优的跨域识别效果。同时，通过引入双模型结构，缓解了样本特征表征能力不足的问题，取得了更优的跨域行为识别效果。

4.

发明公开
一种基于改进型角度估计的机械臂抓取方法审中-实审

公开(公告)号：CN115213902A

公开(公告)日：2022-10-21

申请号：CN202210840815.5

申请日：2022-07-18

Applicant: 上海理工大学

Inventor： 米金鹏 , 胡卫兵 , 刘丹 , 唐宋 , 马致远

IPC: B25J9/16 , B25J19/02 , G06N3/04 , G06N3/08 , G06T7/13 , G06V10/762

Abstract: 本发明公开了一种基于改进型角度估计的机械臂抓取方法，包括：S1、将机器人放入非结构化场景中进行目标物体信息采集；S2、通过one‑stage检测器对步骤S1中的目标物体信息采集进行检测，输出目标物体的边界框信息；S3、将步骤S1中的目标物体信息与步骤S2中边界框信息进行结合，通过K‑means++算法将框内所有像素点的深度值聚类为三类，将聚类中心值作为抓取点到相机成像镜头的距离；S4、将上述的聚类中心的点坐标和剔除异常点的深度信息根据相应的运算得到真实世界中的抓取坐标；S5、使用Canny检测图像信息，并求解最小外接矩阵，获取物体主方向角度。根据本发明，能够迅速在复杂场景中获取物体抓取角度。

5.

发明公开
一种基于情感检测的仿生机器人表情生成方法审中-实审

公开(公告)号：CN117113972A

公开(公告)日：2023-11-24

申请号：CN202310667063.1

申请日：2023-06-07

Applicant: 上海理工大学

Inventor： 马致远 , 刘高飞 , 潘美琦 , 米金鹏 , 唐宋 , 刘丹

IPC: G06F40/211 , G10L15/26 , G10L15/22 , G06F40/30 , G06F40/268 , G06F18/25 , G06F18/241 , G06F18/2415 , G06F40/289 , G06N3/042 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/048

Abstract: 本发明公开了一种基于情感检测的仿生机器人表情生成方法，该系统包括交互用户、仿生机器头、计算机终端、语音采集和播放装置；整个系统可分为微表情控制指令生成和微表情动作执行两部分，在人机对话过程中，仿生机器头通过语音采集装置和语音识别模块获取用户输入文本信息，然后将输入文本信息分别经过文本对话模块和文本情感检测TSDM模块获得生成文本信息、用户输入情感，再将生成文本信息分别经过文本情感检测TSDM模块和文本转音频模块获得仿生机器头的生成情感和生成音频信息，最后根据用户输入情感和生成情感获得仿生机器头表情控制指令进而控制机器头舵机转动实现微表情动作，本发明，具有自发性的特点。

6.

发明公开
一种面向非结构场景中垃圾拾取任务的高效感知方法审中-实审

公开(公告)号：CN115187905A

公开(公告)日：2022-10-14

申请号：CN202210835850.8

申请日：2022-07-15

Applicant: 上海理工大学

Inventor： 米金鹏 , 吴旭明 , 唐宋 , 刘丹 , 马致远

IPC: G06V20/40 , G06V10/82 , G06V10/762 , G06T7/70 , G06T7/13 , G06N3/04 , G06N3/08

Abstract: 工作场景感知是机器人高效实现指定任务的重要前提，得益于深度学习的发展，现有方法可实现高性能的工作场景感知，但要求较高的计算能力导致这些方法难以部署于低算力的平台上，本发明针对移动机器人在非结构化场景中的垃圾拾取任务，构建了一个包含12类垃圾的数据集，并以此提供一种面向非结构场景中垃圾拾取任务的高效感知方法，该方法在YOLOv4目标检测的基础上，设计了一种基于K‑means++聚类的深度信息优化方法，并结合图像形态学变化和Canny边缘检测算法实现物体角度估计,实验结果表明了本发明方法准确率高、实时性强，对于非结构化场景中的干扰信息(如背景、物体材质等)具有一定的鲁棒性。

Patent Agency Ranking