-
公开(公告)号:CN117113972A
公开(公告)日:2023-11-24
申请号:CN202310667063.1
申请日:2023-06-07
Applicant: 上海理工大学
IPC: G06F40/211 , G10L15/26 , G10L15/22 , G06F40/30 , G06F40/268 , G06F18/25 , G06F18/241 , G06F18/2415 , G06F40/289 , G06N3/042 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/048
Abstract: 本发明公开了一种基于情感检测的仿生机器人表情生成方法,该系统包括交互用户、仿生机器头、计算机终端、语音采集和播放装置;整个系统可分为微表情控制指令生成和微表情动作执行两部分,在人机对话过程中,仿生机器头通过语音采集装置和语音识别模块获取用户输入文本信息,然后将输入文本信息分别经过文本对话模块和文本情感检测TSDM模块获得生成文本信息、用户输入情感,再将生成文本信息分别经过文本情感检测TSDM模块和文本转音频模块获得仿生机器头的生成情感和生成音频信息,最后根据用户输入情感和生成情感获得仿生机器头表情控制指令进而控制机器头舵机转动实现微表情动作,本发明,具有自发性的特点。
-
公开(公告)号:CN111251312B
公开(公告)日:2022-11-01
申请号:CN202010054203.4
申请日:2020-01-17
Applicant: 上海理工大学
Abstract: 本发明提出一种基于全向麦克纳姆轮平台的乒乓球机器人,包括四目视觉系统、视觉处理上位机、全向移动小车、六自由度机械臂和机械控制下位机;其中,六自由度机械臂和机械控制下位机均设于全向移动小车上,机械控制下位机驱动全向移动小车位移以及驱动六自由度机械臂;四目视觉系统与视觉处理上位机信号连接、视觉处理上位机与机械控制下位机信号连接,以提出一种实现精准、快速击球,并且可以大范围移动以处理各种路线乒乓球的乒乓球机器人。
-
公开(公告)号:CN115187905A
公开(公告)日:2022-10-14
申请号:CN202210835850.8
申请日:2022-07-15
Applicant: 上海理工大学
Abstract: 工作场景感知是机器人高效实现指定任务的重要前提,得益于深度学习的发展,现有方法可实现高性能的工作场景感知,但要求较高的计算能力导致这些方法难以部署于低算力的平台上,本发明针对移动机器人在非结构化场景中的垃圾拾取任务,构建了一个包含12类垃圾的数据集,并以此提供一种面向非结构场景中垃圾拾取任务的高效感知方法,该方法在YOLOv4目标检测的基础上,设计了一种基于K‑means++聚类的深度信息优化方法,并结合图像形态学变化和Canny边缘检测算法实现物体角度估计,实验结果表明了本发明方法准确率高、实时性强,对于非结构化场景中的干扰信息(如背景、物体材质等)具有一定的鲁棒性。
-
公开(公告)号:CN119665941A
公开(公告)日:2025-03-21
申请号:CN202411582660.5
申请日:2024-11-07
Applicant: 上海理工大学
Abstract: 本发明公开了一种感知障碍物的更新方法、装置、整车控制器及介质,包括获取每个检测装置环境点云数据,并根据装置的感知范围构建对应的视锥体模型;对环境点云数据采样和坐标转换后得到每个检测时刻的环境点云数据中的当前障碍物数据和历史障碍物数据,通过判断历史障碍物数据中的每一组障碍物点与每个视锥体模型之间的空间位置关系,来更新每个视锥体模型的历史障碍物数据和当前障碍物数据中对应的计数值;最后根据计数值来将每个视锥体模型中更新后的当前障碍物数据和历史障碍物数据进行融合,得到当前环境下的导航地图。本发明方案解决了现有的机器人障碍物感知技术的感知精度低,从导致机器人动态避障能力不够高效的问题。
-
公开(公告)号:CN116741140A
公开(公告)日:2023-09-12
申请号:CN202310773458.X
申请日:2023-06-28
Applicant: 上海理工大学
Abstract: 本发明公开了一种基于中文分词优化的中文语音合成方法:首先利用基于加权自蒸馏的中文分词模型CWS‑WSD将医疗服务机器人交互过程中产生的回复文本进行分词,明确文本中的词汇边界,然后根据分词结果插入相应的停顿标志符,最后将插入标识符后的文本送入Tacotron2进行语音合成。本发明通过在语音合成过程中事先对中文文本进行中文分词,来为文本加入词汇边界,进而在生成的语音中对应地加入停顿来缓解前述提到的歧义和交互质量的问题。
-
公开(公告)号:CN119360269A
公开(公告)日:2025-01-24
申请号:CN202411381144.6
申请日:2024-09-29
Applicant: 上海理工大学
IPC: G06V20/40 , G06V10/44 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/096
Abstract: 本发明公开了一种应用于跨领域场景的多模型协同学习行为识别方法,步骤包括:模型预训练、输出伪标签集、模型更新、模型部署。本发明方法本通过融合历史预测信息,以及跨模型集成等技术缓解了现有方法中伪标签预测不稳定的现象。相较于现有方法,目标域伪标签质量提升较大,进而取得更优的跨域识别效果。同时,通过引入双模型结构,缓解了样本特征表征能力不足的问题,取得了更优的跨域行为识别效果。
-
公开(公告)号:CN115213902A
公开(公告)日:2022-10-21
申请号:CN202210840815.5
申请日:2022-07-18
Applicant: 上海理工大学
Abstract: 本发明公开了一种基于改进型角度估计的机械臂抓取方法,包括:S1、将机器人放入非结构化场景中进行目标物体信息采集;S2、通过one‑stage检测器对步骤S1中的目标物体信息采集进行检测,输出目标物体的边界框信息;S3、将步骤S1中的目标物体信息与步骤S2中边界框信息进行结合,通过K‑means++算法将框内所有像素点的深度值聚类为三类,将聚类中心值作为抓取点到相机成像镜头的距离;S4、将上述的聚类中心的点坐标和剔除异常点的深度信息根据相应的运算得到真实世界中的抓取坐标;S5、使用Canny检测图像信息,并求解最小外接矩阵,获取物体主方向角度。根据本发明,能够迅速在复杂场景中获取物体抓取角度。
-
公开(公告)号:CN111251312A
公开(公告)日:2020-06-09
申请号:CN202010054203.4
申请日:2020-01-17
Applicant: 上海理工大学
Abstract: 本发明提出一种基于全向麦克纳姆轮平台的乒乓球机器人,包括四目视觉系统、视觉处理上位机、全向移动小车、六自由度机械臂和机械控制下位机;其中,六自由度机械臂和机械控制下位机均设于全向移动小车上,机械控制下位机驱动全向移动小车位移以及驱动六自由度机械臂;四目视觉系统与视觉处理上位机信号连接、视觉处理上位机与机械控制下位机信号连接,以提出一种实现精准、快速击球,并且可以大范围移动以处理各种路线乒乓球的乒乓球机器人。
-
公开(公告)号:CN119540102A
公开(公告)日:2025-02-28
申请号:CN202411582877.6
申请日:2024-11-07
Applicant: 上海理工大学
Abstract: 本发明涉及图像处理技术领域,公开了一种地图的矫正方法、装置、计算机设备及存储介质,包括获取待矫正的初始地图图像,提取初始地图图像中的多条直线,在图像坐标系中提取对应的直线参数,所述直线参数包括直线的在所述图像坐标系中夹角的角度值;根据每个角度值在所述多条直线参数中出现的次数选择最优旋转校准角度;将初始地图图像上的每个点按照所述最优旋转校准角度进行旋转校准得到矫正后的地图图像。本发明方案解决了现有的地图矫正过程中的计算量大,训练时间长,且不能适用各种场景的问题。
-
公开(公告)号:CN115034394A
公开(公告)日:2022-09-09
申请号:CN202210817062.6
申请日:2022-07-12
Applicant: 上海理工大学
Abstract: 本发明公开了一种软硬件结合的视觉深度学习模型推理加速方法,包括:S1、根据视觉任务,训练原始深度学习模型;S2、针对所有网络层,利用权值大小挑选不重要的滤波器;S3、移除当前层不重要滤波器,判断剪枝前后模型精度;S4、进行判断模型精度下降是否明显;S5、机型判断是否所有层处理完毕;S6、进行全局优化网络,计算模型精度;S7、模型部署TensorRT&多线程处理。根据本发明,能够运用在任何需要部署到边缘设备的视觉深度学习模型中,在基本保持模型推理精度的同时,有效提升模型的推理速度。
-
-
-
-
-
-
-
-
-