-
公开(公告)号:CN119806324A
公开(公告)日:2025-04-11
申请号:CN202411878105.7
申请日:2024-12-19
Applicant: 桂林电子科技大学
IPC: G06F3/01 , B25J11/00 , B25J9/16 , G10L15/22 , G06V40/16 , G10L25/63 , G10L25/30 , G06V10/82 , G06N3/045
Abstract: 本发明公开了一种基于AI大模型的视觉交互多功能机器人,该产品具备独立操作及作为电脑配件的双重功能。在独立模式下,机器人通过按键唤醒、指定唤醒词或实时监听对话三种方式激活语音对话,将语音转换为文字,利用哈希算法处理后发送至大模型,并实时将大模型的回答转换为语音反馈。其创新之处在于情绪识别与表情同步能力,通过情感人工智能算法分析用户语音中的情绪特征,并实时调整表情以实现情感共鸣,提升用户体验。连接至电脑时,机器人可控制鼠标移动、点击操作,通过人脸识别解锁电脑,手势控制应用打开及模拟键盘输入,同时支持语音控制播放电影、快进、全屏等操作,显著提高工作效率和用户互动的趣味性。