-
公开(公告)号:CN119336436A
公开(公告)日:2025-01-21
申请号:CN202411529054.7
申请日:2024-10-30
Applicant: 科大讯飞股份有限公司
IPC: G06F9/451 , G10L15/22 , G10L15/26 , G10L15/18 , G10L15/34 , G06F40/30 , G06F16/35 , G06N3/091 , G06N5/04 , G06F3/04883 , G06F3/0488 , G06F21/62
Abstract: 本发明提供一种人机交互方法、装置、设备及介质,其中方法包括:获取用户端的端侧数据,端侧数据包括用户输入数据和端侧采集数据中的至少一种;基于端侧大模型,生成与端侧数据对应的交互信息;端侧大模型是设置在用户端所在的本地设备处的大型语言模型;执行交互信息。本发明提供的人机交互方法、装置、设备及介质,通过在本地部署端侧大模型,实现用户端自带推理和决策能力,即使在无网络情况下,也能高效运行,确保持续的交互体验。同时,由于本地端侧大模型处理避免了数据上传至云端,显著降低了隐私风险,因此能够灵活应用个性化数据处理交互任务,生成更符合用户需求的交互响应,克服了传统方法依赖预设规则、灵活性不足的局限性。
-
公开(公告)号:CN119160206A
公开(公告)日:2024-12-20
申请号:CN202411521347.0
申请日:2024-10-29
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种车辆急刹车预测方法、装置、存储介质及设备,该方法包括:首先获取目标车辆的行驶数据;其中,行驶数据包括目标车辆的车况信息、目标车辆所处的环境数据信息、交通路况信息以及所在城市的道路历史信息,然后对目标车辆的行驶数据进行标准化处理,并提取出处理后的行驶数据所对应的目标特征向量;接着将目标特征向量输入至预先构建的车辆急刹车预测模型,预测得到目标车辆发生急刹车的预测结果。并在该预测结果表明目标车辆即将发生急刹车时,向目标车辆的车载乘客发送急刹车预警提示信息,以便乘客提前做好心理预期,从而能够减少其晕眩感的发生,进而提高乘客的乘车体验及乘车安全性。
-
公开(公告)号:CN118918897A
公开(公告)日:2024-11-08
申请号:CN202411169085.6
申请日:2024-08-23
Applicant: 科大讯飞股份有限公司
IPC: G10L15/26 , G10L15/22 , G10L15/18 , G06F3/04817 , G06F40/151 , G06F40/30 , G06F18/22
Abstract: 本发明提供一种语音交互方法、装置、电子设备和存储介质,其中方法包括:接收用户语音,并确定在接收用户语音时界面显示的各图标控件;基于用户语音的转写文本分别与各图标控件的图标图片之间的语义匹配度,从各图标控件中确定出与转写文本相匹配的图标控件;基于转写文本,以及与转写文本相匹配的图标控件,进行语音交互。本发明提供的方法、装置、设备和介质,基于用户语音的转写文本分别与各图标控件的图标图片之间的语义匹配度,从各图标控件中确定出与转写文本相匹配的图标控件,能够支持高自由度的图标控件的指代描述方式。在此基础上,结合转写文本以及与转写文本相匹配的图标控件,进行语音交互,能够有效保障语音交互的成功率。
-
公开(公告)号:CN118331529A
公开(公告)日:2024-07-12
申请号:CN202410329537.6
申请日:2024-03-21
Applicant: 科大讯飞股份有限公司
IPC: G06F3/16
Abstract: 本发明提供一种音效调节方法、装置、电子设备和存储介质,涉及音频技术领域,其中方法包括:在目标空间下依次播放对目标音频基于预设时长进行切分后的各第一音频信号;在播放当前第一音频信号时,采集所述目标空间中的第二音频信号;基于所述第二音频信号和所述当前第一音频信号,确定残余音频信号;基于目标调节系数和初始空间播放时长确定目标播放时长;所述目标调节系数为基于用户选择的目标播放体验模式确定的调节系数;在播放下一第一音频信号时,基于所述目标播放时长播放所述残余音频信号。本发明能够基于用户选择的不同播放体验模式确定不同的目标调节系数,基于不同的目标调节系数确定的目标播放时长也不同,从而能够实现混响可调。
-
公开(公告)号:CN118205507A
公开(公告)日:2024-06-18
申请号:CN202410313942.9
申请日:2024-03-19
Applicant: 科大讯飞股份有限公司
IPC: B60R16/037
Abstract: 本申请公开了一种辅助车载乘客睡眠的方法、装置、相关设备及计算机程序产品,涉及汽车座舱音效技术领域,方案通过识别车内乘客是否存在主动睡眠的意图,当识别到乘客存在主动睡眠意图时,通过音频播放设备播放用于助眠的音频内容,从而营造良好的车内小憩环境,辅助乘客更快速的进入睡眠状态。同时,本申请还可检测乘客的睡眠状态并应指导音频播放内容和音效模式,更加满足用户的睡眠需求,进一步促进车内乘客快速进入睡眠,使得乘客能够很好地在车内休息,提升了用户的用车体验。
-
公开(公告)号:CN111860292B
公开(公告)日:2024-06-07
申请号:CN202010688604.5
申请日:2020-07-16
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种基于单目相机的人眼定位方法、装置以及设备。本发明的构思在于,通过单目相机以及参考点预先标定出驾驶员个体的刚体参数,即驾驶员真实的瞳距特征信息,以此作为后续定位操作的基础,而在实际定位阶段则由对应关系读取当前驾驶员的瞳距特征信息,并结合实时采集的2D图像的信息,测算驾驶员眼睛在真实空间中的位置。本发明与现有基于单目相机测距的方案像相比能够显著提升定位精度,并且具有成本低、操作便捷的优势,易于广泛施用在DSM领域中。
-
公开(公告)号:CN112509007B
公开(公告)日:2024-06-04
申请号:CN202011474779.2
申请日:2020-12-14
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种真实注视点定位方法以及头戴式视线跟踪系统。针对传统视线跟踪方案需要增加额外专用的头部姿态定位辅助设备才能正确估算视线真实注视点这一问题,本发明的构思在于通过头部随动摄像装置实时拍摄的真实世界的场景图像与预先设置的标记物相结合,将用户在场景图像中的注视点位置与真实世界建立对应关联,这样便可以在节省成本、简化设置以及规避额外噪声引入的前提下,有效消除头部姿态变化带来的误差,进而在获得准确的真实注视点位置的同时,改善用户对于视线跟踪的操作体验。
-
公开(公告)号:CN117930968A
公开(公告)日:2024-04-26
申请号:CN202311780196.6
申请日:2023-12-21
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供一种图片生成方法、装置、系统、设备及存储介质,方法包括:在基于用户提供的待生成图片的描述信息生成第一图片后,检测用户执行的动作;确定与所述用户执行的动作对应的图片生成要求,所述图片生成要求表示基于所述待生成图片的描述信息重新生成图片时所应满足的要求;按照所述图片生成要求,生成与所述待生成图片的描述信息对应的第二图片。本申请用以解决现有技术中在多次生成图片时产生的交互过程繁琐的缺陷,实现了交互过程的简单化和便捷化。
-
公开(公告)号:CN117877475A
公开(公告)日:2024-04-12
申请号:CN202311847695.2
申请日:2023-12-27
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种基于环境的语音交互结果呈现方法、装置及存储介质。所述方法实现了基于车辆相关数据自动判定当前场景信息,并实现了基于车辆相关数据对车机消息提供多种消息输出策略,以适应场景变化的应用需求,从而给用户带来更佳的交互体验。
-
公开(公告)号:CN117851564A
公开(公告)日:2024-04-09
申请号:CN202311847712.2
申请日:2023-12-27
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/338 , G06F16/34
Abstract: 本申请公开了一种基于环境的语音交互结果呈现方法、装置、设备及存储介质。所述方法实现了结合车辆相关数据,在用户与车机交互时能够结合车辆相关数据控制车机回复内容的精简情况,从而提供了更加个性化、智能化的回复内容和更加友好、流畅的交互体验。
-
-
-
-
-
-
-
-
-