-
公开(公告)号:CN118280370A
公开(公告)日:2024-07-02
申请号:CN202410465020.X
申请日:2024-04-17
Applicant: 华院计算技术(上海)股份有限公司
Abstract: 本申请提供一种通过语音实时交互的数字人生成方法及系统。技术方案包括如下步骤:首先,输入实时交互的音频;其次,采用流式语音识别模型进行音频识别;然后,将识别到的文字输入到大模型,大模型流式输出相应结果;之后,将结果进行处理后输入语音合成模型,进行半流式输出;最后,将输出的语音输入到相应的渲染模型,得到最后相应的互动结果。本申请技术方案利用流式技术,并结合相应的文本算法,能实现流畅的语音实时交互数字人。
-
公开(公告)号:CN118885559A
公开(公告)日:2024-11-01
申请号:CN202410480369.0
申请日:2024-04-19
Applicant: 华院计算技术(上海)股份有限公司
IPC: G06F16/33 , G06F16/332 , G06N5/04
Abstract: 本申请提供一种融合向量化检索与大模型技术的实时互动答疑系统、方法及设备,包括:保存和展示用户预设的问题和答案;接收到的问题通过预设的深度学习模型转化为高维向量表示后,将预设的问题和答案向量化并保存在向量数据库中;对向量数据库存储中预设的问题和答案进行相似度匹配以查找最相关的问题和答案;在相似度匹配结果不满足预设阈值时,利用所述大模型对问题进行理解和推理,生成答案;根据用户的反馈和基础数据调整更新检索策略和大模型输出,实现系统的持续学习与优化。所述实时互动答疑系统主要用途在于为用户提供快速、准确且具有连续对话能力的智能答疑服务,解决现有技术中对于复杂多变的用户需求响应速度慢、准确率不高的技术问题。
-