一种融合闲聊和常识的多技能任务型对话系统构建方法

    公开(公告)号:CN114153955B

    公开(公告)日:2023-04-07

    申请号:CN202111334457.2

    申请日:2021-11-11

    摘要: 本发明涉及对话系统,具体涉及一种融合闲聊和常识的多技能任务型对话系统构建方法,收集大规模开源的中文闲聊语料,将相邻对话作为闲聊语料对,并构建闲聊模型,收集大规模各领域的常识问答语料以及三元组数据,构建知识图谱,基于常识问答语料训练相似度打分模型,对原始问题进行处理得到候选实体集合,从知识图谱中获取相关两跳关系内所有出度和入度的关系,并得到最终候选实体,利用最终候选实体筛选出实体关系路径,并对实体关系路径进行优选得到最终路径,基于最终路径从知识图谱中查询常识答案,完成常识对话模型的构建;本发明提供的技术方案能够有效克服现有技术所存在的无法兼具常识推理能力和闲聊功能、对话回复召回准确性较低的缺陷。

    一种基于深度学习的语义端点检测系统

    公开(公告)号:CN115132178A

    公开(公告)日:2022-09-30

    申请号:CN202210836360.X

    申请日:2022-07-15

    摘要: 本发明公开了一种基于深度学习的语义端点检测系统,涉及语义端点检测技术领域,解决了现有技术中语音端点检测不准的技术问题;包括:音频信息采集模块、语音特征提取模块、音频片段能量判断模块、信息提取触发器、单轮语义端点检测模块、多轮语义端点检测模块、语音语义多模态端点检测模块以及语音语义端点检测汇总模块;本发明在端点检测中,分别对单轮、多轮和序列化的对话进行语义分析,使端点检测不仅有语音的声学特征还同时具有语义特征,真正做到了智能化、拟人化的端点检测,极大提升了人机对话的流畅度和智能度。

    一种基于深度学习模型的通话状态检测分类方法

    公开(公告)号:CN115022466A

    公开(公告)日:2022-09-06

    申请号:CN202210803213.2

    申请日:2022-07-07

    摘要: 本发明公开了一种基于深度学习模型的通话状态检测分类方法,涉及通话状态检测技术领域,解决了现有技术在通话状态检测过程中,能够处理的音频类型少,以及数据处理量大,导致通话状态检测效果难以满足要求的技术问题;本发明包括:获取基础语音数据,对基础语音数据进行语音预处理之后获取训练语音数据;通过训练语音数据对深度学习模型进行训练获取状态识别模型;当缓存的用户音频数据超过数据阈值时,进行VAD过滤获取目标音频段,并结合通话状态检测平台对目标音频段进行分析;本发明通过VAD切分标注去除无效音频段,提升了标注效率;在训练过程中有效避免了存储空间的局限性,增强状态识别模型泛化能力,提升状态识别模型的精度。

    一种多模态监督服务系统及方法
    14.
    发明公开

    公开(公告)号:CN112700255A

    公开(公告)日:2021-04-23

    申请号:CN202011578972.0

    申请日:2020-12-28

    摘要: 本发明公开了一种多模态监督服务系统及方法,包括文本情绪判别模块、面部情绪判别模块和综合情绪判别模块;所述文本情绪判别模块用于将语音信息转换成文本信息并判断该文本信息代表的情绪特征及概率;所述面部情绪判别模块用于提取面部信息并判断该面部信息代表的情绪特征及概率;所述综合情绪判别模块用于将文字情绪判别模块和面部情绪判别模块输入的情绪概率加权计算得到最终的情绪判别结果。通过客服人员说话内容情绪判别与面部表情判别相结合,保证判别结果的准确性;进行逐句抓取实时判断,保证监督的及时性,使得客服人员可以以最好的状态为用户提供服务,提升业务服务效果及水平用。

    一种提供分布式NLP能力服务的装置及方法

    公开(公告)号:CN111881174A

    公开(公告)日:2020-11-03

    申请号:CN202010585152.8

    申请日:2020-06-24

    IPC分类号: G06F16/2458 G06F16/35

    摘要: 本发明提出的一种提供分布式NLP能力服务的装置,包括:解码实体构建模块、业务模块和业务路由模块;解码实体构建模块,用于获取NLP模型,并根据NLP模型构建用于对待测语句进行解码的解码实体;业务模块与解码实体构建模块连接;业务模块内构建有多个对应不同业务领域的业务进程;业务路由模块与业务模块连接,用于根据各业务进程的心跳信息识别其解码能力,并用于将待测语句分发到对应的业务进程进行解码并返回解码结果。本发明提出的一种提供分布式NLP能力服务的装置,采用统一接口格式接入不同类型的NLP模型构建解码实体,同时通过业务进程和路由进程实现整个NLP能力的平台化,能支持各类NLP模型能力的横向扩展,保证解码能力。

    一种深度学习模型的自动化训练与测试系统

    公开(公告)号:CN112699994B

    公开(公告)日:2024-07-02

    申请号:CN202011566027.9

    申请日:2020-12-25

    IPC分类号: G06N3/0499 G06N3/063 G06N3/08

    摘要: 本发明公开了一种深度学习模型的自动化训练与测试系统,包括用户端、管理服务器、若干执行服务器和文件服务器;所述用户端包括web界面和应用后台;所述管理服务器用于分发任务至资源充足的执行服务器,并将执行服务器反馈的任务进度经应用后台反馈至web界面;所述执行服务器用于执行任务,同时采用固定频率心跳保存对应epoch算法效果及任务进度,并同步给管理服务器维护;所述文件服务器用于存储训练/测试用数据集,训练后生成的训练结果文件,以及测试后生成的测试结果文件;所述管理服务器周期性获取所有执行服务器的资源信息,以及正在进行的任务列表详情。本发明极大降低了人工智能算法模型的使用门槛,有效缩短项目开发周期。

    一种用于人机融合客服系统的自动地址纠偏方法

    公开(公告)号:CN112860724B

    公开(公告)日:2024-04-26

    申请号:CN202011566029.8

    申请日:2020-12-25

    摘要: 本发明公开了一种用于人机融合客服系统的自动地址纠偏方法,先通过ASR模型将地址语音转换为地址文本,再通过NLP模型处理地址文本形成修正地址文本,再获取地址信息的结构化数据,最后输入第三方地图供应商的POI查询接口获取最终地址信息;对用于NLP模型训练的数据集中的每一个输入样本进行拼音编码,并按照常见语音错误对其进行混淆处理,形成该输入样本的混淆集,将输入样本连同其混淆集一起作为扩增输入样本,对NLP模型进行训练。本发明针对地址语音存在的常见语音错误,利用输入样本的拼音编码及其混淆集对NLP模型的训练数据进行扩增,具备辨别常见语音错误的能力,在自然语言处理这一步实现初步纠偏。

    一种基于深度学习的语义端点检测系统

    公开(公告)号:CN115132178B

    公开(公告)日:2023-01-10

    申请号:CN202210836360.X

    申请日:2022-07-15

    IPC分类号: G10L15/02 G10L15/05 G10L15/18

    摘要: 本发明公开了一种基于深度学习的语义端点检测系统,涉及语义端点检测技术领域,解决了现有技术中语音端点检测不准的技术问题;包括:音频信息采集模块、语音特征提取模块、音频片段能量判断模块、信息提取触发器、单轮语义端点检测模块、多轮语义端点检测模块、语音语义多模态端点检测模块以及语音语义端点检测汇总模块;本发明在端点检测中,分别对单轮、多轮和序列化的对话进行语义分析,使端点检测不仅有语音的声学特征还同时具有语义特征,真正做到了智能化、拟人化的端点检测,极大提升了人机对话的流畅度和智能度。

    一种融合闲聊和常识的多技能任务型对话系统构建方法

    公开(公告)号:CN114153955A

    公开(公告)日:2022-03-08

    申请号:CN202111334457.2

    申请日:2021-11-11

    摘要: 本发明涉及对话系统,具体涉及一种融合闲聊和常识的多技能任务型对话系统构建方法,收集大规模开源的中文闲聊语料,将相邻对话作为闲聊语料对,并构建闲聊模型,收集大规模各领域的常识问答语料以及三元组数据,构建知识图谱,基于常识问答语料训练相似度打分模型,对原始问题进行处理得到候选实体集合,从知识图谱中获取相关两跳关系内所有出度和入度的关系,并得到最终候选实体,利用最终候选实体筛选出实体关系路径,并对实体关系路径进行优选得到最终路径,基于最终路径从知识图谱中查询常识答案,完成常识对话模型的构建;本发明提供的技术方案能够有效克服现有技术所存在的无法兼具常识推理能力和闲聊功能、对话回复召回准确性较低的缺陷。

    一种用于人机融合客服系统的自动地址纠偏方法

    公开(公告)号:CN112860724A

    公开(公告)日:2021-05-28

    申请号:CN202011566029.8

    申请日:2020-12-25

    摘要: 本发明公开了一种用于人机融合客服系统的自动地址纠偏方法,先通过ASR模型将地址语音转换为地址文本,再通过NLP模型处理地址文本形成修正地址文本,再获取地址信息的结构化数据,最后输入第三方地图供应商的POI查询接口获取最终地址信息;对用于NLP模型训练的数据集中的每一个输入样本进行拼音编码,并按照常见语音错误对其进行混淆处理,形成该输入样本的混淆集,将输入样本连同其混淆集一起作为扩增输入样本,对NLP模型进行训练。本发明针对地址语音存在的常见语音错误,利用输入样本的拼音编码及其混淆集对NLP模型的训练数据进行扩增,具备辨别常见语音错误的能力,在自然语言处理这一步实现初步纠偏。