具有多个语音理解引擎的智能语音理解系统和智能语音交互方法

    公开(公告)号:CN113936660A

    公开(公告)日:2022-01-14

    申请号:CN202111201895.1

    申请日:2021-10-15

    发明人: 武晓梅

    IPC分类号: G10L15/22 G10L15/18

    摘要: 具有多个语音理解引擎的智能语音理解系统和智能语音交互方法。智能语音理解系统包括:非采用转写的方式处理语音的第一语音理解引擎,采用转写的方式处理语音的第二语音理解引擎,以及理解结果判定单元,第一语音理解引擎的语音处理单元对语音进行处理,获得编码序列形式的语音数据,自然语言理解单元通过自然语言理解模型基于编码序列形式的语音数据来获得与语音对应的意图;第二语音理解引擎的语音处理单元对语音进行转写处理,获得文本形式的语音数据,自然语言理解单元通过自然语言理解模型基于文本形式的语音数据来获得与语音对应的意图;理解结果判定单元根据两个语音理解引擎的理解结果来判断与语音对应的意图。

    基于语用信息的语音理解模型生成方法和智能语音交互方法

    公开(公告)号:CN113488026B

    公开(公告)日:2021-12-21

    申请号:CN202111023635.X

    申请日:2021-09-02

    发明人: 武晓梅

    IPC分类号: G10L15/02 G10L15/06

    摘要: 基于语用信息的语音理解模型生成方法和智能语音交互方法,所述语音理解模型生成方法包括:对语音进行处理,获得编码序列形式的语音数据;预设语用信息分类节点;将编码序列形式的语音数据与语用信息分类节点相关联;利用编码序列形式的语音数据与语用信息分类节点的配对数据生成语音理解模型。所述方法直接从语音理解语用信息,避免语音转写为文字带来的信息损失;不受文字的限制,一套语音交互架构和对应的模型能够支持不同方言、小语种、混合语言等多种语言环境;根据语音交互的语用信息分类节点的层次来收集训练语料和训练语音理解模型,大幅降低训练所需的数据量;通过简单的关联操作,将语音交互中获得的语音用于语音理解模型的快速迭代。

    具有多个语音理解引擎的智能语音理解系统和交互方法

    公开(公告)号:CN113936660B

    公开(公告)日:2024-09-13

    申请号:CN202111201895.1

    申请日:2021-10-15

    发明人: 武晓梅

    IPC分类号: G10L15/22 G10L15/18

    摘要: 具有多个语音理解引擎的智能语音理解系统和智能语音交互方法。智能语音理解系统包括:非采用转写的方式处理语音的第一语音理解引擎,采用转写的方式处理语音的第二语音理解引擎,以及理解结果判定单元,第一语音理解引擎的语音处理单元对语音进行处理,获得编码序列形式的语音数据,自然语言理解单元通过自然语言理解模型基于编码序列形式的语音数据来获得与语音对应的意图;第二语音理解引擎的语音处理单元对语音进行转写处理,获得文本形式的语音数据,自然语言理解单元通过自然语言理解模型基于文本形式的语音数据来获得与语音对应的意图;理解结果判定单元根据两个语音理解引擎的理解结果来判断与语音对应的意图。

    基于语用信息的语音理解模型生成方法和智能语音交互方法

    公开(公告)号:CN113488026A

    公开(公告)日:2021-10-08

    申请号:CN202111023635.X

    申请日:2021-09-02

    发明人: 武晓梅

    IPC分类号: G10L15/02 G10L15/06

    摘要: 基于语用信息的语音理解模型生成方法和智能语音交互方法,所述语音理解模型生成方法包括:对语音进行处理,获得编码序列形式的语音数据;预设语用信息分类节点;将编码序列形式的语音数据与语用信息分类节点相关联;利用编码序列形式的语音数据与语用信息分类节点的配对数据生成语音理解模型。所述方法直接从语音理解语用信息,避免语音转写为文字带来的信息损失;不受文字的限制,一套语音交互架构和对应的模型能够支持不同方言、小语种、混合语言等多种语言环境;根据语音交互的语用信息分类节点的层次来收集训练语料和训练语音理解模型,大幅降低训练所需的数据量;通过简单的关联操作,将语音交互中获得的语音用于语音理解模型的快速迭代。

    具有数据管理图形用户界面的显示屏幕面板

    公开(公告)号:CN306638172S

    公开(公告)日:2021-06-25

    申请号:CN202130099402.2

    申请日:2021-02-20

    设计人: 武晓梅

    摘要: 1.本外观设计产品的名称:具有数据管理图形用户界面的显示屏幕面板。
    2.本外观设计产品的用途:用于运行程序、显示信息、用户交互和通信。
    3.本外观设计产品的设计要点:在于屏幕中的界面内容。
    4.最能表明设计要点的图片或照片:主视图。
    5.图形用户界面的用途:用于语音识别后台管理系统的数据管理;具体地,在主视图中,可以通过设置不同检索条件(例如,创建日期“Create Date”、分类“Category Path”、识别节点“Node ID”、标注节点“Expected Node”、置信度“CL%”等),点击或触摸“Submit”来查看语音数据信息和识别结果,点击或触摸“Reset”来重置检索条件;可以通过点击或触摸“Name”项下“Play”播放语音来进行核查,还可以选择“Expected Node ID”项目进行标注,点击或触摸“Clear Selected”或“Export Selected”删除或输出选定数据项,以及点击或触摸“Train Engine”启动模型自动训练。
    6.本显示屏幕面板用于电脑、手机、平板电脑、带有触摸屏的控制台。

    带语音数据标注图形用户界面的显示屏幕面板

    公开(公告)号:CN306871353S

    公开(公告)日:2021-10-08

    申请号:CN202130417510.X

    申请日:2021-02-20

    设计人: 武晓梅

    摘要: 1.本外观设计产品的名称:带语音数据标注图形用户界面的显示屏幕面板。
    2.本外观设计产品的用途:用于运行程序、显示信息、用户交互和通信。
    3.本外观设计产品的设计要点:在于屏幕中的界面内容。
    4.最能表明设计要点的图片或照片:主视图。
    5.图形用户界面的用途:用于语音识别后台管理系统的语音数据标注;具体地,在主视图中,标注人员通过“任务ID”项选择任务来获取该任务下的数据,并通过听语音(点击或触摸三角形)和选择意图(例如“投诉意向”)来进行标注。
    6.本显示屏幕面板用于电脑、手机、平板电脑、带有触摸屏的控制台。

    带语音数据标注图形用户界面的显示屏幕面板

    公开(公告)号:CN306738644S

    公开(公告)日:2021-08-06

    申请号:CN202130099403.7

    申请日:2021-02-20

    设计人: 武晓梅

    摘要: 1.本外观设计产品的名称:带语音数据标注图形用户界面的显示屏幕面板。
    2.本外观设计产品的用途:用于运行程序、显示信息、用户交互和通信。
    3.本外观设计产品的设计要点:在于屏幕中的界面内容。
    4.最能表明设计要点的图片或照片:主视图。
    5.图形用户界面的用途:用于语音识别后台管理系统的语音数据标注;具体地,在主视图中,标注人员通过“任务ID”项选择任务来获取该任务下的数据,并通过听语音(点击或触摸三角形)和选择意图(例如“AN05”)来进行标注,在进行意图选择时跳转至界面变化状态图。
    6.本显示屏幕面板用于电脑、手机、平板电脑、带有触摸屏的控制台。

    带数据标注复核图形用户界面的显示屏幕面板

    公开(公告)号:CN306638169S

    公开(公告)日:2021-06-25

    申请号:CN202130099326.5

    申请日:2021-02-20

    设计人: 武晓梅

    摘要: 1.本外观设计产品的名称:带数据标注复核图形用户界面的显示屏幕面板。
    2.本外观设计产品的用途:用于运行程序、显示信息、用户交互和通信。
    3.本外观设计产品的设计要点:在于屏幕中的界面内容。
    4.最能表明设计要点的图片或照片:主视图。
    5.图形用户界面的用途:用于语音识别后台管理系统的数据标注复核;具体地,在主视图中,通过设置检索/复核条件(例如,任务、座席、复核比例等)来提取所复核的语音数据项,并可以修改标注意图和添加复核标签,还可以通过点击或触摸“批量上传”或“删除”,实现批量上传复核后的结果或删除复核项。
    6.本显示屏幕面板用于电脑、手机、平板电脑、带有触摸屏的控制台。

    带语音识别测试图形用户界面的显示屏幕面板

    公开(公告)号:CN306638173S

    公开(公告)日:2021-06-25

    申请号:CN202130099410.7

    申请日:2021-02-20

    设计人: 武晓梅

    摘要: 1.本外观设计产品的名称:带语音识别测试图形用户界面的显示屏幕面板。
    2.本外观设计产品的用途:用于运行程序、显示信息、用户交互和通信。
    3.本外观设计产品的设计要点:在于屏幕中的界面内容。
    4.最能表明设计要点的图片或照片:主视图。
    5.图形用户界面的用途:用于语音识别后台管理系统的语音识别测试;具体地,在主视图中,可以显示对语音输入的识别结果,也可以给定分类“path”,通过点击或触摸“start”,对给定分类进行语音识别测试,并可以对识别结果进行更正。
    6.本显示屏幕面板用于电脑、手机、平板电脑、带有触摸屏的控制台。

    具有快速录音图形用户界面的显示屏幕面板

    公开(公告)号:CN306638171S

    公开(公告)日:2021-06-25

    申请号:CN202130099372.5

    申请日:2021-02-20

    设计人: 武晓梅

    摘要: 1.本外观设计产品的名称:具有快速录音图形用户界面的显示屏幕面板。
    2.本外观设计产品的用途:用于运行程序、显示信息、用户交互和通信。
    3.本外观设计产品的设计要点:在于屏幕中的界面内容。
    4.最能表明设计要点的图片或照片:主视图。
    5.图形用户界面的用途:用于语音识别后台管理系统的快速数据录入;具体地,在主视图中可以通过“Add”、“Delete”和“Upload”新建、删除和上传针对给定分类“Category Path”和节点“Expected Node”的配对语料数据,并可以通过播放语音来检查;点击或触摸“Add”后跳转至界面变化状态图,在界面变化状态图中,通过选择分类“Category Path”和节点“Expected Node”以及进行录音来生成配对语料数据。
    6.本显示屏幕面板用于电脑、手机、平板电脑、带有触摸屏的控制台。