创建语义键索引的方法及系统

    公开(公告)号:CN107944027A

    公开(公告)日:2018-04-20

    申请号:CN201711320645.3

    申请日:2017-12-12

    Abstract: 本发明实施例提供一种创建语义键索引的方法。该方法包括:在对话语料库中,分析各对语句对的输入语句和回复语句的各词语的词性,提取每句语句中符合预设词性要求的各语义键;按照语义键对对话语料库中的所有语句进行聚类,每一类别的语句对应于同一语义键;利用对话语料库中的各类别的语句训练序列到序列模型,得到能够将语句映射成为实值向量的编码网络;将属于同一类别的语句利用编码网络进行编码,得到与各语义键相对应的实值向量集合;从与各语义键相对应的实值向量集合中选择多个实值向量组成记忆矩阵,在各语义键和各记忆矩阵件建立语义键索引。本发明实施例还提供一种创建语义键索引的系统。本发明实施例生成的语句具有多样性、方向性。

    基于注意力模型的语言输入关联性检测方法

    公开(公告)号:CN107358948A

    公开(公告)日:2017-11-17

    申请号:CN201710501293.5

    申请日:2017-06-27

    Inventor: 俞凯 曹迪

    Abstract: 一种基于注意力模型的语言输入关联性检测方法,通过采集训练语言模型所需的训练语料并进行预处理,并对语料中的每个词序列数据进行标注;然后使用标注后的训练序列对语言模型中的循环神经网络进行训练,再采用训练语料中所有数据集合对更新后的语言模型进行训练,当所得到的预测词的概率分布在验证集上是收敛时语言模型训练完成;最后使用训练后的语言模型对输入句子进行评分,从而得到词之间的关系。本发明采用基于注意力(attention)的方式去自动提取预测词与它们的相关关系。同时,在训练词向量时尝试引入语法和语义的信息,让词向量能够隐含更丰富的信息。通过这些技术期望可以提升语言模型的性能。

    可定制语音唤醒方法及系统

    公开(公告)号:CN106098059A

    公开(公告)日:2016-11-09

    申请号:CN201610462976.X

    申请日:2016-06-23

    Abstract: 一种可定制语音唤醒方法及系统,通过使用基于长短时记忆网络和连接时序分类模型对语音信息的音素信息进行建模并对模型进行训练,采用训练后模型进行测试并在生成的Lattice网络结构上搜索与定制的唤醒词最相似的可能音素序列来作为判断依据。本发明利用CTC模型输出后验概率稀疏的特点进行高效搜索,从而完成对唤醒词置信度计算的技术。本发明一方面可以得到较高的唤醒性,即高准确率,低误唤醒,另一方面对应用系统的计算资源消耗相对较少。

    演讲摘要生成方法及装置
    74.
    发明公开

    公开(公告)号:CN105930471A

    公开(公告)日:2016-09-07

    申请号:CN201610259492.5

    申请日:2016-04-25

    CPC classification number: G06F16/4393 G06F17/2745

    Abstract: 一种演讲摘要生成方法及装置,包括:对内容笔记、演讲幻灯片进行分析生成演讲大纲;利用演讲大纲和相关阅读材料生成扩展演讲大纲;对扩展演讲大纲分析得到与演讲知识内容相关的演讲关键字并找到演讲关键字在知识库中对应的解释条目,生成最终摘要。该方法通过对多方面的内容如内容笔记、演讲幻灯片和扩展阅读进行知识整合和扩展得到演讲摘要,并利用外部的知识库得到演讲关键字的精确解释。得到演讲内容的精确、结构化的摘要。本发明还公开了一种基于演讲幻灯片、内容笔记和扩展阅读的演讲摘要生成装置,包括演讲大纲生成模块、扩展演讲大纲生成模块和演讲关键字实体链接模块。

    文本相关声纹密码验证方法

    公开(公告)号:CN105913850A

    公开(公告)日:2016-08-31

    申请号:CN201610246535.6

    申请日:2016-04-20

    Inventor: 俞凯 王帅

    Abstract: 一种文本相关声纹密码验证方法,通过随机生成字符或字符串提示用户进行朗读,并将采集到的朗读音频中的声纹与预设的用户声纹模型进行对比分析,当内容正确且声纹一致时判定验证通过。本发明能够确保识别结果的准确率、安全性和实时性,并且方便用户使用。

    一种语音识别解码的方法及装置

    公开(公告)号:CN105895081A

    公开(公告)日:2016-08-24

    申请号:CN201610221182.4

    申请日:2016-04-11

    Abstract: 本发明公开了一种语音识别解码的方法及装置,属于语音处理领域。该方法包括:接收语音信息,提取声学特征;根据连接时序分类模型计算该声学特征的信息;若所述声学特征信息中的帧为非空模型帧,则使用适配声学建模信息的加权有限状态机进行语言学信息搜索并存储历史,否则丢弃该帧。本发明通过建立连续时序分类模型,使得声学建模更加精确;使用改进加权有限状态机,使得模型表示更为高效,减少计算和内存资源消耗近50%;在解码中使用音素同步的方法,有效减少了模型搜索的计算量和次数。

    停车场声纹验证系统及其方法

    公开(公告)号:CN105719370A

    公开(公告)日:2016-06-29

    申请号:CN201610031311.3

    申请日:2016-01-18

    Inventor: 俞凯 王帅 周伟达

    Abstract: 一种停车场声纹验证系统及其方法,包括:客户端和服务器端,其中:客户端和服务器端通过各自的通信单元相连,客户端包括声纹注册单元、声纹验证单元和信道补偿单元,其中,声纹注册单元、声纹验证单元和信道补偿单元相互连接,且都与客户端的通信单元相连,服务器端包括声纹注册响应单元、声纹验证响应单元以及道闸控制单元,其中,声纹注册响应单元和声纹验证响应单元相连,且都与服务器端的通信单元相连,道闸控制单元与声纹验证响应单元相连。本发明将人的声音作为身份凭据,能够大大提高车主身份验证的准确性,声音采集设备易于部署,且可以利用现有的移动设备作为终端,节约了设备成本。

    人机交互方法、设备、存储介质及程序产品

    公开(公告)号:CN119356580A

    公开(公告)日:2025-01-24

    申请号:CN202411414325.4

    申请日:2024-10-11

    Inventor: 陈露 俞凯 朱梓臣

    Abstract: 本申请提供一种人机交互方法、设备、存储介质及程序产品,涉及计算机技术领域,该方法包括:检测用户交互请求所指示的交互任务是否能够通过单个动作而完成;在确定用户交互任务无法通过单个动作而完成的情况下,检索与交互任务相匹配的任务响应记忆数据;基于任务响应记忆数据,将交互任务分割成子任务集;基于任务响应记忆数据,评估各个决策动作针对子任务集中相应子任务的预期完成结果;在确定各个预期完成结果均为成功的情况下,根据各个决策动作确定针对屏幕控制器的交互操作路径。由此,通过分割任务并进行逐步执行,大大增强了手机助手在面对复杂任务场景中的应对能力。

    基于知识驱动文本生成的语音识别领域自适应方法及系统

    公开(公告)号:CN117746848A

    公开(公告)日:2024-03-22

    申请号:CN202311648708.3

    申请日:2023-12-04

    Abstract: 本发明实施例提供一种基于知识驱动文本生成的语音识别领域自适应方法及系统。该方法包括:将目标领域知识输入至知识描述框架进行填充,引导大语言模型生成符合目标领域知识的目标领域文本;将目标领域文本输入至文本转语音模型,生成第一训练数据;利用第一训练数据对语音识别模型进行领域自适应的第一优化训练,利用训练后的语音识别模型输出第一训练数据的目标音频假设;将目标音频假设输入至大语言模型进行知识驱动的文本生成迭代,得到第二训练数据;利用第二训练数据对语音识别模型进行领域自适应的第二优化训练,得到领域自适应的语音识别模型。本发明实施例显著提高语音识别性能,同时优化训练出领域自适应性能更强的语音识别模型。

    基于单向自标注辅助信息的多视角语言识别方法

    公开(公告)号:CN107452374B

    公开(公告)日:2020-05-05

    申请号:CN201710561261.4

    申请日:2017-07-11

    Abstract: 一种基于单向自标注辅助信息的多视角语言识别方法,首先通过标注模型对当前词和词层面的辅助信息进行自标注,得到当前词的自标注辅助特征的概率分布;然后将自标注辅助特征的概率分布通过Viterbi解码得到相对准确的辅助特征,从而将双向辅助信息转换为单向辅助信息;再将单向辅助信息和当前词一起输入多视角语言模型进行解析,得到当前词的准确语义。本发明通过将多视角神经网络中的词层面的辅助特征,从而消除后文信息造成的负面影响,采用多种不同的词层面的辅助信息,引入具有树形结构的词层面辅助特征进行多视角语言模型训练,并且在标注模型和语言模块分别使用稳定算子来调整不同的适应各自的学习率等特点。

Patent Agency Ranking