一种基于固定格式的受控文本生成方法

    公开(公告)号:CN115796144B

    公开(公告)日:2023-04-28

    申请号:CN202310069803.1

    申请日:2023-02-07

    Abstract: 本发明涉及自然语言处理技术领域,公开了一种基于固定格式的受控文本生成方法,包括获取格式特征,映射格式向量,将格式向量组成格式矩阵,对格式矩阵编码得到关键字隐向量矩阵,预测的每个位置的关键字,映射关键字向量,组成关键字矩阵,得到输入隐向量矩阵,得到文本输出隐向量矩阵,预测备选文本,得到最终的生成文本;本发明能够依据生成文本的固定格式需求,使用非自回归模型同时生成文本中所有的字,提升了模型生成文本的效率。此外,本发明通过生成作为中间结果的关键字,进一步提升了模型生成文本的质量。

    一种基于数据合成和两阶段自训练的低资源关系抽取方法

    公开(公告)号:CN115618022B

    公开(公告)日:2023-04-28

    申请号:CN202211630125.3

    申请日:2022-12-19

    Abstract: 本发明涉及数据合成领域,公开了一种基于数据合成和两阶段自训练的低资源关系抽取方法,包括数据合成方法和两阶段自训练框架,数据合成有效缓解了当前关系抽取任务中标注数据少,标注成本大的问题。两阶段自训练框架在每轮迭代中依次使用无标注生成数据和有标注数据训练模型,一方面可以促进模型从无标注生成数据和有标注数据中协同学习,另一方面也有效降低了生成数据噪音的影响。本发明贴合真实场景中的低资源情况,能够更有效地利用现有的预训练语言模型。

    一种基于音素记忆的音译方法、电子设备及存储介质

    公开(公告)号:CN115662392A

    公开(公告)日:2023-01-31

    申请号:CN202211595293.3

    申请日:2022-12-13

    Inventor: 宋彦 田元贺

    Abstract: 本发明公开了一种基于音素记忆的音译方法、电子设备及存储介质,包括:1、抽取音译单词并拆分为字母,2、构建音素库,并提取与每个字母关联的音素特征;3、构建L层的编码器,对字母编码,得到每一层与每个字母对应的字母编码向量;4、建立L层的音素记忆网络,用于字母编码向量和音素特征的建模,得到字母编码矩阵;5、将字母编码矩阵和前t时刻分类器输出的目标字母一起输入L层的解码器中,并将得到的t时刻解码器输出的字母预测向量送入分类器,得到t时刻预测的目标字母;6、把t+1赋予t,重复执行步骤5,直至时刻T,从而得到预测的字母序列。本发明旨在将音素特征融合进标准的文本生成过程中,从而能提高音译的质量和效果。

    一种语音样本混淆方法及装置
    84.
    发明公开

    公开(公告)号:CN115497464A

    公开(公告)日:2022-12-20

    申请号:CN202211137162.0

    申请日:2022-09-19

    Abstract: 本申请公开了一种语音样本混淆方法及装置,在该方法中,获取属于多个语音数据源的多个语音样本对应的多个样本索引;按照预设块大小对多个样本索引分块得到多个块索引;混淆多个块索引得到混淆后的多个块索引,实现多个语音数据源粒度的语音样本混淆;从混淆后的多个块索引中选取预设数量的块索引作为多个待处理块索引;将多个待处理块索引包括的样本索引划分成多个批量索引;混淆多个批量索引得到混淆后的多个批量索引,实现多个批量语音样本粒度的语音样本混淆;通过混淆后的多个批量索引包括的样本索引,获取多个待处理语音样本。由此,实现对海量语音样本的充分、全局混淆,提高模型训练过程的稳定性。

    一种流式端到端语音识别模型、电子设备和存储介质

    公开(公告)号:CN114999466A

    公开(公告)日:2022-09-02

    申请号:CN202210581209.6

    申请日:2022-05-26

    Abstract: 本申请公开了一种流式端到端语音识别模型和电子设备,该模型用于配置于电子设备,具体包括由联合网络整合的解码器和编码器。解码器包括VGG(Visual Geometry Group,视觉几何组)模块,该VGG模块用于采用流式卷积的方法对输入的音频信号进行卷积处理;编码器包括LSTM神经网络。由于本方案采用流式卷积,不依赖于下一帧信息,因此能够消除卷积模型的时延问题,从而降低了语音识别的时延,进而能够提高用户的产品体验。

    一种基于低频字存储记忆的文本识别方法及系统

    公开(公告)号:CN113221884A

    公开(公告)日:2021-08-06

    申请号:CN202110522161.7

    申请日:2021-05-13

    Abstract: 本发明涉及一种基于低频字存储记忆的文本识别方法及系统,其方法包括:S1:统计训练集中低频字;S2:将待识别的文本行图像进行预处理后,将其输入卷积神经网络以及循环神经网络,获得序列特征;S3:根据序列特征和低频字,利用带注意力机制的解码器,分别获得序列特征的上下文信息和低频字的关联特征;S4:将序列特征的上下文信息与低频字关联特征分别经过一个门控机制,获得各自的置信度;将二者的置信度进行融合,得到文本行图像的识别结果。本发明提供的方法,在识别过程中不仅使用了文本图像的上下文信息,还利用注意力机制将低频字的关联特征引入到每一帧的文字识别中,引入门控机制以防止低频字的关联特征对非低频字的识别造成干扰。

    一种机器翻译增强训练方法及系统

    公开(公告)号:CN113204978A

    公开(公告)日:2021-08-03

    申请号:CN202110523435.4

    申请日:2021-05-13

    Abstract: 本发明涉及一种机器翻译增强训练方法及系统,其方法包括:S1:获取训练数据,训练数据包括:源端句子和目标端句子;S2:分别使用源端句子和目标端句子训练源端语言模型和目标端语言模型;S3:随机选择源端句子中子词,并根据源端句子构造移位后的句子,输入源端语言模型,对移位后的句子中对应的子词进行预测,根据预测结果进行加权求和,实现对源端句子的增强;S4:根据源端句子和目标端句子的注意力权重分布,并根据源端句子中子词替换目标端句子中对应子词,利用语言模型和神经机器翻译模型联合预测结果,以实现对目标端句子的增强。本发明通过对平行训练数据进行加噪和增强,从而提升低资源条件下神经机器翻译模型的训练效果和鲁棒性。

    远程图像/语音自动传输监控系统

    公开(公告)号:CN1269575A

    公开(公告)日:2000-10-11

    申请号:CN00104208.4

    申请日:2000-03-10

    Abstract: 本发明涉及一种远程图像/语音自动传输监控系统,该系统由装在监控中心的一套(或两套)控制中心装置和分别安装在不同远端监控站点的多个远端图像/语音处理装置构成,且控制中心装置和远端图像/语音处理装置分别与电话交换网的电话线相连。远端图像/语音处理装置将现场采集的图像及语音信号压缩编码后经电话线送至监控中心的控制中心装置,控制中心将经电话线传输的压缩编码图像及语音数据进行解压缩处理,并再现远端图像及音响。

    一种图像/语音前端处理装置

    公开(公告)号:CN2410710Y

    公开(公告)日:2000-12-13

    申请号:CN00204487.0

    申请日:2000-03-10

    Abstract: 一种图像/语音前端处理装置,其可对图像信号和语音信号进行模数转换,并按国际电信联盟ITU-T的H.324协议进行压缩编码,数据打包,然后经调制解调电路由电话交换网络的电话线向电话交换网的特定用户传输,特定用户的设备在收到图像/语音前端处理装置发送来的信号后,对打包压缩的图像/语音信息依据国际电信联盟ITU-T的H.324协议进行码流分组,解压解码,使图像/语音前端处理装置所配接的摄像头及话筒采集的现场图像信号和语音信号得以再现。

Patent Agency Ranking