标点添加方法、服务器和客户端设备

    公开(公告)号:CN116629213A

    公开(公告)日:2023-08-22

    申请号:CN202310445263.2

    申请日:2023-04-21

    Abstract: 本发明提供一种标点添加方法、服务器和客户端设备,涉及自然语言处理技术领域,该方法包括:接收客户端设备发送的待添加标点的初始文本,并提取初始文本的文本特征;基于用户行为特征、文本特征和标点预测模型确定初始文本的标点预测结果;基于标点预测结果为初始文本添加标点,得到目标文本,并将目标文本发送给客户端设备;其中,用户行为特征用于表征用户的标点添加习惯;标点预测模型是基于不同用户的带标点样本文本和带标点样本文本对应的用户行为样本特征,对初始标点预测模型进行训练得到的。本发明提供的技术方案能够实现个性化的文本标点预测,得到与用户标点使用习惯相匹配的带标点文本,个性化程度高。

    语音识别方法、装置、设备及存储介质

    公开(公告)号:CN115512695A

    公开(公告)日:2022-12-23

    申请号:CN202211134105.7

    申请日:2022-09-15

    Abstract: 本申请公开了一种语音识别方法、装置、设备及存储介质,本申请配置的语音识别模型通过第一语音分类层基于语音编码器输出的语音编码特征预测得到初始预测文本,文本编码器对初始预测文本进行编码,将文本编码特征和语音编码特征融合,将融合编码特征输入到共享编码器中进行二次编码,并由第二语音分类层基于二次编码特征得到最终预测文本。由于语音识别模型整体上能够提取到更加丰富的融合编码特征,因此能够进一步提升识别准确度。此外,由于语音识别模型包含有文本编码器和共享编码器,因而在训练过程可以额外使用纯文本数据对文本编码器和共享编码器进行训练,纯文本数据相比于语音的标注文本其更容易大量的获取,极大降低了人工标注成本。

    一种前馈序列记忆神经网络及其构建方法和系统

    公开(公告)号:CN106919977B

    公开(公告)日:2022-05-17

    申请号:CN201510998704.7

    申请日:2015-12-25

    Abstract: 本发明公开了一种前馈序列记忆神经网络及其构建方法和系统,该前馈序列记忆神经网络包括:至少三层的多个节点,第一层为输入层,最后一层为输出层,其它位于输入层和输出层之间的多个节点组成至少一个隐层,每一个隐层都包含一个记忆块,隐层与记忆块共同构成双向前馈序列记忆神经网络FSMN层,该记忆块用于存储每帧输入信息的历史信息和未来信息。由于该双向FSMN层包括记忆块,通过该记忆块存储每帧输入信息的历史信息和未来信息,可以利用训练数据的长时信息,并且该过程无需通过双向循环反馈,可以保证信息处理效率。

    语音交互方法、装置、电子设备及存储介质

    公开(公告)号:CN114171004A

    公开(公告)日:2022-03-11

    申请号:CN202111348349.0

    申请日:2021-11-15

    Abstract: 本发明提供一种语音交互方法、装置、电子设备及存储介质,其中方法包括:确定待分类语音;基于所述待分类语音的语音特征和韵律学特征,对所述待分类语音进行意图分类,得到语音意图分类结果;基于所述语音意图分类结果,确定是否基于所述待分类语音进行语音交互。本发明提供的方法、装置、电子设备及存储介质,能够通过对待分类语音的语音特征和韵律学特征对该语音进行语音意图分类,并根据该语音意图分类结果,判断是否进行语音交互,实现了在免唤醒词唤醒的前提下,准确地判断语音的意图,进而能够准确的唤醒并进行人机交互,提升了交互形式上的友好程度,并且提升了交互效果的稳定性。

    语音同传方法、装置、介质及设备

    公开(公告)号:CN119785778A

    公开(公告)日:2025-04-08

    申请号:CN202411905938.8

    申请日:2024-12-23

    Abstract: 本申请实施例提供了一种语音同传方法、装置、计算机可读存储介质以及电子设备,涉及人工智能技术领域。该方法包括:获取待处理音频中第i个语音片段对应的第i语音特征向量;将第i语音特征向量输入经过训练的大语言模型,以通过大语言模型对第i语音特征向量进行语义完整性分析,其中,大语言模型的输出信息用于确定关于第i个语音片段的语义单元,语义单元的语义完整性满足第一预设条件;获取当前语义单元对应的背景语义信息,其中,背景语义信息包括在先语义单元的翻译结果;根据当前语义单元的语义特征向量和背景语义信息,确定当前语义单元对应的翻译结果。本申请实施例能够提升翻译结果的准确性和连贯性,有利于提升翻译质量。

Patent Agency Ranking