Patent search ap:("中国科学院自动化研究所" OR "国家计算机网络与信息安全管理中心") AND inv:"宗成庆" Page 1

1.

发明授权
基于深层神经网络翻译模型的解码方法失效

公开(公告)号：CN108647214B

公开(公告)日：2020-06-30

申请号：CN201810270468.0

申请日：2018-03-29

Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心

Inventor： 张家俊 , 周龙 , 马宏远 , 杜翠兰 , 张翠 , 赵晓航 , 宗成庆

IPC: G06F40/58 , G06F40/289 , G06N3/04

Abstract: 本发明涉及语言处理领域，提出了一种基于深层神经网络翻译模型的解码方法，旨在解决机器翻译模型中模型训练复杂度高、训练难度大解码速度慢等问题。该方法的具体实施方式包括：对待翻译语句进行分词处理，得到源语言词汇；步骤2，使用自动对齐工具对预设的翻译模型词汇表中的语料进行词对齐，得到与所述源语言词汇对齐的目标语言单词；步骤3，基于步骤2所得到的目标语言单词，确定出所述待翻译语句的目标端动态词汇表，根据预先构建的翻译模型，使用柱搜索方法解码出的语句作为所述翻译模型的输出；其中，所述翻译模型为基于门限残差机制和平行注意力机制的深层神经网络。本发明提升了模型翻译质量，提高了模型解码速度。

2.

发明授权
中文篇章关系的分类方法及装置失效

公开(公告)号：CN108959351B

公开(公告)日：2022-11-08

申请号：CN201810377825.3

申请日：2018-04-25

Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心

Inventor： 张家俊 , 刘洋 , 马宏远 , 杜翠兰 , 柳毅 , 赵媛 , 宗成庆

IPC: G06F16/35 , G06F40/30 , G06N3/04

Abstract: 本发明属于自然语言处理技术领域，具体提供一种中文篇章关系的分类方法及装置。旨在解决传统管道系统方法中错误传递的问题。本发明的中文篇章关系的分类方法包括将中文篇章中的句子进行句对的分布式表示，得到第一句对分布式表示向量；计算记忆单元与第一句对分布式表示向量的相似度和权重，得到第一句对分布式表示向量的记忆信息；将第一句对分布式表示向量与记忆信息进行线性组合生成第二句对分布式表示向量；对第二句对分布式表示向量进行分类，得到中文篇章的关系分类结果。本发明的方法通过深度学习网络得到句子内部的语义和结构抽象特征，可以获得优越性能的篇章分类效果。

3.

发明公开
中文篇章关系的分类方法及装置失效

公开(公告)号：CN108959351A

公开(公告)日：2018-12-07

申请号：CN201810377825.3

申请日：2018-04-25

Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心

Inventor： 张家俊 , 刘洋 , 马宏远 , 杜翠兰 , 柳毅 , 赵媛 , 宗成庆

IPC: G06F17/30 , G06F17/27 , G06N3/04

CPC classification number: G06F17/2785 , G06N3/0481

Abstract: 本发明属于自然语言处理技术领域，具体提供一种中文篇章关系的分类方法及装置。旨在解决传统管道系统方法中错误传递的问题。本发明的中文篇章关系的分类方法包括将中文篇章中的句子进行句对的分布式表示，得到第一句对分布式表示向量；计算记忆单元与第一句对分布式表示向量的相似度和权重，得到第一句对分布式表示向量的记忆信息；将第一句对分布式表示向量与记忆信息进行线性组合生成第二句对分布式表示向量；对第二句对分布式表示向量进行分类，得到中文篇章的关系分类结果。本发明的方法通过深度学习网络得到句子内部的语义和结构抽象特征，可以获得优越性能的篇章分类效果。

4.

发明公开
基于深层神经网络翻译模型的解码方法失效

公开(公告)号：CN108647214A

公开(公告)日：2018-10-12

申请号：CN201810270468.0

申请日：2018-03-29

Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心

Inventor： 张家俊 , 周龙 , 马宏远 , 杜翠兰 , 张翠 , 赵晓航 , 宗成庆

IPC: G06F17/28 , G06F17/27 , G06N3/04

Abstract: 本发明涉及语言处理领域，提出了一种基于深层神经网络翻译模型的解码方法，旨在解决机器翻译模型中模型训练复杂度高、训练难度大解码速度慢等问题。该方法的具体实施方式包括：对待翻译语句进行分词处理，得到源语言词汇；步骤2，使用自动对齐工具对预设的翻译模型词汇表中的语料进行词对齐，得到与所述源语言词汇对齐的目标语言单词；步骤3，基于步骤2所得到的目标语言单词，确定出所述待翻译语句的目标端动态词汇表，根据预先构建的翻译模型，使用柱搜索方法解码出的语句作为所述翻译模型的输出；其中，所述翻译模型为基于门限残差机制和平行注意力机制的深层神经网络。本发明提升了模型翻译质量，提高了模型解码速度。

5.

发明授权
多语言机器翻译模型训练方法、多语言翻译方法及装置有权

公开(公告)号：CN114048760B

公开(公告)日：2025-03-25

申请号：CN202111138690.3

申请日：2021-09-27

Applicant: 中国科学院自动化研究所

Inventor： 张家俊 , 王迁 , 宗成庆

IPC: G06F40/58 , G06F16/35 , G06F18/23 , G06F18/22

Abstract: 本发明提供一种多语言机器翻译模型训练方法、多语言翻译方法及装置。训练方法包括：获取多语言翻译训练语料和多语言翻译验证语料；建立并初始化全参数共享的多语言翻译模型，利用多语言翻译训练语料和多语言翻译验证语料对多语言翻译模型进行训练，得到多语言机器翻译模型。在训练过程中模型自动判断每个共享的参数是否需要转变为语言相关的参数，复制需要转变的参数并将其分配给相关的语言，从而使得模型同时具有共享参数和语言相关参数。本发明用于在多语言机器翻译模型训练的过程中，自动判断参数是否需要共享以及需要被哪些语言对共享，而不依赖预先指定的共享或语言相关的模型组件。

6.

发明公开
大语言模型合并方法、装置、电子设备及存储介质审中-实审

公开(公告)号：CN119476418A

公开(公告)日：2025-02-18

申请号：CN202411518905.8

申请日：2024-10-29

Applicant: 中国科学院自动化研究所

Inventor： 张家俊 , 庞子良 , 宗成庆

IPC: G06N3/0985 , G06F17/16 , G06F18/214 , G06N3/006 , G06N7/01

Abstract: 本发明提供一种大语言模型合并方法、装置、电子设备及存储介质，包括：基于合并模型在下游任务的任务目标，确定模型合并所使用的密度超参数和模型合并系数超参数；基于密度超参数生成掩码矩阵，基于掩码矩阵、两个待合并模型各自的模型参数以及基础模型的模型参数，分别确定两个待合并模型的任务向量；基于两个待合并模型之间对应神经元的参数向量角、两个待合并模型的任务向量以及模型合并系数超参数，确定合并模型的任务向量；基于合并模型的任务向量和基础模型的模型参数，得到合并模型。采用上述技术方案，解决了现有的模型合并方法得到的合并模型的性能不佳的问题。

7.

发明公开
文本图像翻译模型训练方法、装置、电子设备和存储介质审中-实审

公开(公告)号：CN118552965A

公开(公告)日：2024-08-27

申请号：CN202410624083.5

申请日：2024-05-20

Applicant: 中国科学院自动化研究所

Inventor： 张亚萍 , 马聪 , 赵阳 , 周玉 , 宗成庆

IPC: G06V30/19 , G06V30/18 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/084

Abstract: 本发明提供一种文本图像翻译模型训练方法、装置、电子设备和存储介质，其中方法包括：获取预训练模型和训练数据，分别对训练数据中的文本图像和源端语言文本字符串进行特征编码，得到文本图像特征和文本特征；分别对文本图像特征和文本特征进行特征解码，得到文本图像翻译结果和文本翻译结果；基于文本图像翻译结果和训练数据中的目标端语言文本字符串，确定文本图像翻译损失；基于文本图像特征、文本特征、文本图像翻译结果和文本翻译结果，确定多层次知识迁移损失；将文本图像翻译损失和多层次知识迁移损失进行融合，得到训练损失，并基于训练损失对预训练模型进行参数更新，得到文本图像翻译模型。本发明能够提升文本图像翻译模型的性能。

8.

发明授权
基于视觉语言预训练的图像文本翻译方法及装置有权

公开(公告)号：CN117034965B

公开(公告)日：2024-03-22

申请号：CN202310996132.3

申请日：2023-08-08

Applicant: 中国科学院自动化研究所

Inventor： 张亚萍 , 向露 , 刘宇宸 , 周玉 , 宗成庆

IPC: G06F40/58 , G06F40/289 , G06V30/41 , G06N3/045

Abstract: 本发明提供一种基于视觉语言预训练的图像文本翻译方法及装置，方法包括：确定源语言图像；将源语言图像输入至图像文本翻译模型，得到图像文本翻译模型输出的源语言图像对应的目标语言文本；其中，图像文本翻译模型的损失值基于样本预测源语言文本与样本源语言图像对应的样本源语言标签之间的差异，以及样本预测目标语言文本与样本目标语言标签之间的差异确定。本发明的图像文本翻译模型基于样本图像特征向量以及样本预测源语言文本对样本源语言图像进行图像文本翻译时，样本图像特征向量能够补充提供相应的视觉信息，对文本识别错误进行校正，以增强图像文本翻译，准确得到样本预测目标语言文本，进而提高图像文本翻译模型的图像文本翻译精度。

9.

发明公开
零资源跨语言对话模型训练方法、装置、设备和介质有权

公开(公告)号：CN116805004A

公开(公告)日：2023-09-26

申请号：CN202311058414.5

申请日：2023-08-22

Applicant: 中国科学院自动化研究所

Inventor： 向露 , 刘宇宸 , 张亚萍 , 周玉 , 宗成庆

IPC: G06F16/332 , G06N3/042 , G06N3/045 , G06N3/096 , G06F40/40

Abstract: 本发明涉及自然语言处理技术领域，提供一种零资源跨语言对话模型训练方法、装置、设备和介质，所述方法包括：基于初始样本源语言对话数据，构建扩充样本源语言对话数据、第一跨语言对话数据、第二跨语言对话数据、双语平行数据以及样本目标语言对话数据；基于扩充样本源语言对话数据、第一跨语言对话数据以及第二跨语言对话数据中的至少一种，和双语平行数据，训练得到教师模型；将样本目标语言对话数据的对话输入数据输入至教师模型，得到蒸馏对话回复数据；基于样本目标语言对话数据的对话输入数据以及蒸馏对话回复数据进行蒸馏训练，得到零资源跨语言对话模型。本发明快速且低成本为零资源目标语言构建零资源跨语言对话模型。

10.

发明公开
翻译模型的训练方法及装置、翻译方法及装置审中-实审

公开(公告)号：CN115358245A

公开(公告)日：2022-11-18

申请号：CN202210800420.2

申请日：2022-07-06

Applicant: 中国科学院自动化研究所

Inventor： 张家俊 , 王迁 , 宗成庆

IPC: G06F40/58 , G06K9/62

Abstract: 本发明提供一种翻译模型的训练方法及装置、翻译方法及装置，其中翻译模型的训练方法包括：获取M个翻译任务的训练数据和预设翻译模型；对于M个翻译任务中任意两个翻译任务的训练数据和预设翻译模型，确定任意两个翻译任务之间的目标亲和性；基于各目标亲和性，将各翻译任务进行聚类处理，得到多个目标任务簇；基于各目标任务簇中各翻译任务的训练数据，对各目标任务簇对应的目标翻译模型进行训练。通过确定任意两个翻译任务之间的目标亲和性，可以将对预设翻译模型的翻译结果具有促进作用的各翻译任务进行聚类，得到目标任务簇；基于各目标任务簇，对各目标任务簇对应的目标翻译模型进行训练，能够提高目标翻译模型进行多语言翻译的准确性。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification