-
公开(公告)号:CN116663571A
公开(公告)日:2023-08-29
申请号:CN202210142644.9
申请日:2022-02-16
Applicant: 腾讯科技(深圳)有限公司 , 北京交通大学
Abstract: 本申请实施例提供了一种翻译方法、装置、电子设备以及计算机可读存储介质,涉及人工智能、自然语言处理、多媒体及云技术领域。该方法包括:获取源语言的待翻译文本,通过训练好的翻译模型对待翻译文本进行翻译,得到待翻译文本对应于目标语言的目标文本;该翻译模型是通过以下方式训练得到的:获取包括源语言的第一文本和第一文本对应于目标语言的第二文本的多个训练样本;根据每个样本的第一文本和第二文本中相匹配的各单词对在两个文本中的位置偏置,确定每个样本对应的训练损失权重;基于多个样本及其对应的训练损失权重对初始神经网络模型进行迭代训练得到翻译模型。基于该方法,能够有效提升翻译效果。
-
公开(公告)号:CN111444338A
公开(公告)日:2020-07-24
申请号:CN202010129518.0
申请日:2020-02-28
Applicant: 腾讯科技(深圳)有限公司 , 北京交通大学
IPC: G06F16/35 , G06F40/126 , G06F40/289 , G06F40/30
Abstract: 本申请公开了一种文本处理、装置、存储介质及设备,属于人工智能技术领域。方法包括:获取待处理文本,对待处理文本执行向量化处理得到共享特征向量;分别对共享特征向量执行与方面词抽取任务对应的第一编码处理、与观点词抽取任务对应的第二编码处理和与方面级别情感分类任务对应的第三编码处理,依次得到第一特征向量、第二特征向量和第三特征向量;基于第一特征向量、第二特征向量和第三特征向量执行信息传递处理,信息传递处理是指在任意上述两两任务间进行双向特征信息传递;基于信息传递处理后得到的特征向量,对待处理文本进行方面词抽取和方面级别的情感极性分类。本申请显著提升了情感分析效果。
-
公开(公告)号:CN103314369B
公开(公告)日:2015-08-12
申请号:CN201080070253.6
申请日:2010-12-17
Applicant: 北京交通大学
IPC: G06F17/28
CPC classification number: G06F17/2872
Abstract: 本发明公开了一种机器翻译装置和方法,涉及自然语言处理领域。装置包括:源语言输入单元,输入源语言语句;源语言分析单元,进行词法分析和句法分析得到句法结构,并为句法结构中的节点赋予属性特征;任意格判定模型存储单元,存储任意格判定模型;任意格判定单元,判断是否含有任意格;任意格短语提取单元,获取任意格短语;任意格短语翻译单元,翻译任意格短语;第一提取单元,获取源语言剩余语句;机器翻译单元,翻译源语言剩余语句;翻译结果整合单元,整合得到目标语言;目标语言输出单元,输出目标语言。本发明可以降低源语言的句法结构的复杂程度,提高目标语言生成效率,达到提高翻译精度,使机器翻译解码的运算量得到适当降低。
-
公开(公告)号:CN119599032A
公开(公告)日:2025-03-11
申请号:CN202311175504.2
申请日:2023-09-11
Applicant: 腾讯科技(深圳)有限公司 , 北京交通大学
IPC: G06F40/58 , G06F18/214 , G06F40/126
Abstract: 本申请实施例公开了一种模型训练方法、装置、电子设备、介质和程序产品,可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景;本申请实施例获取训练样本集,训练样本集包括初始场景对应的初始样本文本、以及新增场景对应的新增样本文本;通过教师模型对初始样本文本进行翻译,得到教师翻译结果;通过初始学生模型对初始样本文本以及新增样本文本进行翻译,得到学生翻译结果;结合教师翻译结果以及学生翻译结果,计算得到损失值;基于损失值,更新初始学生模型的模型参数,得到训练后的学生模型,以便将训练后的学生模型用于翻译初始场景和新增场景对应的待翻译文本。由此,本方案可以在提升模型训练效率的同时增强模型的多场景适应能力。
-
公开(公告)号:CN118734869A
公开(公告)日:2024-10-01
申请号:CN202310368793.1
申请日:2023-03-28
Applicant: 腾讯科技(深圳)有限公司 , 北京交通大学
IPC: G06F40/58 , G06F40/126
Abstract: 本申请涉及人工智能,具体涉及一种文本翻译方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取初始文本,并确定对初始文本进行翻译的至少一种翻译任务类型;针对至少一种翻译任务类型,分别在初始文本中添加标记标签,获得至少一个标记文本;基于至少一个标记文本所包括的翻译任务标签,确定与至少一种标记文本适配的至少一种文本编码方式;分别按照适配的文本编码方式进行语义编码处理,得到至少一种翻译任务类型一一对应的编码向量序列;对至少一种翻译任务类型一一对应的编码向量序列分别进行语义解码处理,得到至少一种翻译任务类型一一对应的翻译译文。采用本方法能够提升文本的翻译效率。
-
公开(公告)号:CN111368079A
公开(公告)日:2020-07-03
申请号:CN202010129553.2
申请日:2020-02-28
Applicant: 腾讯科技(深圳)有限公司 , 北京交通大学
IPC: G06F16/35 , G06F40/289
Abstract: 本申请公开了一种应用于人工智能领域的文本分类方法,包括:获取待分类文本;通过编码器获取待分类文本中每个词语所对应的隐藏状态;根据每个词语所对应的隐藏状态,获取每个词语所对应的深度值;根据每个词语所对应的深度值以及每个词语所对应的词嵌入,生成每个词语所对应的词特征向量;基于每个词语所对应的词特征向量,通过文本分类模型获取待分类文本所对应的文本编码结果;通过文本分类模型获取待分类文本的分类结果。本申请还公开了一种模型训练的方法。本申请可以自适应地获取文本中每个词语所对应的深度值,使得文本分类模型根据不同的深度值对相应的词语进行编码,从而能够对文本中的词语进行执行充分计算。
-
公开(公告)号:CN103119585B
公开(公告)日:2015-12-02
申请号:CN201080069243.0
申请日:2010-12-17
Applicant: 北京交通大学
IPC: G06F17/28
CPC classification number: G06F17/27
Abstract: 本发明提供了一种知识获取装置及方法,其中,该装置包括:格位框架特征抽取单元,用于抽取输入语句中谓语成分的格位框架要素及其属性信息;模型库,用于存储任意格模型;任意格判定单元,用于对所述格位框架特征抽取单元的抽取结果及所述任意格模型进行模式匹配,确定所述谓语成分的格位框架中的任意格信息。本发明实现对该谓语成分的格位框架进行必须格和任意格的自动获取和有效区分,提高自然语言处理的结构消歧和语义消歧的能力。
-
公开(公告)号:CN117763135A
公开(公告)日:2024-03-26
申请号:CN202211122113.X
申请日:2022-09-15
Applicant: 腾讯科技(深圳)有限公司 , 北京交通大学
IPC: G06F16/34 , G06F16/54 , G06F16/957 , G06N3/0464 , G06N3/047 , G06N3/08 , G06V10/40 , G06V10/82
Abstract: 提供了摘要模型训练方法、摘要生成方法、计算设备和介质。摘要模型用于生成文本摘要,所述训练方法包括:获取训练数据集,所述训练数据集包括的每个训练数据包括文本样本、图片样本以及对应的摘要样本,对于每个训练数据,基于所述训练数据包括的文本样本和图片样本得到第一预测输出,并且基于所述训练数据包括的图片样本得到第二预测输出;以及基于每个训练数据对应的第一预测输出和第二预测输出,对所述摘要模型进行训练。经该训练方法训练后的摘要模型可以结合文本和图片比较精准地生成摘要。
-
公开(公告)号:CN117271759A
公开(公告)日:2023-12-22
申请号:CN202211024211.X
申请日:2022-08-24
Applicant: 腾讯科技(深圳)有限公司 , 北京交通大学
IPC: G06F16/34 , G06F40/126 , G06F40/194 , G06F18/25 , G06N3/0499 , G06N3/0455 , G06N3/084
Abstract: 本申请涉及一种文本摘要生成模型训练方法、文本摘要生成方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:将训练文本和对应的训练图像集合输入初始文本摘要生成模型,得到预测文本摘要,基于预测文本摘要和标签文本摘要之间的差异生成目标损失;将训练文本对应的掩码训练数据和第一训练数据输入初始文本摘要生成模型,得到掩码预测数据,基于掩码标签数据和掩码预测数据之间的差异生成重构损失;基于目标损失和重构损失调整初始文本摘要生成模型的模型参数,直至满足收敛条件,得到目标文本摘要生成模型;目标文本摘要生成模型用于生成文本的文本摘要。采用本方法能够提高模型的预测准确性,提高生成的文本摘要的质量。
-
公开(公告)号:CN116681091A
公开(公告)日:2023-09-01
申请号:CN202210161770.9
申请日:2022-02-22
Applicant: 腾讯科技(深圳)有限公司 , 北京交通大学
Abstract: 本申请实施例提供了一种生成对抗样本的方法、装置、设备、存储介质及程序产品,涉及人工智能领域,应用场景包括但不限于机器翻译等场景。该方法包括:获取待翻译的源文本和源文本对应的目标文本;确定源文本对应的待识别对抗样本,以及目标文本对应的待识别对抗样本;基于源文本和源文本对应的待识别对抗样本,确定第一相似度下降率;并基于源文本、目标文本和目标文本对应的待识别对抗样本,确定第二相似度下降率;若第一相似度下降率大于预设第一相似度下降率阈值,且第二相似度下降率小于预设第二相似度下降率阈值,则确定源文本对应的待识别对抗样本为源文本的对抗样本,以及目标文本对应的待识别对抗样本为目标文本的对抗样本。
-
-
-
-
-
-
-
-
-