-
公开(公告)号:CN103299651B
公开(公告)日:2016-08-03
申请号:CN201080070252.1
申请日:2010-12-17
Applicant: 北京交通大学
IPC: H04N21/466 , H04N21/84
CPC classification number: H04N21/4668 , H04N21/84
Abstract: 本发明提供了一种节目推荐装置和节目推荐方法,属于人工智能研究领域。所述装置包括:输入单元、节目预选单元、特征抽取单元、机器学习单元、节目预测单元和输出单元。所述方法包括:接收用户输入的语言信息;根据语言信息从已存储电子节目信息的电子节目表数据库中提取相关的电子节目信息;对提取的电子节目信息进行特征选取,得到特征元素,并从已存储语言知识的知识库中获取特征元素的关联信息,构建特征集合;利用特征集合和机器学习方法构建统计模型;利用统计模型,对电子节目表数据库中的节目进行匹配;输出匹配的结果给用户。本发明解决了节目推荐系统的“冷启动”问题,保障用户的隐私情报不泄漏,提高了节目推荐精度、性能以及实用性。
-
公开(公告)号:CN103119585B
公开(公告)日:2015-12-02
申请号:CN201080069243.0
申请日:2010-12-17
Applicant: 北京交通大学
IPC: G06F17/28
CPC classification number: G06F17/27
Abstract: 本发明提供了一种知识获取装置及方法,其中,该装置包括:格位框架特征抽取单元,用于抽取输入语句中谓语成分的格位框架要素及其属性信息;模型库,用于存储任意格模型;任意格判定单元,用于对所述格位框架特征抽取单元的抽取结果及所述任意格模型进行模式匹配,确定所述谓语成分的格位框架中的任意格信息。本发明实现对该谓语成分的格位框架进行必须格和任意格的自动获取和有效区分,提高自然语言处理的结构消歧和语义消歧的能力。
-
公开(公告)号:CN104268132A
公开(公告)日:2015-01-07
申请号:CN201410461325.X
申请日:2014-09-11
Applicant: 北京交通大学
Abstract: 本发明公开了一种机器翻译方法及系统,属于自然语言处理研究领域。所述方法包括:获取源语言测试句子;分别得到词法分析结果和句法分析结果;利用句法分析结果,抽取谓词论元结构;根据目标语言的句法特点,将谓词论元结构进行结构转换;利用转换后的谓词论元结构和训练得到的翻译规则,对源语言测试句子进行翻译。通过利用句子结构信息和谓词论元结构的语义信息,使用源语言端的句法分析结果,通过谓词论元结构转换处理,实现基于谓词论元结构转换的统计机器翻译;解决了现有技术中翻译规则的冗余规则数量非常大,从而致使机器翻译性能非常差的问题;达到了可有效地改善句子结构的全局调序性能,减少抽取翻译规则数量,提高翻译质量的效果。
-
公开(公告)号:CN102043774A
公开(公告)日:2011-05-04
申请号:CN201110006192.3
申请日:2011-01-13
Applicant: 北京交通大学
IPC: G06F17/28
CPC classification number: G06F17/2854
Abstract: 一种机器翻译测评装置,包括:第一翻译单元,用于对输入的源语言进行机器翻译,并生成目标语言;第二翻译单元,用于把所述目标语言逆向翻译成源语言;源语言语言模型,对输入的源语言和第二翻译单元逆向翻译的结果分别进行评分;以及评价单元,用于根据所述源语言语言模型的评分比较所述输入的源语言和第二翻译单元的逆向翻译结果之间的相似度,对所述机器翻译进行评价。根据本发明,可以在不存在参考译文或标准翻译结果的情况下,对翻译结果进行评分,提供机器翻译结果的信赖度,在实用层面上解决了翻译结果评价困难的问题,为包括语音自动翻译在内的机器翻译系统提供高效可信的机器翻译结果。
-
公开(公告)号:CN114154520B
公开(公告)日:2024-10-15
申请号:CN202111389048.2
申请日:2021-11-22
Applicant: 北京交通大学
IPC: G06F40/58 , G06N3/0475 , G06N3/045 , G06N3/094
Abstract: 本申请公开了一种机器翻译模型的训练方法、机器翻译方法、装置及设备,属于计算机技术领域,该方法包括:获取训练样本集,训练样本集包括训练样本及该训练样本对应的标准翻译文本;将训练样本及训练样本对应的标准翻译文本输入机器翻译模型中,获取机器翻译模型在反向传播过程中产生的梯度向量;基于梯度向量和多个噪音词为训练样本生成对抗样本;基于训练样本和对抗样本对机器翻译模型进行对抗训练,得到目标机器翻译模型。该训练方法生成的对抗样本对机器翻译模型攻击性较大,并且增加了训练数据的多样性,由此提高了机器翻译模型的鲁棒性,进而提高了机器翻译模型的翻译性能,使得通过机器翻译模型得到的翻译结果更加准确。
-
公开(公告)号:CN118734863A
公开(公告)日:2024-10-01
申请号:CN202310379093.2
申请日:2023-03-31
Applicant: 腾讯科技(深圳)有限公司 , 北京交通大学
IPC: G06F40/40 , G06F16/36 , G06F16/33 , G06F40/284 , G06N3/0499 , G06N3/08
Abstract: 本申请提供了一种对话翻译方法、装置、电子设备、计算机可读存储介质及计算机程序产品;涉及人工智能技术;方法包括:获取当前对话的第一对话原文,并获取当前对话的至少一种类型的知识;基于第一对话原文以及至少一种类型的知识进行图构建处理,得到当前对话的图结构;对当前对话的图结构进行图编码处理,得到当前对话的知识图表示;对当前对话的知识图表示进行情感预测处理,得到当前对话的预测情感;基于当前对话的知识图表示以及当前对话的预测情感进行翻译处理,得到当前对话的第一对话译文。通过本申请,能够准确地在对话译文中表达情感,从而提高对话翻译的准确性。
-
公开(公告)号:CN118734844A
公开(公告)日:2024-10-01
申请号:CN202310358966.1
申请日:2023-03-28
Applicant: 腾讯科技(深圳)有限公司 , 北京交通大学
IPC: G06F40/284 , G06F40/30 , G06N3/0455 , G06N3/08
Abstract: 本申请涉及一种训练样本处理方法、装置、设备、存储介质和程序产品。所述方法包括:获取原始样本,每个原始样本包括文本、文本中的方面词以及方面词在文本中的位置信息;对文本中的方面词进行掩码处理,得到掩码后的文本;通过预训练语言模型,根据掩码后的文本与位置信息对位置信息所指示方面词位置进行方面词预测,得到预测方面词;将原始样本的文本中的方面词替换为预测方面词,得到增强样本;增强样本用于训练方面词抽取模型。采用本方法能够产生包含新的方面词的增强样本,使用增强样本训练方面词抽取模型,使得方面词抽取模型可以提取新的方面词,提升方面词抽取模型的精确性。
-
公开(公告)号:CN111368078B
公开(公告)日:2024-07-09
申请号:CN202010129552.8
申请日:2020-02-28
Applicant: 腾讯科技(深圳)有限公司 , 北京交通大学
IPC: G06F16/35 , G06F40/279 , G06N3/045
Abstract: 本申请公开了一种模型训练的方法,包括:获取待训练文本;获取待训练文本中每个词语所对应的第一深度标签;基于每个词语的词嵌入,通过文本分类模型中的深度值分类器获取每个词语所对应的深度概率分布向量;基于每个词语所对应的第二深度标签以及每个词语所对应的词嵌入,通过文本分类模型获取类别概率分布向量;根据待训练文本所对应的真实分类标签、类别概率分布向量、第一深度标签以及深度概率分布向量,采用目标损失函数对文本分类模型的模型参数进行更新。本申请还公开了一种基于人工智能的文本分类方法。本申请可以独立预测每个词语对应的深度值,而不会受到下游任务类型和数据集的干扰,从而提升模型的鲁棒性。
-
公开(公告)号:CN112347795B
公开(公告)日:2024-07-02
申请号:CN202011066983.0
申请日:2020-10-04
Applicant: 北京交通大学
Abstract: 本申请公开了一种机器翻译质量评估方法、装置、设备及介质,涉及机器学习网络。上述方法应用于机器翻译自动评估系统中,所述机器翻译自动评估系统运行有特征提取网络和分类预测网络,所述方法包括:获取源语句和机器译文,所述机器译文是待评估的机器翻译系统对所述源语句翻译生成的;调用所述特征提取网络对所述源语句和机器译文生成分布式特征表示,所述特征提取网络是基于双语平行语料库采用无监督方式训练的语言编码模型;调用所述分类预测网络对所述分布式特征表示进行分类预测,得到所述机器译文的质量评估结果,所述质量评估结果包含词汇级别和句子级别中的至少一种。
-
公开(公告)号:CN113821616B
公开(公告)日:2023-11-14
申请号:CN202110910430.7
申请日:2021-08-09
Applicant: 北京交通大学
IPC: G06F16/332 , G06F16/33
Abstract: 本申请公开了一种领域自适应的槽位填充方法、装置、设备及存储介质,属于自然语言处理领域。该方法包括:接收用户输入语句;基于目标槽位的槽位元信息,为所述用户输入语句构建与所述目标槽位对应的问句;将所述问句和所述用户输入语句拼接为用户输入句对;调用机器阅读理解模型对所述用户输入句对进行预测,得到所述问句的答案位置信息;根据所述答案位置信息,将所述问句的答案作为槽位实体,填充在所述目标槽位中。本申请将槽位填充问题转化为机器阅读理解问题,利用通用机器阅读理解模型对不同领域的语料都具有较好理解能力的特性,可以实现跨领域的槽位填充能力。
-
-
-
-
-
-
-
-
-