-
公开(公告)号:CN113869070B
公开(公告)日:2024-05-24
申请号:CN202111201186.3
申请日:2021-10-15
Applicant: 大连理工大学
IPC: G06F40/58 , G06F40/126 , G06N3/0499 , G06N3/063 , G06N3/08
Abstract: 本发明公开了一种融合特定语言适配器模块的多语言神经机器翻译方法。步骤为:为每个需要翻译的语言对构造一个双语适配器模块并初始化相应的适配器模块参数;将双语适配器模块插入到Transformer模型的编码器和解码器的各个子层之间;改进双语适配器模块的内部网络结构,构建具有可变维度的双语适配器模型,动态调整编码器和解码器两端特定语言表达空间容量的分配;对双语适配器模块对应的语言对进行解耦,为每一种语言分配并初始化一个适配器模块,构建单语适配器模型。本发明通过引入适配器模块改进多语言翻译模型中的参数共享方式,缓解多语言翻译模型的表达瓶颈问题,实现多语言神经机器翻译和未见语言对翻译质量的提升。
-
公开(公告)号:CN113869070A
公开(公告)日:2021-12-31
申请号:CN202111201186.3
申请日:2021-10-15
Applicant: 大连理工大学
IPC: G06F40/58 , G06F40/126 , G06N3/04 , G06N3/063 , G06N3/08
Abstract: 本发明公开了一种融合特定语言适配器模块的多语言神经机器翻译方法。步骤为:为每个需要翻译的语言对构造一个双语适配器模块并初始化相应的适配器模块参数;将双语适配器模块插入到Transformer模型的编码器和解码器的各个子层之间;改进双语适配器模块的内部网络结构,构建具有可变维度的双语适配器模型,动态调整编码器和解码器两端特定语言表达空间容量的分配;对双语适配器模块对应的语言对进行解耦,为每一种语言分配并初始化一个适配器模块,构建单语适配器模型。本发明通过引入适配器模块改进多语言翻译模型中的参数共享方式,缓解多语言翻译模型的表达瓶颈问题,实现多语言神经机器翻译和未见语言对翻译质量的提升。
-
公开(公告)号:CN113469272A
公开(公告)日:2021-10-01
申请号:CN202110816000.9
申请日:2021-07-20
Abstract: 本发明属于图像处理及自动化检测技术领域,涉及一种基于FasterR‑CNN‑FFS模型的酒店场景图片的目标检测方法,其包括构建训练集、验证集和测试集;训练Faster R‑CNN‑FFS目标检测模型;利用训练好的模型对测试集进行目标检测等步骤。本发明对Faster R‑CNN模型的特征提取、损失函数、候选框选择机制三方面进行改进,提出Faster R‑CNN‑FFS模型。本发明的基于Faster R‑CNN‑FFS模型的酒店场景图片的目标检测方法充分考虑酒店领域用户生成图片目标检测的数据特点,有效解决了复杂无约束酒店场景下的多目标识别问题。
-
公开(公告)号:CN105868184B
公开(公告)日:2018-06-08
申请号:CN201610308475.6
申请日:2016-05-10
Applicant: 大连理工大学
Abstract: 本发明提供了一种基于循环神经网络的中文人名识别方法,本发明包括:S1、语料预处理;S2、词向量训练,利用word2vec工具进行词向量训练;S3、中文人名识别模型训练,利用S1处理后得到的数据以及S2训练得到的词向量对神经网络模型进行训练。S4、人名识别以及后处理,利用S3训练得到的模型在测试语料上进行人名识别,并利用上下文规则,扩散算法对模型识别出来的人名进行后处理,最后得到人名。利用本发明能有效的降低在中文人名识别时特征选取的复杂性,通过词向量充分利用中文文本中蕴含的丰富的句法和语法信息,从而增加模型的泛化能力,并且同时识别了日本人名和外国音译人名,扩大了中文人名识别的广度。
-
公开(公告)号:CN103500160A
公开(公告)日:2014-01-08
申请号:CN201310492589.7
申请日:2013-10-18
Applicant: 大连理工大学
IPC: G06F17/27
Abstract: 本发明属于计算机自然语言处理领域,涉及一种对人类自然语言句子进行高质量的句法分析的方法,具体是指一种基于滑动语义串匹配的句法分析方法。其特征是在建立规则库时,首先对通常短语句法树进行了层次的扁平化转换,然后对每一层的组块信息进行语义码标注,从而提取N元上下文有关文法的组块规则;在句法分析时,通过滑动语义串匹配模型匹配出最优的组块规则进行层叠组块式分析;通过错误修正模板在高层发现和修正低层中的错误,实现层叠组块式句法分析中的启发式回溯处理;通过在语义模板索引中直接加入模板信息,实现机器对新句法规则的即时学习。本发明解决了概率上下文无关文法(PCFG)型句法分析水平难进一步提高以及层叠组块型句法分析中难以选择正确的组块规则的难题,提高了现有句法分析水平。
-
公开(公告)号:CN119719361A
公开(公告)日:2025-03-28
申请号:CN202411823059.0
申请日:2024-12-12
Applicant: 大连理工大学
IPC: G06F16/34 , G06F18/214 , G06F18/21 , G06F18/241 , G06F18/243 , G06F18/2431 , G06N3/045 , G06N3/08
Abstract: 一种基于数据增强和两阶段训练的摘要忠实度评价方法,首先,应用三种数据增强方法(实体替换、同主题相似检索、外插掩码填充)从文本摘要数据集中提取训练数据。实体替换(ES)将单句中的实体替换为相同类别、不同名称的其他实体,以此作为负面摘要。同主题相似检索(S3T)根据主题将数据集中的文章进行分组,并在同主题文章中筛选出语义相近的单句,作为不忠实摘要。外插掩码填充(IFEM)在单句中插入额外掩码并进行填充,生成与原文内容相关但不忠实的负面摘要。其次,充分利用文本摘要数据集的信息,分两个阶段对系统进行多任务联合训练。第一阶段使用基于原文提取的训练数据,训练系统掌握对基础事实一致性的判断能力;第二阶段使用基于参考摘要提取的训练数据,提升系统在复杂语境下的忠实度评估能力。本发明通过改进负面摘要构建方式和充分利用数据集信息,显著提升了系统的忠实度评估能力,为自动文本摘要的实际应用提供了强有力的技术支持。
-
公开(公告)号:CN112650933B
公开(公告)日:2024-05-07
申请号:CN202110011006.9
申请日:2021-01-06
Applicant: 大连理工大学
IPC: G06F16/9535 , G06F16/9536 , G06F18/214 , G06N3/0464 , G06N3/047 , G06N3/084 , G06Q50/00
Abstract: 本发明公开了一种基于高阶聚合的图卷积融合多头注意力机制的会话推荐方法,属于推荐技术领域。对于每个会话序列构建单独的有向会话图,所有的会话图都使用共享项作为链接形成全局图作为输入。多层图卷积网络根据项目特征对其进行向量表示,并通过多头注意力机制得到会话图的全局偏好表示,同时将每个会话图中最后一个点击项的向量表示作为局部偏好表示。之后,全局偏好和局部偏好使用线性变换得到会话序列的最终表示,以此预测图中项目成为下一次点击的概率。本方法使用初始残差和恒等映射两个理论方法,解决多层图卷积网络带来的过度平滑问题,同时使用了多头注意力机制提升了模型的表达能力,提高了在会话中预测项目的准确率。
-
公开(公告)号:CN113469272B
公开(公告)日:2023-05-19
申请号:CN202110816000.9
申请日:2021-07-20
IPC: G06V20/60 , G06N3/045 , G06N3/0464 , G06N3/08 , G06V10/764 , G06V10/774 , G06V10/82 , G06V10/40 , G06V10/80
Abstract: 本发明属于图像处理及自动化检测技术领域,涉及一种基于FasterR‑CNN‑FFS模型的酒店场景图片的目标检测方法,其包括构建训练集、验证集和测试集;训练Faster R‑CNN‑FFS目标检测模型;利用训练好的模型对测试集进行目标检测等步骤。本发明对Faster R‑CNN模型的特征提取、损失函数、候选框选择机制三方面进行改进,提出Faster R‑CNN‑FFS模型。本发明的基于Faster R‑CNN‑FFS模型的酒店场景图片的目标检测方法充分考虑酒店领域用户生成图片目标检测的数据特点,有效解决了复杂无约束酒店场景下的多目标识别问题。
-
公开(公告)号:CN111552801B
公开(公告)日:2022-09-30
申请号:CN202010310307.7
申请日:2020-04-20
Applicant: 大连理工大学
Abstract: 本发明属于文本摘要自动生成技术领域,涉及基于语义对齐的神经网络自动摘要模型,是指在给定文本的条件下,利用训练产生的模型自动生成简短摘要。该模型在传统Sequence‑to‑Sequence模型的基础上,在编码器和解码器间加入语义对齐网络。语义对齐网络将源文本语义信息与摘要文本语义信息结合起来,通过联合训练,模型可以充分挖掘并利用参考摘要文本整体的语义信息,提高自动生成文本摘要的质量。
-
公开(公告)号:CN106021225A
公开(公告)日:2016-10-12
申请号:CN201610317795.8
申请日:2016-05-12
Applicant: 大连理工大学
CPC classification number: G06F17/2775 , G06F17/2785 , G06K9/6269
Abstract: 本发明属于人工智能的自然语言处理子领域,提供了一种基于汉语简单名词短语的汉语最长名词短语识别方法。包括如下步骤:S1数据预处理;S2选用SVM方法,训练汉语SNP识别模型,识别出汉语SNP;S3使用缩略替换方法简化文本,得到新的训练及测试语料;S4在经S3处理得到的新语料中,再次提取样本集,针对简化后的汉语MNP进行模型训练、识别;S5还原语料,还原后的汉语MNP为本方法最终识别结果。本发明的汉语MNP识别方法可以降低汉语MNP在自动识别中因其长度过长、语义及结构复杂等因素带来的不利影响,因此能有效提高汉语MNP的识别效果。
-
-
-
-
-
-
-
-
-