-
公开(公告)号:CN119026611A
公开(公告)日:2024-11-26
申请号:CN202411481486.5
申请日:2024-10-23
Applicant: 昆明理工大学
IPC: G06F40/58 , G06F40/151 , G06F40/42 , G06N3/0455 , G06N3/096
Abstract: 本发明涉及融合高效参数迁移的老‑汉神经机器翻译方法及装置,属于自然语言处理技术领域。为了解决罗马化过程中出现多个字符转写为同一罗马化字符导致语义信息丢失的问题,影响泰语到老挝语的迁移效果,本发明提出了一种融合高效参数迁移的老‑汉神经机器翻译方法,包括文本数据预处理、罗马化信息融合、融合高效参数迁移的老‑汉神经机器翻译模型训练以及老‑汉神经机器翻译四个部分构成。根据这四个部分功能模块化制成融合高效参数迁移的老‑汉神经机器翻译装置,对输入的老挝语句子进行翻译,本发明有效提升了老挝语到汉语的翻译效果。
-
公开(公告)号:CN118395998B
公开(公告)日:2024-08-16
申请号:CN202410818685.4
申请日:2024-06-24
Applicant: 昆明理工大学
IPC: G06F40/58 , G06F40/211 , G06F40/284 , G06F40/51 , G06N3/0455 , G06N3/0499 , G06N3/082
Abstract: 本发明涉及基于分化适配器的汉老泰多语言神经机器翻译方法,属自然语言处理技术领域。汉‑老‑泰多语言机器翻译框架通过模型参数共享能有效共享相似语言知识提升老‑汉和泰‑汉翻译性能,但引入模型参数共享会导致不同语言间参数相互干扰问题。针对汉‑老‑泰多语言机器翻译框架中的参数干扰降低机器翻译质量问题,本发明包括数据处理和模型预训练、进行基于分化适配器的汉‑老‑泰多语言神经机器翻译模型微调、构建基于分化适配器的汉‑老‑泰多语言神经机器翻译装置三部分。本发明对输入的泰语或老挝语进行目标语言的翻译,本发明有效提升了汉‑老‑泰多语言机器翻译质量。
-
公开(公告)号:CN119047457A
公开(公告)日:2024-11-29
申请号:CN202411519517.1
申请日:2024-10-29
Applicant: 昆明理工大学
IPC: G06F40/205 , G06F40/211 , G06F40/242 , G06F40/284 , G06F40/30 , G06F40/49 , G06N20/00 , G06N3/045 , G06N3/08
Abstract: 本发明涉及基于语言相似性增强的平行句对抽取方法及装置,属于自然语言处理技术领域。针对现有的平行句对抽取方法应用到中泰、中老任务时,泰语和老挝语训练数据稀缺导致模型对泰语和老挝语的表征能力弱、抽取效果不好的问题,提出了本发明,本发明主要包括融合语言增强特征的数据预处理、训练基于语言相似性增强的中老泰多语言平行句对抽取模型、中老泰多语言平行句对抽取三部分。根据这三个功能模块化制成基于语言相似性增强的平行句对抽取装置,从中泰及中老可比语料中抽取平行句对,本发明有效提升了中泰和中老平行句对抽取效果。
-
公开(公告)号:CN119026611B
公开(公告)日:2024-12-17
申请号:CN202411481486.5
申请日:2024-10-23
Applicant: 昆明理工大学
IPC: G06F40/58 , G06F40/151 , G06F40/42 , G06N3/0455 , G06N3/096
Abstract: 本发明涉及融合高效参数迁移的老‑汉神经机器翻译方法及装置,属于自然语言处理技术领域。为了解决罗马化过程中出现多个字符转写为同一罗马化字符导致语义信息丢失的问题,影响泰语到老挝语的迁移效果,本发明提出了一种融合高效参数迁移的老‑汉神经机器翻译方法,包括文本数据预处理、罗马化信息融合、融合高效参数迁移的老‑汉神经机器翻译模型训练以及老‑汉神经机器翻译四个部分构成。根据这四个部分功能模块化制成融合高效参数迁移的老‑汉神经机器翻译装置,对输入的老挝语句子进行翻译,本发明有效提升了老挝语到汉语的翻译效果。
-
公开(公告)号:CN118395998A
公开(公告)日:2024-07-26
申请号:CN202410818685.4
申请日:2024-06-24
Applicant: 昆明理工大学
IPC: G06F40/58 , G06F40/211 , G06F40/284 , G06F40/51 , G06N3/0455 , G06N3/0499 , G06N3/082
Abstract: 本发明涉及基于分化适配器的汉老泰多语言神经机器翻译方法,属自然语言处理技术领域。汉‑老‑泰多语言机器翻译框架通过模型参数共享能有效共享相似语言知识提升老‑汉和泰‑汉翻译性能,但引入模型参数共享会导致不同语言间参数相互干扰问题。针对汉‑老‑泰多语言机器翻译框架中的参数干扰降低机器翻译质量问题,本发明包括数据处理和模型预训练、进行基于分化适配器的汉‑老‑泰多语言神经机器翻译模型微调、构建基于分化适配器的汉‑老‑泰多语言神经机器翻译装置三部分。本发明对输入的泰语或老挝语进行目标语言的翻译,本发明有效提升了汉‑老‑泰多语言机器翻译质量。
-
公开(公告)号:CN119047457B
公开(公告)日:2025-01-24
申请号:CN202411519517.1
申请日:2024-10-29
Applicant: 昆明理工大学
IPC: G06F40/205 , G06F40/211 , G06F40/242 , G06F40/284 , G06F40/30 , G06F40/49 , G06N20/00 , G06N3/045 , G06N3/08
Abstract: 本发明涉及基于语言相似性增强的平行句对抽取方法及装置,属于自然语言处理技术领域。针对现有的平行句对抽取方法应用到中泰、中老任务时,泰语和老挝语训练数据稀缺导致模型对泰语和老挝语的表征能力弱、抽取效果不好的问题,提出了本发明,本发明主要包括融合语言增强特征的数据预处理、训练基于语言相似性增强的中老泰多语言平行句对抽取模型、中老泰多语言平行句对抽取三部分。根据这三个功能模块化制成基于语言相似性增强的平行句对抽取装置,从中泰及中老可比语料中抽取平行句对,本发明有效提升了中泰和中老平行句对抽取效果。
-
-
-
-
-