基于语义空间共享的知识图谱问答系统

    公开(公告)号:CN111897944A

    公开(公告)日:2020-11-06

    申请号:CN202010827800.6

    申请日:2020-08-17

    Abstract: 基于语义空间共享的知识图谱问答系统,它属于中文知识图谱问答技术领域。本发明解决了现有知识图谱问答系统中各模块之间信息共享不足,导致获得的答案实体的准确率有限的问题。本发明利用问句主实体识别子模块,实体链接子模块和关系预测子模块的训练数据来联合训练BERT预训练语言模型,通过将联合训练好的模型嵌入各子模块,以实现语义空间的信息共享。通过本发明方法可以确保问句主实体识别子模块能够且只能从自然语言问句中识别出一个主实体,通过各子模块之间的语义信息共享,可以有效提高获得的答案实体的准确率。通过实验证明,采用本发明方法获得的答案实体的准确率可以达到86.64%。本发明可以应用于知识图谱问答。

    融合多语编码信息的神经机器翻译方法

    公开(公告)号:CN107357789B

    公开(公告)日:2020-10-02

    申请号:CN201710575907.4

    申请日:2017-07-14

    Abstract: 融合多语编码信息的神经机器翻译方法,本发明涉及神经机器翻译方法。本发明的目的是为了解决现有技术翻译准确率低的问题。过程为:一,得到每种语言各自对应的子字符号序列,建立dic_s1,dic_s2和dic_t;二、将词向量输入NMT模型训练,根据初值训练更新词向量,直至NMT模型的bleu值提升1‑3个点;三、得到ctx_s1和ctx_s2;四、得到融合结果;五、得到C;六、将t+1时刻qt+1按公式计算得到目标语言序列第t+1时刻的单词y′t+1的概率分布pt+1,根据pt+1采样出t+1时刻的目标单词y′t+1,直至解码出句子结束标记,解码翻译结束。本发明用于机器翻译领域。

    一种基于混合粒度的句子级机器翻译质量估计模型训练方法

    公开(公告)号:CN110472253A

    公开(公告)日:2019-11-19

    申请号:CN201910754140.0

    申请日:2019-08-15

    Abstract: 本发明公开了一种基于混合粒度的句子级机器翻译质量估计模型训练方法,所述训练方法包括以下步骤:步骤一:对机器译文进行词语级翻译质量标注;步骤二:对源文和机器译文进行基于深度学习方法的翻译质量特征抽取;步骤三:进行混合粒度的句子级翻译质量估计模型的训练,通过训练目标计算误差,再通过梯度反向传播更新模型的参数。本发明提出了一种基于混合粒度的句子级机器翻译质量估计模型训练方法,该方法相对于传统方法的优势主要在于:经过基于混合粒度的模型训练之后,与单一粒度下的训练相比,引入词语级上的翻译质量信息能取得较好的提升。

    一种面向特定领域的问题解答方法

    公开(公告)号:CN106844741A

    公开(公告)日:2017-06-13

    申请号:CN201710077735.8

    申请日:2017-02-13

    Abstract: 一种面向特定领域的问题解答方法,本发明涉及面向特定领域的问题解答方法。本发明的目的是为了解决现有技术对人名、地名、机构名等实体识别较为准确,对特定领域的专有名称识别不准的问题。具体过程为:一、构建特定领域词表,利用词表对输入问题进行分词;二、对分词后的输入问题进行问题分析,识别问题类型及问题成分;三、对问题成分进行语义及字符串层面的扩展,得到答案候选词;四、在知识库中进行答案候选词‑属性检索,得到答案候选段落;五、从答案候选段落筛选候选答案句。本发明用于特定领域的问题解答领域。

    一种面向医疗领域基于深度学习的命名实体识别方法

    公开(公告)号:CN106202054A

    公开(公告)日:2016-12-07

    申请号:CN201610590151.6

    申请日:2016-07-25

    Abstract: 一种面向医疗领域基于深度学习的命名实体识别方法,本发明涉及命名实体识别方法。本发明是要解决CRF模型由于不考虑语义信息,在训练语料极度缺乏的情况下,标注结果中会出现大量的无意义的标注结果的问题,而提出的一种面向医疗领域基于深度学习的命名实体识别方法。该方法是通过一、得到了补充医疗领域语料的词表voc和词表voc对应的词向量vec;二、利用有标注语料中的训练语料进行长短期记忆单元网络LSTM的训练;三、根据二中的更新的神经网络参数θ进行标注结果的路径查找,得到有标注语料的标注结果;利用命名实体识别评估标准F值对有标注语料中的测试语料的标注结果进行评估等步骤实现的。本发明应用于命名实体识别领域。

    基于伪反馈的个性化机器翻译系统及方法

    公开(公告)号:CN104199813A

    公开(公告)日:2014-12-10

    申请号:CN201410491100.9

    申请日:2014-09-24

    Abstract: 本发明涉及一种基于伪反馈的个性化机器翻译系统及方法。现有传统的机器翻译方法无法获得高质量的个性化翻译系统,造成不能满足用户各种翻译需求的问题。本发明翻译系统包括:用短语表过滤模块、输入模块、初步翻译模块、伪反馈检索模块、短语表分类模块和解码器模块。基于伪反馈的个性化机器翻译方法包括:输入过程:用户将翻译任务S输入;初步翻译过程:利用初步翻译模块得到翻译任务的初步机器翻译结果T′;伪反馈检索过程:利用伪反馈检索模块检索得到相似翻译实例的初步翻译结果和标准翻译译文R;短语表分类过程:使训练后的通用后编辑模型变成个性化后编辑模型,再过滤得到优化的个性化后编辑模型;解码器模块解码过程:以优化的个性化后编辑模型对翻译任务的初步机器翻译结果T′进行解码,得到佳化的最终翻译结果。本发明用于机器翻译领域。

    基于两两对齐的多语种句对齐方法及装置

    公开(公告)号:CN103617160A

    公开(公告)日:2014-03-05

    申请号:CN201310674134.7

    申请日:2013-12-11

    Abstract: 基于两两对齐的多语种句对齐方法及装置,属于信息技术领域,尤其涉及信息技术领域互联网语言翻译系统中的多语种句对齐方法。本发明是为了解决在利用两两对齐方法进行多语种句对齐时,对齐结果不一致的问题。本发明所述的基于两两对齐的多语种句对齐方法及装置,首先对不同语种文本中的句子进行两两对齐,获得两两对齐结果,然后对该结果进行冲突识别并将冲突的部分标记出来,最后对冲突部分进行评分并重新进行两两对齐,从而使得多语种句对齐结果具有一致性,从而可以将两两对齐结果中部分对齐错误的错误结果更正过来。本发明所述的基于两两对齐的多语种句对齐方法及装置,适用于信息技术领域互联网语言翻译系统中。

    密封电子装置多余物微粒的自动检测系统及其检测方法

    公开(公告)号:CN101275928B

    公开(公告)日:2011-03-23

    申请号:CN200810064193.1

    申请日:2008-03-28

    Abstract: 本发明提供了一种密封电子装置多余物微粒的自动检测系统及其检测方法。系统组成包括:声音传感器(1),转台(2),曲柄摇杆机构(3),IO&DA板卡(4),变频器(5),三相电机(6),声音信号调理电路(7),实时数据采集卡(8)和上位机处理器(9);声音传感器贴附在被测件外壁上,声音传感器(1)通过信号线与声音信号调理电路(7)连接;声音信号调理电路(7)连接实时数据采集卡(8);实时数据采集卡(8)连接上位机处理器(9),上位机处理器(9)通过IO&DA板卡(4)与变频器(5)的控制端连接;变频器(5)连接三相电机(6),三相电机(6)通过曲柄摇杆机构(3)驱动转台(2)。本发明解决了现有的传统PIND检测方法检测精度不高,客观性不强,不能实现自动检测自动判别,且只能对多余物微粒的有无做出判断,无法对多余物的材质特征做出判断等问题。

    一种结合知识图谱、大语言模型与视觉想象力机制的多模态机器翻译训练方法

    公开(公告)号:CN119962547A

    公开(公告)日:2025-05-09

    申请号:CN202510035739.4

    申请日:2025-01-09

    Abstract: 一种结合知识图谱、大语言模型与视觉想象力机制的多模态机器翻译训练方法,属于人工智能技术领域。为优化多模态机器翻译方法的图像生成质量,本发明包括人工设置待翻译句子,构建训练集1;应用文字处理库处理训练集1中的待翻译句子得到文字三元组,将训练集1中的待翻译句子输入图像生成模型生成图片后利用图像三元组提取模型处理得到图像三元组,应用两组三元组的距离性质对图像生成模型进行训练得到训练好的图像生成模型;将训练集1中的待翻译句子输入到训练好的图像生成模型待翻译句子对应生成图像进行编码处理,然后和对应的待翻译句子进行拼接后,构建训练集2,利用训练集2对大语言模型进行训练,优化大语言模型的多模态机器翻译性能。

Patent Agency Ranking