-
公开(公告)号:CN114969279A
公开(公告)日:2022-08-30
申请号:CN202210380864.5
申请日:2022-04-12
Applicant: 东南大学
IPC: G06F16/332 , G06F16/35 , G06F40/174 , G06K9/62 , G06N3/04 , G06N3/08 , G06N5/04
Abstract: 本发明公开了一种基于层次图神经网络的表格文本问答方法,该方法首先通过稀疏检索器快速召回与问题关联的文本证据信息,并将这些证据信息填充到表格中;接着利用表格行选择模型对表格行打分排序,从而找到最有可能包含答案的答案行;然后对答案行以及关联文本融合编码得到特征向量表示,进而使用基于表格行的层次图神经网络对问题、单元格、短文进行图推理,以捕捉表格特有的半结构化信息;最后,通过三个相互关联的子任务求解得到问题对应的答案。本发明能够有效地解决表格和文本相互补充场景下的多跳问答问题。
-
公开(公告)号:CN114781367B
公开(公告)日:2024-11-12
申请号:CN202210422977.7
申请日:2022-04-21
Applicant: 东南大学
IPC: G06F40/284 , G06F40/30 , G06F18/2415 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于词干信息融合的关键词生成方法,该方法首先提取词干信息,将词干信息融入Embedding层,以增强同词干单词的强关联性;接着搜索文本中同词干变种组合构建参考文本,通过编码层模块提取参考文本中的词语义信息;再基于初始文本和参考文本加权扩充生成概率分布,采用双软开关复制机制修正复制机制带来的生成偏差;然后在译码器层面构建词干生成任务,通过词与词干的多任务联合训练获得最终关键词生成概率分布,缓解训练偏差导致网络性能无法充分发挥的问题,最后基于BeamSearch方法生成关键词。相比其他方法,本发明方法以词形态学为基础,生成能力强,预测准确率高,在文本理解方面具有明显优势。
-
公开(公告)号:CN115544245A
公开(公告)日:2022-12-30
申请号:CN202210390821.5
申请日:2022-04-14
Applicant: 东南大学
Abstract: 本发明公开了一种基于无监督学习的用户攻击性评论风格转换方法,该方法首先利用双向编码注意力机制对输入评论文本进行编码,所涉及的双向编码用来捕捉文本序列的上下文信息,所涉及的注意力机制用来保留文本的核心信息;其次,本发明通过使用生成器‑鉴别器进行对抗训练,解决非并行语料库中特定关键词匮乏问题;最后,本发明通过循环强化学习构造重构损失算法,确保攻击性评论转换后风格标签的准确性、文本内容的完整性和可读性。本发明可以有效解决攻击性评论风格转换中存在的语义丢失、并行语料缺乏以及内容保留程度较低等问题。
-
公开(公告)号:CN114896377B
公开(公告)日:2024-11-08
申请号:CN202210360978.3
申请日:2022-04-07
Applicant: 东南大学
IPC: G06F16/332
Abstract: 本发明公开了一种基于知识图谱的答案获取方法,具体如下:从问题与候选答案中提取相关的关键词信息;在知识图谱中提取从问题当中的关键词到选项当中关键词的路径;将路径输入路径证据聚合器PEF和图证据聚合器GEF当中,分别得到相关的路径证据信息和图证据信息;将题目与选项组合成状态向量并输入文本证据聚合器TEF当中,利用TEF当中的预训练语言模型捕捉文本之间的语义关联,获得知识图谱之外的特征;将以上获得的三种不同来源的证据融合成特征向量并最后得到选择分数。充分利用题目给定的信息,在捕获题目当中单词语义关系的同时,还能利用知识图谱获得相关的证据信息进行答案选择,将结构化和非结构化的证据相结合,推荐准确率高,可解释性好。
-
公开(公告)号:CN114969279B
公开(公告)日:2024-11-12
申请号:CN202210380864.5
申请日:2022-04-12
Applicant: 东南大学
IPC: G06F16/332 , G06F16/35 , G06F40/174 , G06F18/22 , G06N3/0442 , G06N3/042 , G06N3/0455 , G06N3/084 , G06N3/0985 , G06N5/04
Abstract: 本发明公开了一种基于层次图神经网络的表格文本问答方法,该方法首先通过稀疏检索器快速召回与问题关联的文本证据信息,并将这些证据信息填充到表格中;接着利用表格行选择模型对表格行打分排序,从而找到最有可能包含答案的答案行;然后对答案行以及关联文本融合编码得到特征向量表示,进而使用基于表格行的层次图神经网络对问题、单元格、短文进行图推理,以捕捉表格特有的半结构化信息;最后,通过三个相互关联的子任务求解得到问题对应的答案。本发明能够有效地解决表格和文本相互补充场景下的多跳问答问题。
-
公开(公告)号:CN115065678A
公开(公告)日:2022-09-16
申请号:CN202210362289.6
申请日:2022-04-07
Applicant: 东南大学
Abstract: 本发明公开了一种基于深度强化学习的多智能设备任务卸载决策方法,用于解决物联网环境下具有多个智能终端设备的云边端融合网络中混合任务卸载和资源分配问题,该方法以数据传输速率作为性能评价指标。首先,获取该环境中每个智能终端设备以及环境的配置信息,然后建立以最大数据传输速率为目标的多智能终端设备卸载模型,最后基于深度强化学习方法求解最优任务卸载方案,再依据总体最优卸载方案进行任务卸载。本发明能够有效解决多接入边缘计算(MEC)网络中多智能设备混合任务卸载和资源分配的问题。
-
公开(公告)号:CN114896377A
公开(公告)日:2022-08-12
申请号:CN202210360978.3
申请日:2022-04-07
Applicant: 东南大学
IPC: G06F16/332
Abstract: 本发明公开了一种基于知识图谱的答案获取方法,具体如下:从问题与候选答案中提取相关的关键词信息;在知识图谱中提取从问题当中的关键词到选项当中关键词的路径;将路径输入路径证据聚合器PEF和图证据聚合器GEF当中,分别得到相关的路径证据信息和图证据信息;将题目与选项组合成状态向量并输入文本证据聚合器TEF当中,利用TEF当中的预训练语言模型捕捉文本之间的语义关联,获得知识图谱之外的特征;将以上获得的三种不同来源的证据融合成特征向量并最后得到选择分数。充分利用题目给定的信息,在捕获题目当中单词语义关系的同时,还能利用知识图谱获得相关的证据信息进行答案选择,将结构化和非结构化的证据相结合,推荐准确率高,可解释性好。
-
公开(公告)号:CN114781367A
公开(公告)日:2022-07-22
申请号:CN202210422977.7
申请日:2022-04-21
Applicant: 东南大学
IPC: G06F40/284 , G06F40/30 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于词干信息融合的关键词生成方法,该方法首先提取词干信息,将词干信息融入Embedding层,以增强同词干单词的强关联性;接着搜索文本中同词干变种组合构建参考文本,通过编码层模块提取参考文本中的词语义信息;再基于初始文本和参考文本加权扩充生成概率分布,采用双软开关复制机制修正复制机制带来的生成偏差;然后在译码器层面构建词干生成任务,通过词与词干的多任务联合训练获得最终关键词生成概率分布,缓解训练偏差导致网络性能无法充分发挥的问题,最后基于BeamSearch方法生成关键词。相比其他方法,本发明方法以词形态学为基础,生成能力强,预测准确率高,在文本理解方面具有明显优势。
-
公开(公告)号:CN114048309A
公开(公告)日:2022-02-15
申请号:CN202111365252.0
申请日:2021-11-17
Applicant: 东南大学
Abstract: 本发明公开了一种问题驱动的社交网络答案摘要自动生成方法,所述方法包括以下步骤:步骤1:社交网络文本采集;步骤2:数据预处理;步骤3:模型训练;步骤4:模型测试与文本生成,本发明能够改善传统摘要生成方法中过度依赖语义关联性而导致泛化能力低和缺乏可推理性等问题,进而提升生成摘要的可读性、流畅性和简洁性。
-
-
-
-
-
-
-
-