-
公开(公告)号:CN116956928A
公开(公告)日:2023-10-27
申请号:CN202310955765.X
申请日:2023-08-01
Applicant: 南京邮电大学
IPC: G06F40/295 , G06F40/284 , G06F40/30 , G06N3/0442 , G06N3/0464 , G06N3/08
Abstract: 一种财经领域的融合注意力机制的双通道特征提取命名实体识别方法,首先使用BERT预训练模型作为词嵌入模型来增强词的语义表示,根据词的上下文语境动态生成字向量,从而解决中文文本中一词多义的问题。再使用BiLSTM和IDCNN双通道特征提取层提取上下文的语义特征,来更好地提取上下文语义信息以及解决嵌套实体的问题,之后进一步输入到Self‑Attention机制层中,使得重要特征被赋予更高的权重,最后使用CRF进行序列标签解码得到最优的标签序列,以此来解决财经领域中实体识别效果差的问题。
-
公开(公告)号:CN118296137A
公开(公告)日:2024-07-05
申请号:CN202410080538.1
申请日:2024-01-19
Applicant: 南京邮电大学
IPC: G06F16/34 , G06N3/0442 , G06N3/0455 , G06Q10/107
Abstract: 一种基于HGT(Heterogeneous Graph Transformer)的电子邮件流自动摘要生成方法,包括以下步骤:电子邮件预处理:将离散的电子邮件信息按规则提取为包含主题、发件人、收件人等的结构化电子邮件流形式;标注邮件流:对无标注的邮件流数据进行人工标注,获取带有参考摘要的邮件流;异构图构建:将电子邮件流中的结构化信息按规则构建包含发件节点、表述节点、主题节点、讨论节点的异构图,用于在HGT中有效地捕获邮件流中的人物互动关系以及因果逻辑关系;基于HGT的生成式自动摘要模型:构建基于HGT的生成式自动摘要模型,具体包含:Bi‑LSTM词编码器、HGT图编码器、Pointer‑Generator解码器等;自动摘要生成:将用户所提供的邮件转化为清晰表述人物关系的文本摘要,使用户迅速获取邮件中的核心信息。
-