-
公开(公告)号:CN111737401B
公开(公告)日:2023-03-24
申请号:CN202010576549.0
申请日:2020-06-22
Applicant: 北方工业大学
IPC: G06F16/31 , G06F16/33 , G06F40/30 , G06F18/214 , G06F18/23 , G06N3/0442 , G06N3/049
Abstract: 本发明涉及自然语言处理技术领域,尤其涉及一种基于Seq2set2seq框架的关键词组预测方法。包括以下步骤:将当前问句输入预先训练的多标签分类器,输出多维向量;预先训练的多标签分类器是基于训练集中问句和问句回复所对应的关键词,采用胶囊网络进行训练得到的模型;S2、获取多维向量中前100维向量所对应的关键词,进行行列式点过程采样,得到多个指导中心词;S3、将当前问句和多个指导中心词输入预先训练的解码器,对应输出多组预测的关键词组。本发明提供的预测方法解决了现有方法中关键词组预测差异性差、生成关键词组少、性能波动的技术问题。
-
公开(公告)号:CN113836306B
公开(公告)日:2023-05-16
申请号:CN202111164139.6
申请日:2021-09-30
Applicant: 北方工业大学
IPC: G06F16/35 , G06F16/33 , G06N3/045 , G06N3/0464 , G06N3/0442 , G06N3/09 , G06F40/289 , G06Q50/20
Abstract: 本申请属于文本处理技术领域,具体涉及一种基于篇章成分识别的作文自动测评方法,该方法包括:获取用于测评的目标作文,目标作文为人物类中文记叙文文体作文;将目标作文输入到篇章成分识别模型中,得到篇章成分识别结果;其中,篇章成分识别模型是以标记段落结构作用的中文记叙文文体作文为训练样本,对融合注意力机制的双向长短时记忆网络进行训练得到的分类模型;将目标作文和篇章成分识别结果输入到基于文本卷积神经网络构建的篇章结构合理性评判模型,得到测评类别。本申请方法充分考虑了篇章成分及结构对作文评分的影响,通过建立的作文篇章成分标注及篇章结构评测数据集训练得到分类模型,从而实现了基于篇章成分及结构识别的自动测评。
-
公开(公告)号:CN113590821B
公开(公告)日:2023-04-14
申请号:CN202110843643.2
申请日:2021-07-26
Applicant: 北方工业大学
IPC: G06F16/35 , G06F40/211 , G06F40/30 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及一种隐含语篇关系的分类方法,包括:针对待分类的第一语篇信息和第二语篇信息,基于隐式语篇关系分类模型,获取第一语篇信息和第二语篇信息中语义信息的语义交互图结构;针对所述语义交互图结构,获取与第一语篇信息和第二语篇信息对应的语义特征;将获取的语义特征借助于指数映射投影到双曲空间中,获取所述第一语篇信息和第二语篇信息的分类结果;其中,所述隐式语篇关系分类模型为预先建立并训练的包括有上下文表示层、语义学习层、卷积层、聚合层和预测层的模型;所述上下文表示层、语义学习层执行获取语义交互图结构的过程,所述语义学习层、卷积层和所述聚合层执行获取语义特征的过程,所述预测层执行获取分类结果的过程。
-
-