-
公开(公告)号:CN109977407A
公开(公告)日:2019-07-05
申请号:CN201910236193.3
申请日:2019-03-27
IPC: G06F17/27
Abstract: 本发明涉及一种基于词嵌入的书面语篇多层次差异分析方法,包括:步骤1)对独白语篇与对话语篇进行差异分析;步骤2)分析不同字/词嵌入与语篇用词之间的关联性。所述步骤1)包括:结构差异分析、关系差异分析、用语差异分析。所述步骤2)包括:对比独白语篇和对话语篇中出现的字/词与各个数据集字/词嵌入的重合情况;使用字/词嵌入的目的是对字词用特定维度的向量进行表示,进行模型的训练。本发明通过统计分析方法对独白语篇和对话语篇进行多层次、多角度的差异分析,找出了在独白语篇和对话语篇中存在从结构到具体功能分布之间的差异,从篇章结构以及句长、词汇用法等层面对这些差异加以表现,可以很好地满足实际应用的需要。