-
公开(公告)号:CN110046253A
公开(公告)日:2019-07-23
申请号:CN201910283966.3
申请日:2019-04-10
Applicant: 广州大学
Abstract: 本发明属于自然语言处理技术,为语言冲突的预测方法,包括步骤:用机器学习方法获得候选对话数据集;对数据集进行筛选,筛选出开始为文明对话而随后恶化为有害对话的对话数据;下载所建立的语料库,使用convokit语料库类构建convokit语料库对象;提取语料的提示类型特征;在语料库上训练QuestionTypology对象,将Wiki语料库加载到数据集对象;提取礼貌策略特征;创建成对的数据;根据提示类型特征、礼貌策略特征和成对数据,构造特征矩阵;使用logistic回归模型,比较显示的语用特征,从而对网络对话是否可能恶化进行预测。本发明方法对网络对话是否可能恶化进行有效预测,有利于网络矛盾的防治处理。
-
公开(公告)号:CN110046253B
公开(公告)日:2022-01-04
申请号:CN201910283966.3
申请日:2019-04-10
Applicant: 广州大学
Abstract: 本发明属于自然语言处理技术,为语言冲突的预测方法,包括步骤:用机器学习方法获得候选对话数据集;对数据集进行筛选,筛选出开始为文明对话而随后恶化为有害对话的对话数据;下载所建立的语料库,使用convokit语料库类构建convokit语料库对象;提取语料的提示类型特征;在语料库上训练QuestionTypology对象,将Wiki语料库加载到数据集对象;提取礼貌策略特征;创建成对的数据;根据提示类型特征、礼貌策略特征和成对数据,构造特征矩阵;使用logistic回归模型,比较显示的语用特征,从而对网络对话是否可能恶化进行预测。本发明方法对网络对话是否可能恶化进行有效预测,有利于网络矛盾的防治处理。
-