一种面向语义敏感词句的分析方法

    公开(公告)号:CN110209818B

    公开(公告)日:2021-08-10

    申请号:CN201910481481.5

    申请日:2019-06-04

    Abstract: 本发明公开一种面向语义敏感词句的分析方法,首先,对敏感词库进行义原上的拓展;准备混合敏感语料1和混合敏感语料语料2,并对语料1进行分词,生成word2vec词向量模型;确定词向量模型基于语料2的最佳相关拓展系数;词向量模型和最佳相关拓展系数对语料2语句分词后的词语列表进行相关词拓展;确定词语依据句法关系的敏感性传递函数;对词语敏感性按句法关系进行传递,得到句子的敏感向量,并将语料2得到的所有句子敏感向量标记敏感性,作为支持向量机训练数据;用支持向量机进行分类处理,得到敏感语句识别模型。采用本发明可快速有效地从海量文本信息中识别出语义敏感的词句,能维护网络社区环境的纯净。

    一种面向语义敏感词句的分析方法

    公开(公告)号:CN110209818A

    公开(公告)日:2019-09-06

    申请号:CN201910481481.5

    申请日:2019-06-04

    Abstract: 本发明公开一种面向语义敏感词句的分析方法,首先,对敏感词库进行义原上的拓展;准备混合敏感语料1和混合敏感语料语料2,并对语料1进行分词,生成word2vec词向量模型;确定词向量模型基于语料2的最佳相关拓展系数;词向量模型和最佳相关拓展系数对语料2语句分词后的词语列表进行相关词拓展;确定词语依据句法关系的敏感性传递函数;对词语敏感性按句法关系进行传递,得到句子的敏感向量,并将语料2得到的所有句子敏感向量标记敏感性,作为支持向量机训练数据;用支持向量机进行分类处理,得到敏感语句识别模型。采用本发明可快速有效地从海量文本信息中识别出语义敏感的词句,能维护网络社区环境的纯净。

Patent Agency Ranking