一种基于主题词向量与卷积神经网络的短文本分类方法

    公开(公告)号:CN110134786A

    公开(公告)日:2019-08-16

    申请号:CN201910397064.2

    申请日:2019-05-14

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于主题词向量与卷积神经网络的短文本分类方法,包括如下步骤:1)数据采集阶段:根据需求采集短文本数据,对其进行标签标注,作为训练集;2)数据预处理阶段:对文本进行分词,去停用词,无用文本过滤等;3)短文本特征表示,主题层面与词向量层面分别进行表征;4)主题词向量联合训练;5)卷积神经网络分类模型参数优化,迭代;6)新样本进行类别预测。本发明结合短文本数据特点,在特征表示阶段利用主题向量与词向量结合表示,对短文本自身数据特点进行语义特征扩展,在分类模型训练阶段利用卷积神经网络对局部敏感信息抽取能力进一步对文本语义信息进行挖掘,能够对短文本分类任务类别预测准确率等指标进行提高。

    一种基于层叠模型的命名实体识别方法

    公开(公告)号:CN110110335B

    公开(公告)日:2023-01-06

    申请号:CN201910384659.4

    申请日:2019-05-09

    Applicant: 南京大学

    Abstract: 基于层叠模型的复杂中文命名实体识别方法,1)模型训练阶段:a通过有标注的命名实体语料集在改进的损失函数计算下训练低层BiLSTM‑CRF模型并保存;b通过有标注的命名实体识别语料训练高层BiLSTM‑CRF模型并保存;2)模型预测阶段:将带预测语料送入低层模型,识别出粗粒度的命名实体作为初步结果传入高层模型。高层模型对初步结果继续识别,若识别结果不为单个命名实体则将结果重新输入高层模型,知道所有结果为单个命名实体;3)输出结果:收集语料经过层叠模型得到的所有命名实体即高层网络所有输出的命名实体,作为整个识别过程中识别出的最终结果。

    一种基于主题词向量与卷积神经网络的短文本分类方法

    公开(公告)号:CN110134786B

    公开(公告)日:2021-09-10

    申请号:CN201910397064.2

    申请日:2019-05-14

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于主题词向量与卷积神经网络的短文本分类方法,包括如下步骤:1)数据采集阶段:根据需求采集短文本数据,对其进行标签标注,作为训练集;2)数据预处理阶段:对文本进行分词,去停用词,无用文本过滤等;3)短文本特征表示,主题层面与词向量层面分别进行表征;4)主题词向量联合训练;5)卷积神经网络分类模型参数优化,迭代;6)新样本进行类别预测。本发明结合短文本数据特点,在特征表示阶段利用主题向量与词向量结合表示,对短文本自身数据特点进行语义特征扩展,在分类模型训练阶段利用卷积神经网络对局部敏感信息抽取能力进一步对文本语义信息进行挖掘,能够对短文本分类任务类别预测准确率等指标进行提高。

    一种基于层叠模型的命名实体识别方法

    公开(公告)号:CN110110335A

    公开(公告)日:2019-08-09

    申请号:CN201910384659.4

    申请日:2019-05-09

    Applicant: 南京大学

    Abstract: 基于层叠模型的复杂中文命名实体识别方法,1)模型训练阶段:a通过有标注的命名实体语料集在改进的损失函数计算下训练低层BiLSTM-CRF模型并保存;b通过有标注的命名实体识别语料训练高层BiLSTM-CRF模型并保存;2)模型预测阶段:将带预测语料送入低层模型,识别出粗粒度的命名实体作为初步结果传入高层模型。高层模型对初步结果继续识别,若识别结果不为单个命名实体则将结果重新输入高层模型,知道所有结果为单个命名实体;3)输出结果:收集语料经过层叠模型得到的所有命名实体即高层网络所有输出的命名实体,作为整个识别过程中识别出的最终结果。

Patent Agency Ranking