-
公开(公告)号:CN111046185A
公开(公告)日:2020-04-21
申请号:CN201911291310.2
申请日:2019-12-16
Applicant: 重庆邮电大学
IPC: G06F16/35 , G06F16/36 , G06F40/279
Abstract: 本发明涉及信息技术领域,涉及一种文本信息的知识图谱关系抽取方法、装置及终端;所述方法包括获取待抽取知识图谱关系的文本信息;使用多种词向量模型分别构建文本信息的词向量;将分别构建的词向量进行横向拼接,得到最终词向量;采用多层SKnet网络抽取出最终词向量的关系特征;将关系特征进行混合池化操作,将混合池化后的关系特征放入分类器中,得到该关系特征所属的文本信息的知识图谱关系抽取标签。本发明将不同词向量工具生成的词向量进行拼接从而增加词语信息;通过多层SKnet网络抽取词向量特征;对抽取后的特征进行混合池化操作,能够得到信息更加丰富、准确的关系特征。本发明抽取出能够提高抽取文本信息关系的效率。
-
公开(公告)号:CN112487146B
公开(公告)日:2022-05-31
申请号:CN202011386072.6
申请日:2020-12-02
Applicant: 重庆邮电大学
Abstract: 本发明涉及人工智能领域和自然语言处理领域,尤其涉及一种法律案件争议焦点获取方法、装置以及计算机设备;所述方法包括获取具有争议焦点的法律文本,归纳争议焦点的类别并将其视为标签,制作成法律案件争议焦点数据集;将如何获得争议焦点问题转化为分类问题,类的标签由上一步归纳所得,将原被告陈述内容分别作为输入,使用一种孪生BERT模型,对数据集进行训练得到模型结果;对无争议焦点的文书通过训练好的模型得到最终争议焦点结果。本发明收集、制作法律案件争议焦点数据集;使用一种孪生BERT模型,能够扩大输入长度,突破BERT长度为512的限制;得到更加精准的分类结果。本发明能够得到效果更好的法律案件争议焦点结果。
-
公开(公告)号:CN112487146A
公开(公告)日:2021-03-12
申请号:CN202011386072.6
申请日:2020-12-02
Applicant: 重庆邮电大学
Abstract: 本发明涉及人工智能领域和自然语言处理领域,尤其涉及一种法律案件争议焦点获取方法、装置以及计算机设备;所述方法包括获取具有争议焦点的法律文本,归纳争议焦点的类别并将其视为标签,制作成法律案件争议焦点数据集;将如何获得争议焦点问题转化为分类问题,类的标签由上一步归纳所得,将原被告陈述内容分别作为输入,使用一种孪生BERT模型,对数据集进行训练得到模型结果;对无争议焦点的文书通过训练好的模型得到最终争议焦点结果。本发明收集、制作法律案件争议焦点数据集;使用一种孪生BERT模型,能够扩大输入长度,突破BERT长度为512的限制;得到更加精准的分类结果。本发明能够得到效果更好的法律案件争议焦点结果。
-
公开(公告)号:CN111382366A
公开(公告)日:2020-07-07
申请号:CN202010139426.0
申请日:2020-03-03
Applicant: 重庆邮电大学
IPC: G06F16/9536 , G06F16/33 , G06F16/35 , G06Q50/00
Abstract: 本发明涉及自然语言处理、网络安全、社交网络、信息提取领域,尤其涉及一种基于语言和非语言特征的社交网络用户识别方法及装置,方法包括收集社交网络用户账号的评论文本,将不同的用户账号两两组合,得到社交网络马甲识别训练集;基于社交网络马甲识别训练集,从中提取语言和非语言的特征,将语言和非语言特征进行横向拼接;使用SVM模型对数据集进行训练,得到马甲识别模型,利用特征选择技术贪心算法选择最优的特征组合;将提取实时的两个用户的最优的特征组合,并将该特征组合输入SVM模型,即可识别出这两个用户账户是否为同一个用户操纵;本发明适用于任何的社交网络平台,模型简单、高效,对于识别马甲账号也有较高的准确率。
-
公开(公告)号:CN111310411B
公开(公告)日:2022-07-12
申请号:CN202010155810.X
申请日:2020-03-09
Applicant: 重庆邮电大学
Abstract: 本发明涉及一种基于多样性模型的文本相关性判定方法,包括:获取第一文档与第二文档,分别进行预处理,其中,所述预处理包括去除特殊符号和乱码;将预处理后的第一文档和第二文档合并转化为数字序列,输入至少两个预训练模型中;所述至少两个预训练模型分别获取合并后数字序列的向量,并加入噪声层分别获得对应的特征向量;将所述特征向量分别送入softmax函数,获得各自的相关性矩阵;将所述各自的相关性矩阵加权求和,获得相关性判断结果。本发明提高了判定文本相关性的有效性和准确性。
-
公开(公告)号:CN111274394A
公开(公告)日:2020-06-12
申请号:CN202010058018.2
申请日:2020-01-16
Applicant: 重庆邮电大学
IPC: G06F16/35 , G06F40/211 , G06F40/284 , G06K9/62
Abstract: 本发明属于自然语言处理领域,涉及一种实体关系的抽取方法、装置、设备及存储介质,所述方法包括获取每条语料的句法信息并预处理,将预处理后的句法信息输入到BERT模型中;获取语料的序列特征向量和每个词语的实值特征向量;利用词性标注和句法分析,划分出包含实体对的完整短句,利用词向量模型将完整短句中单词与实体的依存关系映射为实值向量;采用基于依存分析的单词级别的注意力机制,获取局部上下文语义特征向量;获得实体对的平移距离特征向量,将各个特征向量进行融合,从而抽取出的实体关系的多粒度特征;将抽取出的多粒度特征输入到分类器中进行分类。本发明能够减少噪声单词和错误句法分析带来的影响,提高了关系抽取的准确率。
-
公开(公告)号:CN111046185B
公开(公告)日:2023-02-24
申请号:CN201911291310.2
申请日:2019-12-16
Applicant: 重庆邮电大学
IPC: G06F16/35 , G06F16/36 , G06F40/279
Abstract: 本发明涉及信息技术领域,涉及一种文本信息的知识图谱关系抽取方法、装置及终端;所述方法包括获取待抽取知识图谱关系的文本信息;使用多种词向量模型分别构建文本信息的词向量;将分别构建的词向量进行横向拼接,得到最终词向量;采用多层SKnet网络抽取出最终词向量的关系特征;将关系特征进行混合池化操作,将混合池化后的关系特征放入分类器中,得到该关系特征所属的文本信息的知识图谱关系抽取标签。本发明将不同词向量工具生成的词向量进行拼接从而增加词语信息;通过多层SKnet网络抽取词向量特征;对抽取后的特征进行混合池化操作,能够得到信息更加丰富、准确的关系特征。本发明抽取出能够提高抽取文本信息关系的效率。
-
公开(公告)号:CN111382366B
公开(公告)日:2022-11-25
申请号:CN202010139426.0
申请日:2020-03-03
Applicant: 重庆邮电大学
IPC: G06F16/9536 , G06F16/33 , G06F16/35 , G06Q50/00
Abstract: 本发明涉及自然语言处理、网络安全、社交网络、信息提取领域,尤其涉及一种基于语言和非语言特征的社交网络用户识别方法及装置,方法包括收集社交网络用户账号的评论文本,将不同的用户账号两两组合,得到社交网络马甲识别训练集;基于社交网络马甲识别训练集,从中提取语言和非语言的特征,将语言和非语言特征进行横向拼接;使用SVM模型对数据集进行训练,得到马甲识别模型,利用特征选择技术贪心算法选择最优的特征组合;将提取实时的两个用户的最优的特征组合,并将该特征组合输入SVM模型,即可识别出这两个用户账户是否为同一个用户操纵;本发明适用于任何的社交网络平台,模型简单、高效,对于识别马甲账号也有较高的准确率。
-
公开(公告)号:CN111274394B
公开(公告)日:2022-10-25
申请号:CN202010058018.2
申请日:2020-01-16
Applicant: 重庆邮电大学
IPC: G06F16/36 , G06F16/35 , G06F40/211 , G06F40/284 , G06K9/62
Abstract: 本发明属于自然语言处理领域,涉及一种实体关系的抽取方法、装置、设备及存储介质,所述方法包括获取每条语料的句法信息并预处理,将预处理后的句法信息输入到BERT模型中;获取语料的序列特征向量和每个词语的实值特征向量;利用词性标注和句法分析,划分出包含实体对的完整短句,利用词向量模型将完整短句中单词与实体的依存关系映射为实值向量;采用基于依存分析的单词级别的注意力机制,获取局部上下文语义特征向量;获得实体对的平移距离特征向量,将各个特征向量进行融合,从而抽取出的实体关系的多粒度特征;将抽取出的多粒度特征输入到分类器中进行分类。本发明能够减少噪声单词和错误句法分析带来的影响,提高了关系抽取的准确率。
-
公开(公告)号:CN111310411A
公开(公告)日:2020-06-19
申请号:CN202010155810.X
申请日:2020-03-09
Applicant: 重庆邮电大学
Abstract: 本发明涉及一种基于多样性模型的文本相关性判定方法,包括:获取第一文档与第二文档,分别进行预处理,其中,所述预处理包括去除特殊符号和乱码;将预处理后的第一文档和第二文档合并转化为数字序列,输入至少两个预训练模型中;所述至少两个预训练模型分别获取合并后数字序列的向量,并加入噪声层分别获得对应的特征向量;将所述特征向量分别送入softmax函数,获得各自的相关性矩阵;将所述各自的相关性矩阵加权求和,获得相关性判断结果。本发明提高了判定文本相关性的有效性和准确性。
-
-
-
-
-
-
-
-
-