一种用于舆情文本分析的半监督方法和装置

    公开(公告)号:CN114595333A

    公开(公告)日:2022-06-07

    申请号:CN202210447550.2

    申请日:2022-04-27

    Abstract: 本发明提供了一种用于舆情文本分析的半监督方法和装置,针对标注样本、未标注样本采用半监督方法提高舆情文本分析的分类准确率,首先获取舆情数据集,对数据集进行预处理;预处理后的样本使用数据增强算法生成数据增强样本;使类别标签无监督抽取聚类方式为数据集中未标注的样本生成类别标签;采用词向量隐语义空间,计算相似度与线性插值运算,运算结果生成相似度插值样本;构建最终训练样本集;采用半监督方法并使用预训练语言模型,输入最终训练样本集,对模型进行训练得到分类模型,使用分类模型对测试集预测得出分类结果。对比传统文本分类实验表明,使用该方法和装置在少量标注舆情样本、未标注舆情样本情况下提高舆情文本分类的准确率。

    一种用于法律文书的命名实体识别的标注方法和装置

    公开(公告)号:CN114580424A

    公开(公告)日:2022-06-03

    申请号:CN202210434737.9

    申请日:2022-04-24

    Abstract: 本发明公开了一种用于法律文书的命名实体识别的标注方法和装置,包括以下步骤:步骤S1:获取法律文本,转换成索引表;步骤S2:输出句子特征编码结果;步骤S3:训练及预测;步骤S4:得到集合;步骤S5:得到多头分数转移矩阵;步骤S6:得出所述法律文本对应的分数转移矩阵;步骤S7:确定识别嵌套实体;步骤S8:利用所述识别嵌套实体构建实体标注模板。本发明通过改变对BERT模型的输入,尝试完成对嵌套实体标注的识别,利用本发明所述的多头选择矩阵标注思路,较大程度的缓解了NER任务中长文本以及嵌套实体的识别难度。

    一种基于模型剪枝的星载目标识别方法及装置

    公开(公告)号:CN118314473A

    公开(公告)日:2024-07-09

    申请号:CN202410741910.9

    申请日:2024-06-11

    Abstract: 本发明公开了一种基于模型剪枝的星载目标识别方法及装置,包括:获取神经网络YOLOv5模型,神经网络YOLOv5模型实时识别图像或视频中的对象;对神经网络YOLOv5模型进行剪枝和重训练,剪枝包括结构化剪枝、非结构化剪枝;将经过处理的神经网络YOLOv5模型部署至星载计算机,加载遥感卫星云层图像训练数据集进行训练并推理,对推理结果进行解析,识别出卫星云图。通过本发明,能够保留YOLOv5模型的精简结构,且实现深度学习神经网络YOLOv5模型冗余参数的细粒度优化,减少神经网络YOLOv5模型参数量,从而降低计算量,保证深度学习神经网络YOLOv5模型在有限算力星载计算机中运行推理,识别出卫星云图。

    一种用于舆情文本分析的半监督方法和装置

    公开(公告)号:CN114595333B

    公开(公告)日:2022-08-09

    申请号:CN202210447550.2

    申请日:2022-04-27

    Abstract: 本发明提供了一种用于舆情文本分析的半监督方法和装置,针对标注样本、未标注样本采用半监督方法提高舆情文本分析的分类准确率,首先获取舆情数据集,对数据集进行预处理;预处理后的样本使用数据增强算法生成数据增强样本;使类别标签无监督抽取聚类方式为数据集中未标注的样本生成类别标签;采用词向量隐语义空间,计算相似度与线性插值运算,运算结果生成相似度插值样本;构建最终训练样本集;采用半监督方法并使用预训练语言模型,输入最终训练样本集,对模型进行训练得到分类模型,使用分类模型对测试集预测得出分类结果。对比传统文本分类实验表明,使用该方法和装置在少量标注舆情样本、未标注舆情样本情况下提高舆情文本分类的准确率。

    一种用于法律文书的命名实体识别的标注方法和装置

    公开(公告)号:CN114580424B

    公开(公告)日:2022-08-05

    申请号:CN202210434737.9

    申请日:2022-04-24

    Abstract: 本发明公开了一种用于法律文书的命名实体识别的标注方法和装置,包括以下步骤:步骤S1:获取法律文本,转换成索引表;步骤S2:输出句子特征编码结果;步骤S3:训练及预测;步骤S4:得到集合;步骤S5:得到多头分数转移矩阵;步骤S6:得出所述法律文本对应的分数转移矩阵;步骤S7:确定识别嵌套实体;步骤S8:利用所述识别嵌套实体构建实体标注模板。本发明通过改变对BERT模型的输入,尝试完成对嵌套实体标注的识别,利用本发明所述的多头选择矩阵标注思路,较大程度的缓解了NER任务中长文本以及嵌套实体的识别难度。

Patent Agency Ranking