-
公开(公告)号:CN110442684B
公开(公告)日:2020-06-30
申请号:CN201910748469.6
申请日:2019-08-14
Applicant: 山东大学
Abstract: 本发明涉及一种基于文本内容的类案推荐方法,该方法分为预训练部分和微调部分,预训练部分采用transformer编码器作为主结构,训练了一个中文语言模型,从其他语料库中学习中文语言知识,获得了一个高质量的语言模型。微调部分三元组模型为框架,以预处理过的司法文书为训练数据,从司法领域中学习到更多的关于判决的知识,获得了一个比较好的文本向量表示。与传统基于关键字的类案推荐方法和基于单任务神经网络的类案推荐方法相比,本发明提出的基于内容的类案推荐方法效果更好,基于语义训练模型具有更好的鲁棒性,这表明本发明提出的方法是有效的、实用的。
-
公开(公告)号:CN109344244B
公开(公告)日:2019-11-08
申请号:CN201811441314.X
申请日:2018-11-29
Applicant: 山东大学
IPC: G06F16/332 , G06F16/35
Abstract: 本发明涉及一种融合区分度信息的神经网络关系分类方法及其实现系统,包括:(1)数据预处理;(2)训练词向量;(3)抽取位置向量;将每一个词的词向量与高维位置特征向量级联,得到联合特征;(4)计算句子语义表示;利用双向LSTM编码实体的上下文信息和语义信息;(5)计算区分度向量;将两个实体向量做差与位置特征级联后,用一个Bi‑LSTM单元编码该输入;(6)将(4)和(5)的输出输入至CNN,输出融合了区分度信息的特征向量,输入至分类器中进行分类;(5)采用损失函数训练模型。本发明不需要人工抽取任何特征,联合模型也不需要借助另外的自然语言处理工具对数据做预处理,算法简单明了,效果达到了目前最好。
-
公开(公告)号:CN110442723A
公开(公告)日:2019-11-12
申请号:CN201910748118.5
申请日:2019-08-14
Applicant: 山东大学
Abstract: 本发明涉及一种基于多步判别的Co-Attention模型用于多标签文本分类的方法,基于算法改编方法,通过引入原始文本信息与前导标签的互注意力机制,实现了前导标签在文本编码过程中的信息过滤作用,优化了训练过程,原始文本内容对前导标签的注意力作用进一步缓解了单次错误预测导致的误差累积问题。本发明针对多标签文本分类任务的特点,采用特征向量差分融合与级联融合策略。通过差分,凸显了待预测标签所依赖的原始文本信息,优化了标签信息监督作用,获得了信息全面且具有区分度的最终编码向量。实现了原始文本信息、前导标签信息、待预测标签信息三者间的同时建模。
-
公开(公告)号:CN109344244A
公开(公告)日:2019-02-15
申请号:CN201811441314.X
申请日:2018-11-29
Applicant: 山东大学
IPC: G06F16/332 , G06F16/35
Abstract: 本发明涉及一种融合区分度信息的神经网络关系分类方法及其实现系统,包括:(1)数据预处理;(2)训练词向量;(3)抽取位置向量;将每一个词的词向量与高维位置特征向量级联,得到联合特征;(4)计算句子语义表示;利用双向LSTM编码实体的上下文信息和语义信息;(5)计算区分度向量;将两个实体向量做差与位置特征级联后,用一个Bi-LSTM单元编码该输入;(6)将(4)和(5)的输出输入至CNN,输出融合了区分度信息的特征向量,输入至分类器中进行分类;(5)采用损失函数训练模型。本发明不需要人工抽取任何特征,联合模型也不需要借助另外的自然语言处理工具对数据做预处理,算法简单明了,效果达到了目前最好。
-
公开(公告)号:CN110751208A
公开(公告)日:2020-02-04
申请号:CN201910995435.7
申请日:2019-10-18
Applicant: 山东大学
Abstract: 本发明涉及一种基于自权重差分编码器进行多模态特征融合的服刑人员情感识别方法,包括步骤如下:(1)数据预处理:对文本数据、语音数据、微表情数据分别进行预处理,使其符合不同模态对应模型的输入要求;(2)特征提取:对预处理后的文本、语音和微表情三个模态的数据所蕴含的情感信息分别进行提取,获取对应的特征向量;(3)特征融合:采用自权重差分编码器将特征向量进行特征融合:(4)训练模型,得到最优的情感识别模型。本发明利用自权重差分编码器进行多模态特征融合,通过多个模态特征的交叉互补,有效降低了单模态数据的局限性和错误信息的负面影响,使提取到的情感特征更加丰富、有效和准确,提高了服刑人员的情感识别效果。
-
公开(公告)号:CN110442684A
公开(公告)日:2019-11-12
申请号:CN201910748469.6
申请日:2019-08-14
Applicant: 山东大学
Abstract: 本发明涉及一种基于文本内容的类案推荐方法,该方法分为预训练部分和微调部分,预训练部分采用transformer编码器作为主结构,训练了一个中文语言模型,从其他语料库中学习中文语言知识,获得了一个高质量的语言模型。微调部分三元组模型为框架,以预处理过的司法文书为训练数据,从司法领域中学习到更多的关于判决的知识,获得了一个比较好的文本向量表示。与传统基于关键字的类案推荐方法和基于单任务神经网络的类案推荐方法相比,本发明提出的基于内容的类案推荐方法效果更好,基于语义训练模型具有更好的鲁棒性,这表明本发明提出的方法是有效的、实用的。
-
公开(公告)号:CN110472244B
公开(公告)日:2020-05-29
申请号:CN201910748149.0
申请日:2019-08-14
Applicant: 山东大学
IPC: G06F40/289 , G06F40/30 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于Tree‑LSTM和情感信息的短文本情感分类方法,包括步骤如下:(1)构建四类情感信息词典;四类情感信息词典包括情感词典、否定词词典、程度副词词典和连词词典;(2)数据预处理:确定每个句子包含的情感信息词及其位置信息;使其符合模型的输入要求;(3)根据不同的情感信息词的作用改进Tree‑LSTM模型;(4)对步骤(2)预处理后的数据进行特征提取;(5)训练模型,将步骤(2)预处理后的数据打乱后,分成训练集和测试集,运用不放回的方式随机抽取训练集中的N条数据做训练,循环多次后,使用测试集的数据测试实验结果的准确性,最终得到实验结果。
-
公开(公告)号:CN111192248A
公开(公告)日:2020-05-22
申请号:CN201911390016.7
申请日:2019-12-30
Applicant: 山东大学
Abstract: 本发明涉及一种用于核磁共振成像中的椎体定位、识别和分割的多任务关系学习方法。本发明基于深度学习充分地利用了多任务之间关系,极大地改善了由于椎体间相似及图像质量造成的挑战。对于脊柱的自动分析,提供了一种有效的多任务学习框架。这种框架可以很容易地推广到其它图像的应用,为图像的定位、识别和分割这三种任务的有效解决提供了通用的框架。
-
公开(公告)号:CN111126695A
公开(公告)日:2020-05-08
申请号:CN201911338060.3
申请日:2019-12-23
Applicant: 山东大学
Abstract: 本发明涉及一种基于社会关系网络情感流动的服刑人员改造表现预测方法,包括步骤如下:(1)数据预处理;(2)数学建模:建立用于预测服刑人员改造表现的外联耦合隐马尔可夫模型λ=(A,B,π,R);(3)模型学习:使用极大似然估计法来估计外联耦合隐马尔可夫模型的参数;(4)模型预测:使用维特比算法,通过得到学习得到的外联耦合隐马尔可夫模型,预测服刑人员改造表现。本发明充分考虑上一时段同监舍其他服刑人员的潜在情感状态对当前时段目标服刑人员的潜在情感状态的影响的同时,还加入了外界联系的影响,为预测目标服刑人员当前时段的改造表现,提高了预测模型的可靠性,为确定最终的监管等级或监管方式提供了数据支持。
-
公开(公告)号:CN110472244A
公开(公告)日:2019-11-19
申请号:CN201910748149.0
申请日:2019-08-14
Applicant: 山东大学
Abstract: 本发明涉及一种基于Tree-LSTM和情感信息的短文本情感分类方法,包括步骤如下:(1)构建四类情感信息词典;四类情感信息词典包括情感词典、否定词词典、程度副词词典和连词词典;(2)数据预处理:确定每个句子包含的情感信息词及其位置信息;使其符合模型的输入要求;(3)根据不同的情感信息词的作用改进Tree-LSTM模型;(4)对步骤(2)预处理后的数据进行特征提取;(5)训练模型,将步骤(2)预处理后的数据打乱后,分成训练集和测试集,运用不放回的方式随机抽取训练集中的N条数据做训练,循环多次后,使用测试集的数据测试实验结果的准确性,最终得到实验结果。
-
-
-
-
-
-
-
-
-