-
公开(公告)号:CN112269868A
公开(公告)日:2021-01-26
申请号:CN202011513956.3
申请日:2020-12-21
Applicant: 中南大学
IPC: G06F16/332 , G06F16/33 , G06F16/35 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于多任务联合训练的机器阅读理解模型的使用方法,具体包括如下步骤:S1:建立基于多任务学习的阅读理解模型,将阅读理解任务分为多个子任务,设计多个子模块分别进行处理,并进行多任务联合训练,其中子模块包括文本编码模块;答案抽取模块;答案分类模块;支撑句判别模块;S2:将文本及问题输入文本编码模块,由文本编码模块进行编码,然后输入至答案抽取模块与答案分类模块与支撑句判别模块;S3:由答案抽取模块、答案分类模块与支撑句判别模块输出结果。本发明可以避免文本的重复编码,同时将答案抽取,答案分类,支撑句判别三个模块进行多任务联合训练,相互促进,提升最终的模型表现。
-
公开(公告)号:CN112015871A
公开(公告)日:2020-12-01
申请号:CN202011189911.5
申请日:2020-10-30
Applicant: 中南大学
IPC: G06F16/33 , G06F16/35 , G06F40/211 , G06F40/289
Abstract: 本发明涉及文本特征提取和关系标注,公开了一种基于事件集远程监督的人物关系自动标注方法,具体包括以下步骤:S1:构建事件集;S2:基于事件集进行语料文本人物关系的标注,人物关系标注完毕之后的数据格式为:[实体1,实体2,句子,决定事件,人物关系]。本发明能解决关系缺失的问题。
-
公开(公告)号:CN112990353A
公开(公告)日:2021-06-18
申请号:CN202110402126.1
申请日:2021-04-14
Applicant: 中南大学
Abstract: 本发明涉及汉字易混淆集构建领域,公开了一种基于多模态模型的汉字易混淆集构建方法。S1:得到字形编码的相似度,S2:得到字音编码的相似度,S3:构建并训练出一个图像分类的神经网络模型,由图像分类的神经网络模型输出一个M维的向量,S4:构建并训练出一个音频分类的神经网络模型,由音频分类的神经网络模型输出一个M维的向量,S5:将汉字字符Ci的字形编码相似度向量、字音编码相似度向量、字形视觉易混淆向量、字音听觉易混淆向量,加权组合为一个向量,作为音形易混淆向量,从而依据音形易混淆向量中每个维度上的相似度,选择对应的字典Dic中的汉字,构成音形易混淆集。本发明能够模拟人的视觉和听觉构建易混淆集。
-
公开(公告)号:CN112269868B
公开(公告)日:2021-03-09
申请号:CN202011513956.3
申请日:2020-12-21
Applicant: 中南大学
IPC: G06F16/332 , G06F16/33 , G06F16/35 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于多任务联合训练的机器阅读理解模型的使用方法,具体包括如下步骤:S1:建立基于多任务学习的阅读理解模型,将阅读理解任务分为多个子任务,设计多个子模块分别进行处理,并进行多任务联合训练,其中子模块包括文本编码模块;答案抽取模块;答案分类模块;支撑句判别模块;S2:将文本及问题输入文本编码模块,由文本编码模块进行编码,然后输入至答案抽取模块与答案分类模块与支撑句判别模块;S3:由答案抽取模块、答案分类模块与支撑句判别模块输出结果。本发明可以避免文本的重复编码,同时将答案抽取,答案分类,支撑句判别三个模块进行多任务联合训练,相互促进,提升最终的模型表现。
-
公开(公告)号:CN113094622B
公开(公告)日:2021-12-10
申请号:CN202110444562.5
申请日:2021-04-23
Applicant: 中南大学
IPC: G06F16/958
Abstract: 本发明提供了一种网络舆情云平台用户单位变更配置的方法及系统,构建面向用户单位的网络舆情技术服务自选组合超市,为各接入舆情公司提供统一的面向用户单位的网络舆情数据采集模块和网络舆情数据分析模块展示平台,方便用户单位通过该展示平台,以跨各接入舆情系统的方式,自行组合成满足自身业务需求且由网络舆情云平台运营云舆情系统。接入舆情系统通过云舆情系统向用户单位提供网络舆情数据采集和网络舆情数据分析能力,可以有效减少各接入舆情系统(舆情公司)在市场营销方面的成本投入;用户单位可根据自身业务需求,以及网络舆情数据采集和网络舆情数据分析能力的优劣,对网络舆情数据采集和分析的配置进行变更,实现跨系统的灵活适配性。
-
公开(公告)号:CN112990353B
公开(公告)日:2021-07-30
申请号:CN202110402126.1
申请日:2021-04-14
Applicant: 中南大学
Abstract: 本发明涉及汉字易混淆集构建领域,公开了一种基于多模态模型的汉字易混淆集构建方法。S1:得到字形编码的相似度,S2:得到字音编码的相似度,S3:构建并训练出一个图像分类的神经网络模型,由图像分类的神经网络模型输出一个M维的向量,S4:构建并训练出一个音频分类的神经网络模型,由音频分类的神经网络模型输出一个M维的向量,S5:将汉字字符Ci的字形编码相似度向量、字音编码相似度向量、字形视觉易混淆向量、字音听觉易混淆向量,加权组合为一个向量,作为音形易混淆向量,从而依据音形易混淆向量中每个维度上的相似度,选择对应的字典Dic中的汉字,构成音形易混淆集。本发明能够模拟人的视觉和听觉构建易混淆集。
-
公开(公告)号:CN113094622A
公开(公告)日:2021-07-09
申请号:CN202110444562.5
申请日:2021-04-23
Applicant: 中南大学
IPC: G06F16/958
Abstract: 本发明提供了一种网络舆情云平台用户单位变更配置的方法及系统,构建面向用户单位的网络舆情技术服务自选组合超市,为各接入舆情公司提供统一的面向用户单位的网络舆情数据采集模块和网络舆情数据分析模块展示平台,方便用户单位通过该展示平台,以跨各接入舆情系统的方式,自行组合成满足自身业务需求且由网络舆情云平台运营云舆情系统。接入舆情系统通过云舆情系统向用户单位提供网络舆情数据采集和网络舆情数据分析能力,可以有效减少各接入舆情系统(舆情公司)在市场营销方面的成本投入;用户单位可根据自身业务需求,以及网络舆情数据采集和网络舆情数据分析能力的优劣,对网络舆情数据采集和分析的配置进行变更,实现跨系统的灵活适配性。
-
公开(公告)号:CN112015871B
公开(公告)日:2021-01-01
申请号:CN202011189911.5
申请日:2020-10-30
Applicant: 中南大学
IPC: G06F16/33 , G06F16/35 , G06F40/211 , G06F40/289
Abstract: 本发明涉及文本特征提取和关系标注,公开了一种基于事件集远程监督的人物关系自动标注方法,具体包括以下步骤:S1:构建事件集;S2:基于事件集进行语料文本人物关系的标注,人物关系标注完毕之后的数据格式为:[实体1,实体2,句子,决定事件,人物关系]。本发明能解决关系缺失的问题。
-
-
-
-
-
-
-