-
公开(公告)号:CN113255755A
公开(公告)日:2021-08-13
申请号:CN202110538947.8
申请日:2021-05-18
Applicant: 北京理工大学
Abstract: 本发明公开了一种基于异质融合网络的多模态情感分类方法,属于意见挖掘和情感分析技术领域。包括:1)视频数据预处理;2)构建文本特征向量和识别文本情感类别;3)构建图片特征向量和识别图片情感类别;4)构建音频特征向量和识别音频情感类别;5)构建多模态全局特征向量与识别多模态全局情感类别;6)构建多模态局部特征向量与识别多模态局部情感类别;7)采用投票策略获得最终的情感分类结果。异质融合网络采用了模态内融合和模态间融合两种融合形式,宏观和微观两种融合角度,以及特征层融合和决策层融合两种融合策略。所述方法能深度挖掘多模态数据之间隐含的关联信息,实现多模态数据之间的相互补充和融合,从而提高多模态情感分类的准确率。
-
公开(公告)号:CN112580859A
公开(公告)日:2021-03-30
申请号:CN202011415067.3
申请日:2020-12-03
Applicant: 北京理工大学 , 中国地质大学(北京)
Abstract: 本发明涉及一种基于全局注意力机制的雾霾预测方法,属于人工智能信息预测技术领域。本方法首先获取环境监测点的雾霾数据,对获取的雾霾数据进行处理,基于全局注意力机制训练雾霾预测模型,使用雾霾预测模型输出最终预测结果。在雾霾预测任务中,引入全局注意力机制,为不同影响因素赋予不同的权重,有效解决信息传输距离过长的问题。引入双向门控循环神经网络,不仅引入训练数据中前面时刻数据对后面时刻数据的影响,并且分析后面时刻数据和前面时刻数据的关联,解决了雾霾预测数据中的长期依赖问题,能够准确地预测未来时刻的雾霾数据。本方法具有良好的扩展性,可根据不同地区的数据特征,动态改变网络结构,得到适合本地区的雾霾预测方法。
-
公开(公告)号:CN111931505A
公开(公告)日:2020-11-13
申请号:CN202010823162.0
申请日:2020-08-17
Applicant: 北京理工大学
IPC: G06F40/295 , G06N3/04
Abstract: 本发明公开了一种基于子图嵌入的跨语言实体对齐方法,属于知识图谱构建和大数据挖掘技术领域。包括:步骤1:构建实体信息、属性信息、训练集和测试集;步骤2:构建训练集的实体嵌入矩阵初始值,跨语言知识图谱KG1和KG2的邻接矩阵;步骤3:基于训练集,训练图卷积网络模型,生成实体的嵌入表示;步骤4:在利用训练集完成图卷积网络模型的参数训练后,将测试集输入至图卷积网络模型,基于图卷积网络和子图嵌入,生成测试集中实体的嵌入表示;步骤5:判别测试集中的实体对齐关系。所述方法通过图卷积网络模型和带有注意力机制的子图嵌入生成实体结点的嵌入表示,提高了跨语言实体对齐的识别性能,在多语言信息检索及问答系统等领域具有广阔的应用前景。
-
公开(公告)号:CN112580859B
公开(公告)日:2022-10-18
申请号:CN202011415067.3
申请日:2020-12-03
Applicant: 北京理工大学 , 中国地质大学(北京)
Abstract: 本发明涉及一种基于全局注意力机制的雾霾预测方法,属于人工智能信息预测技术领域。本方法首先获取环境监测点的雾霾数据,对获取的雾霾数据进行处理,基于全局注意力机制训练雾霾预测模型,使用雾霾预测模型输出最终预测结果。在雾霾预测任务中,引入全局注意力机制,为不同影响因素赋予不同的权重,有效解决信息传输距离过长的问题。引入双向门控循环神经网络,不仅引入训练数据中前面时刻数据对后面时刻数据的影响,并且分析后面时刻数据和前面时刻数据的关联,解决了雾霾预测数据中的长期依赖问题,能够准确地预测未来时刻的雾霾数据。本方法具有良好的扩展性,可根据不同地区的数据特征,动态改变网络结构,得到适合本地区的雾霾预测方法。
-
公开(公告)号:CN113779993B
公开(公告)日:2023-02-28
申请号:CN202110890112.9
申请日:2021-08-04
Applicant: 北京理工大学
IPC: G06F40/295 , G06F40/289 , G06F40/242 , G06F16/35 , G06N3/042
Abstract: 本发明涉及一种基于多粒度文本嵌入的医学实体识别方法,属于信息抽取和知识图谱构建技术领域。所述医学实体识别方法,包括:构建多粒度文本嵌入:通过预训练语言模型,构建多粒度文本嵌入,多粒度文本嵌入包括字符嵌入、词嵌入、词性嵌入、子串嵌入及短语嵌入;生成模式权重:根据医学术语构成模式,生成中文句子中所有字符的模式权重;结点嵌入表示学习:使用图注意力网络和模式强化注意力机制,进行结点嵌入表示学习;输出医学文本实体识别结果:采用条件随机场生成医学文本的实体类别标签,输出医学实体识别结果。所述方法解决了医学实体识别中图表示信息利用不足、文本分布式表示的嵌入粒度单一的问题,提高了医学实体识别的性能。
-
公开(公告)号:CN110196945B
公开(公告)日:2021-10-01
申请号:CN201910447984.0
申请日:2019-05-27
Applicant: 北京理工大学
IPC: G06F16/9535 , G06K9/62 , G06Q10/04
Abstract: 本发明涉及一种基于LSTM与LeNet融合的微博用户年龄预测方法,属于信息预测技术领域,包括以下步骤:爬取数据:爬取微博用户的信息,并保存到本地计算机;微博文本分词:文本内容分词、停用词过滤后,分词结果向量化;搭建LSTM:对向量采用长短期记忆模型LSTM建模,并预测用户年龄;图片预处理:将图片统一成相同大小;搭建LeNet:搭建LeNet模型,将数据集图片数据增强并转为张量,并测试选出最高命中率的模型;结果整合:将训练好的文本处理模块模型与图片处理模块模型整合处理。对比现有技术,本发明解决了以往模型难以跟上潮流的问题,提高了识别准确度,在未来的用户运营、精准广告营销、用户分析、数据分析和推荐系统等领域具有广泛的应用前景。
-
公开(公告)号:CN113255755B
公开(公告)日:2022-08-23
申请号:CN202110538947.8
申请日:2021-05-18
Applicant: 北京理工大学
Abstract: 本发明公开了一种基于异质融合网络的多模态情感分类方法,属于意见挖掘和情感分析技术领域。包括:1)视频数据预处理;2)构建文本特征向量和识别文本情感类别;3)构建图片特征向量和识别图片情感类别;4)构建音频特征向量和识别音频情感类别;5)构建多模态全局特征向量与识别多模态全局情感类别;6)构建多模态局部特征向量与识别多模态局部情感类别;7)采用投票策略获得最终的情感分类结果。异质融合网络采用了模态内融合和模态间融合两种融合形式,宏观和微观两种融合角度,以及特征层融合和决策层融合两种融合策略。所述方法能深度挖掘多模态数据之间隐含的关联信息,实现多模态数据之间的相互补充和融合,从而提高多模态情感分类的准确率。
-
公开(公告)号:CN110196945A
公开(公告)日:2019-09-03
申请号:CN201910447984.0
申请日:2019-05-27
Applicant: 北京理工大学
IPC: G06F16/9535 , G06K9/62 , G06Q10/04
Abstract: 本发明涉及一种基于LSTM与LeNet融合的微博用户年龄预测方法,属于信息预测技术领域,包括以下步骤:爬取数据:爬取微博用户的信息,并保存到本地计算机;微博文本分词:文本内容分词、停用词过滤后,分词结果向量化;搭建LSTM:对向量采用长短期记忆模型LSTM建模,并预测用户年龄;图片预处理:将图片统一成相同大小;搭建LeNet:搭建LeNet模型,将数据集图片数据增强并转为张量,并测试选出最高命中率的模型;结果整合:将训练好的文本处理模块模型与图片处理模块模型整合处理。对比现有技术,本发明解决了以往模型难以跟上潮流的问题,提高了识别准确度,在未来的用户运营、精准广告营销、用户分析、数据分析和推荐系统等领域具有广泛的应用前景。
-
公开(公告)号:CN116226396A
公开(公告)日:2023-06-06
申请号:CN202310030909.0
申请日:2023-01-10
Applicant: 北京理工大学 , 北京大学人民医院 , 中国医学科学院医学信息研究所
Abstract: 本发明提出了基于逻辑规则与关系多元编码的时序知识图谱推理方法,属于知识图谱构建和自然语言处理领域。本发明引入基于关系类型的时序规则扩充机制,即基于对称关系、互逆关系、等价关系以及从属关系的对时序规则集进行扩充。提取时序规则中关系的逻辑信息的关系规则特征,将关系的静态特征与关系的规则特征相融合获得关系的多元特征;融合基于逻辑规则的时序知识图谱推理模型与基于关系多元编码的时序知识图谱推理模型。本方法有助于解决关系信息获取片面和模型可解释性弱的问题,提高了时序知识图谱推理的性能,具有广阔的应用前景。
-
公开(公告)号:CN113779993A
公开(公告)日:2021-12-10
申请号:CN202110890112.9
申请日:2021-08-04
Applicant: 北京理工大学
IPC: G06F40/295 , G06F40/289 , G06F40/242 , G06F16/35 , G06N3/04
Abstract: 本发明涉及一种基于多粒度文本嵌入的医学实体识别方法,属于信息抽取和知识图谱构建技术领域。所述医学实体识别方法,包括:构建多粒度文本嵌入:通过预训练语言模型,构建多粒度文本嵌入,多粒度文本嵌入包括字符嵌入、词嵌入、词性嵌入、子串嵌入及短语嵌入;生成模式权重:根据医学术语构成模式,生成中文句子中所有字符的模式权重;结点嵌入表示学习:使用图注意力网络和模式强化注意力机制,进行结点嵌入表示学习;输出医学文本实体识别结果:采用条件随机场生成医学文本的实体类别标签,输出医学实体识别结果。所述方法解决了医学实体识别中图表示信息利用不足、文本分布式表示的嵌入粒度单一的问题,提高了医学实体识别的性能。
-
-
-
-
-
-
-
-
-