-
公开(公告)号:CN109918556B
公开(公告)日:2021-06-25
申请号:CN201910174180.8
申请日:2019-03-08
Applicant: 北京工业大学
IPC: G06F16/951 , G06F16/35 , G06F40/289 , G06Q50/00
Abstract: 本发明公开了一种综合微博用户社交关系和文本特征抑郁情绪识别方法,以微博用户社交关系网络和发布微博文本数据运用机器学习的方法进行识别抑郁情绪用户。给微博文本打上抑郁情绪的特征标签利用分词器进行分词并同时去掉停用词。利用卡方检验进行特征值的提取与抑郁情绪相关的词语作为特征词。在选取出特征词后对每篇微博文本计算每个特征词的权重值,并同时将微博文本映射到一个特征向量。根据特征向量训练抑郁情绪文本分类模型。根据前N个最高概率计算出的平均概率和得到PageRank(pi)使用模型融合的方法计算出该用户的最终抑郁情绪结果。本发明综合微博用户社交关系和微博文本特征识别抑郁情绪方法可以进一步增强抑郁情绪识别精度。
-
公开(公告)号:CN112052869A
公开(公告)日:2020-12-08
申请号:CN202010675638.0
申请日:2020-07-14
Applicant: 北京工业大学
IPC: G06K9/62 , G06N3/04 , G06N3/08 , G06Q50/00 , G06F16/906 , G06F16/951 , G06F40/284
Abstract: 本发明实施例提供一种用户心理状态识别方法及系统,包括:对待分析目标用户的微博数据进行多模态数据特征融合处理,得到待分析目标用户的用户个人微博情感特征;对待分析目标用户的社交信息进行筛选,得到待分析目标用户的粉丝信息和关注者信息,并获取粉丝情感特征和关注者情感特征;将用户个人微博情感特征、粉丝情感特征和关注者情感特征进行社交关系特征融合,得到用户综合心理特征,并通过神经网络模型对用户综合心理特征进行分类,得到待分析目标用户的心理状态。本发明实施例通过将用户个人微博情感特征与用户社交关系特征进行社交关系特征融合处理,更全面地分析用户心理状态,从而提高情感分类的识别准确率。
-
公开(公告)号:CN111832307A
公开(公告)日:2020-10-27
申请号:CN202010657829.4
申请日:2020-07-09
Applicant: 北京工业大学
IPC: G06F40/295 , G06F40/30 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明实施例提供一种基于知识增强的实体关系抽取方法及系统。该方法包括:获取经预处理的领域本体,以及未标注语料库;基于经预处理的领域本体和未标注语料库获取实体知识信息,通过实体知识信息计算得到标注语料库;基于实体知识信息分别提取实体特征、词特征和实体位置特征,进一步进行位置特征融合,得到融合特征;获取PCNN模型,基于融合特征训练PCNN模型,得到实体关系抽取模型;将实体关系抽取模型的结果放入PCNN模型中,通过预设分类器得到实体关系类型分类结果。本发明实施例基于现有领域本体和未标注语料库进行训练,训练后的模型可以提供实体对对应的关系类别,可广泛应用于自然语言相关的应用,提高了关系抽取的准确率。
-
公开(公告)号:CN106484674B
公开(公告)日:2020-09-25
申请号:CN201610835901.1
申请日:2016-09-20
Applicant: 北京工业大学
IPC: G06F40/253 , G16H10/60 , G06N3/08
Abstract: 本发明公开一种基于深度学习的中文电子病历概念抽取方法,包括:利用多层稀疏自动编码器的深层架构训练出目标词的上下文分布式特征,之后合并本身具有高级概念意义的实体特征——标记特征和词性特征为整体特征,将整体特征输入到深度信念网络中进行模型训练。比对样本的标记特征进行残差计算,通过有监督地微调,对整个深层架构的性能进行优化调整。本发明的方法充分利用了深度学习对特征进行深层优化的特点,同时加入了实体特征作为先验知识,在减少了对于人工特征依赖的同时,可提高分类和预测的准确性。
-
公开(公告)号:CN111382790A
公开(公告)日:2020-07-07
申请号:CN202010154575.4
申请日:2020-03-07
Applicant: 北京工业大学
Abstract: 一种基于小波变换的高压直流故障分类方法,涉及故障探测技术领域。本发明包括如下步骤:步骤1,为保持原有的故障信号特征,利用软阈值去燥方法对断电点位数据进行去燥,去除断电点位中的噪声。步骤2,利用离散小波变换分别对断电点位和通电点位进行多尺度分解,提取出各频段的细节分量和近似分量。步骤3,提出一种自适应层数的小波包变换方法,对通电点位信号和断电点位信号进行充分分解,进一步提取高频特征,并对产生的特征进行降维处理。步骤4,将步骤2和步骤3产生的特征向量进行融合,并输入到训练好的SVM分类模型中进行识别检测。
-
公开(公告)号:CN110309870A
公开(公告)日:2019-10-08
申请号:CN201910564028.0
申请日:2019-06-24
Applicant: 北京工业大学
IPC: G06K9/62
Abstract: 一种图像分类的方法属于人工智能的一个重要领域,本发明设计涉及提取图像多种不同的特征,结合多空间图像重建方法形成新的训练样本,增加训练样本对于相应分类特征的显现,不同的特征处理对于不同条件下的分类特征敏感度不同,把多个特征组合起来形成新的RGB图像,然后选取几种不同高精度分类器对样本进行训练。由于不问分类器得到的识别结果之间往往互补性很强,所以将几种分类器的分类结果利用概率进行融合得到最后的识别分类结果,增加对于影响因素复杂多变的图像的分类准确度和灵敏度。
-
公开(公告)号:CN110085323A
公开(公告)日:2019-08-02
申请号:CN201910316298.X
申请日:2019-04-19
Applicant: 北京工业大学
Abstract: 本发明揭示了一种基于电子病历的诊疗路径发现方法,该方法包括以下步骤:S1步骤:通过根据发生在患者身上的所有医疗事件的发生时间来构建每个患者的医疗事件序列;S2步骤:使用序列预处理器将每个同时并发医疗事件拆分为若干个频繁子集以降低模式挖掘的计算复杂性;S3步骤:使用序列模式挖掘算法和模式增长策略对序列进行挖掘,得到序列中的频繁模式结果。本方法在充血性心力衰竭的电子病历数据集上进行了测试,结果显示该方法实现了在原始医疗序列缺乏相关数值和单个事件持续时间时对序列中频繁模式的挖掘功能。
-
公开(公告)号:CN104978587B
公开(公告)日:2018-06-01
申请号:CN201510409514.7
申请日:2015-07-13
Applicant: 北京工业大学
Abstract: 一种基于文档类型的实体识别合作学习算法,算法包括:模型构建模块和模型应用。其中,模型构建模块包括基于文档类型的实体识别分类器构建和文本分类器构建。模型应用包括文档类型识别和基于文档类型的实体识别。在本算法中结合了集成学习和协同训练算法,同时在数据集预处理过程中进行了基于文档类型的数据集切分,考虑了数据集的多样性。在模型构建过程中,利用稀疏标记数据作为训练数据,并且应用了多个基础算法,以集成学习模式对其进行集成,考虑了算法的多样性。结合了多种技术,考虑了算法和数据集的多样性,确保本发明在实体识别任务上能取得令人满意的效果。
-
公开(公告)号:CN107704886A
公开(公告)日:2018-02-16
申请号:CN201710982421.2
申请日:2017-10-20
Applicant: 北京工业大学
CPC classification number: G06K9/6268 , G06K9/3233 , G06K9/6256 , G06T7/0012 , G06T2207/10024 , G06T2207/20081 , G06T2207/20084 , G06T2207/20104 , G06T2207/30041
Abstract: 本发明公开一种基于深度卷积神经网络的医疗图像分级方法和系统,包括:原始眼底图像的自动分割,分成视盘视杯两部分图像;提取图像绿色通道分量;利用直方图均衡化修正提取出的灰度图像;分别提取杯盘比、视神经纤维层缺损两种特征;使用深度卷积神经网络算法训练多个子分类器;组合子分类器,投票得出最终分类结果。采用本发明的技术方案,分类准确率有明显提升,有助于减少误诊,从而提高分类器的实用价值。
-
公开(公告)号:CN106484674A
公开(公告)日:2017-03-08
申请号:CN201610835901.1
申请日:2016-09-20
Applicant: 北京工业大学
Abstract: 本发明公开一种基于深度学习的中文电子病历概念抽取方法,包括:利用多层稀疏自动编码器的深层架构训练出目标词的上下文分布式特征,之后合并本身具有高级概念意义的实体特征——标记特征和词性特征为整体特征,将整体特征输入到深度信念网络中进行模型训练。比对样本的标记特征进行残差计算,通过有监督地微调,对整个深层架构的性能进行优化调整。本发明的方法充分利用了深度学习对特征进行深层优化的特点,同时加入了实体特征作为先验知识,在减少了对于人工特征依赖的同时,可提高分类和预测的准确性。
-
-
-
-
-
-
-
-
-