-
公开(公告)号:CN106528528A
公开(公告)日:2017-03-22
申请号:CN201610907156.7
申请日:2016-10-18
Applicant: 哈尔滨工业大学深圳研究生院
CPC classification number: G06F17/271 , G06F16/35 , G06F17/2785
Abstract: 本发明涉及自然语言处理技术领域,提供了一种文本情感分析的方法及装置。所述文本情感分析的方法包括以下步骤:获取原始语料,使用带有条件随机场的双向LSTM神经网络对所述原始语料的语句中的情感表达目标进行分析和识别;统计识别出的所述情感表达目标的数量,并根据所述情感表达目标的数量将所述语句判断为无情感表达目标的语句、带有一个情感表达目标的语句或带有多个情感表达目标的语句;将所述原始语料中的无情感表达目标的语句、带有一个情感表达目标的语句和/或带有多个情感表达目标的语句分别输入到三个一维卷积神经网络中进行情感分类,得到情感分类结果。本发明提高了文本情感分类的效率、准确性和容错性,能满足大规模语料处理的需求。
-
公开(公告)号:CN106502394A
公开(公告)日:2017-03-15
申请号:CN201610907518.2
申请日:2016-10-18
Applicant: 哈尔滨工业大学深圳研究生院
CPC classification number: G06F3/015 , G06F17/2765 , G06F2203/011 , G06K9/00503
Abstract: 本发明提供了一种基于脑电信号的词向量计算方法及装置,所述基于脑电信号的词向量计算方法包括:步骤S1,收集文本语料库,对文本语料库中的语料进行处理,得到以词组为单位的连续短语格式的语料;步骤S2,将连续短语格式的语料呈现给标注者,供标注者阅读,采集标注者阅读每一词组时的脑电信号;步骤S3,将采集到的词组对应的脑电信号作为预测目标,训练词向量,以当前词组为特征预测其上下文的脑电信号,构建基于脑电信号的词向量表示模型。本发明通过上述方案提高了词向量计算的准确性。
-
公开(公告)号:CN104573031A
公开(公告)日:2015-04-29
申请号:CN201510018617.0
申请日:2015-01-14
Applicant: 哈尔滨工业大学深圳研究生院
IPC: G06F17/30
CPC classification number: G06F17/30684 , G06F17/30654
Abstract: 一种微博突发事件检测方法,包括步骤:降维处理:基于LSH算法对微博数据流中的词汇进行映射处理;创建B-Sketch模型:创建微博数据流中的B-Sketch数据;推测突发事件:根据B-Sketch数据计算微博数据流中的事件加速率a和事件中词的分布向量p,根据事件加速率a判断事件是否为突发事件。由于通过LSH算法将所有词汇映射到低维空间,降低了计算的复杂度,并基于B-Sketch模型推测隐含的突发事件,使得能够快速有效的实时处理微博数据流,及早地检测出突发事件。
-
-