-
公开(公告)号:CN102111295A
公开(公告)日:2011-06-29
申请号:CN201110001347.4
申请日:2011-01-06
Applicant: 哈尔滨工程大学
Abstract: 本发明提供的是一种分布式系统中多层次测度网络关系构建方法。根据测度属性的类型对测度参数进行分层;构造任意两个测度属性对之间的概率转移矩阵;构建同一个层次中测度属性的网络关系模型;构建不同层次间测度参数的网络关系模型。本发明的优点在于:可以动态的更新分布式系统的测度参数之间的转移关系,并构建测度参数的立体层次网络模型。
-
公开(公告)号:CN101127043A
公开(公告)日:2008-02-20
申请号:CN200710072608.5
申请日:2007-08-03
Applicant: 哈尔滨工程大学
IPC: G06F17/30
Abstract: 本发明提供的是一种轻量级个性化搜索引擎及其搜索方法。由信息抓取模块、信息检索模块和用户个性分析模块三部分连接组成,其中信息抓取模块由抓取程序和索引程序组成,因特网信息资源和Web库接入信息抓取模块,信息抓取模块的输出连接用户个性分析模块,用户兴趣记录与查询关键字输入信息检索模块,信息检索模块与用户个性分析模块,信息检索模块与用户个性分析模块结合提供个性化检索服务。本发明的服务器端不需要增加存储开销,充分利用客户端的资源来实现个性化的搜索。通过客户端的存储与服务器端的用户行为跟踪引擎的结合,本发明给出了针对用户不同需求,符合用户兴趣的个性化搜索引擎的解决方案。
-
公开(公告)号:CN112861541B
公开(公告)日:2022-06-17
申请号:CN202011476049.6
申请日:2020-12-15
Applicant: 哈尔滨工程大学
IPC: G06F40/30 , G06F40/216 , G06F40/242 , G06F40/289 , G06F16/35 , G06K9/62
Abstract: 本发明提供了一种基于多特征融合的商品评论情感分析方法。对数据集进行噪音过滤,进行文本的分词、词性筛选,统计词频,得到预处理后的文本;对文本中的词语使用word2Vec进行词向量表示;使用基于词语共现度的方法,结合凝聚层次聚类算法挖掘商品评论中的有关属性的情感词;针对描述商品属性的情感词进行情感词典扩充,确定新词的情感倾向;将否定词典、连词词典、程度词典等文本特征、用户特征、商品特征进行多特征进行有机融合来确定文本的情感倾向,以此构建半监督训练集;根据构建的训练集,对文本进行基于SVM的情感分类。本发明提出的基于多特征融合的情感分类方法能够有效提高分类的准确度,在产品跟踪、服务反馈、意见挖掘以及舆情监控等方面有着重要的应用价值。
-
公开(公告)号:CN109492776B
公开(公告)日:2022-05-17
申请号:CN201811393919.6
申请日:2018-11-21
Applicant: 哈尔滨工程大学
Abstract: 本发明提供一种基于主动学习的微博流行度预测方法,包括如下步骤:利用新浪微博API爬取相关微博数据集;利用K‑Means算法将未标记数据集初始化训练集L;对训练数据进行特征提取得到特征向量;根据提取的特征向量训练基于支持向量机的主动学习的改进的模型,根据训练的多分类模型从未标记的样本集中选择出既有不确定性又具有多样性和代表性的样本;将筛选出的样本称为信息向量,交给专家标记;将标记的训练数据加入到初始训练集L中,循环此过程直到模型的性能达到稳定状态为止得到微博流行度预测模型。本发明减少了冗余性问题并降低了异常值问题,减少了训练样本的标记数量,同时也使得在训练数据少的情况下也得到很好的预测效果。
-
公开(公告)号:CN112528024A
公开(公告)日:2021-03-19
申请号:CN202011481477.8
申请日:2020-12-15
Applicant: 哈尔滨工程大学
IPC: G06F16/35 , G06F40/216 , G06F40/289 , G06K9/62
Abstract: 本发明提供了一种基于多特征融合的微博突发事件检测方法。对数据集进行噪音过滤;进行文本的分词,进行词性筛选,统计词频,得到预处理后的文本;对预处理结果进行突发词提取,结合词语的基础权重、突发权重、词语所受微博影响、用户影响力的计算结果进行加权求和得到词语的突发度,根据突发度进行词语的筛选,选出的词语作为突发词放入突发词集;对突发词集中的词语进行基于词语共现度的相似性计算,根据结果构建相似度矩阵;对相似度矩阵中的词语进行凝聚式层次聚类,根据聚类结果得到突发事件检测结果。本发明提出的突发词提取方法能够提高突发词提取的精准度,进而有效提高突发事件检测的准确率,为网络舆情监控、突发事件处理以及社会安全管理提供良好支撑。
-
公开(公告)号:CN110888991A
公开(公告)日:2020-03-17
申请号:CN201911190029.X
申请日:2019-11-28
Applicant: 哈尔滨工程大学
IPC: G06F16/36 , G06F40/30 , G06F40/289 , G06F16/35
Abstract: 本发明提供的是一种弱标注环境下的分段式语义标注方法。(1)输入待标注文本,使用数据挖掘算法自动化构建文本主题相关的“类别-实体-关系-扩展”四层领域本体;(2)使用已构建的四层领域本体对弱标记文本进行语义标注;(3)采用加入注意力机制的卷积神经网络对已标注的段落文本进行段落句群划分;(4)综合使用词袋模型验证句群划分准确性并对新生成的句群的标注信息进行筛选。本发明对历史、文学、娱乐、计算机等不同领域的文本均具有较好的标注和句群划分效果,解决了多学科弱标记资源文本无法准确处理和分析的问题,可以帮助用户缩小检索范围,快速找到搜索结果,提高搜索准确性。
-
公开(公告)号:CN110188200A
公开(公告)日:2019-08-30
申请号:CN201910446241.1
申请日:2019-05-27
Applicant: 哈尔滨工程大学
IPC: G06F16/35 , G06F16/33 , G06F16/9536 , G06F17/27 , G06Q50/00
Abstract: 本发明属于自然语言处理领域,具体涉及一种使用社交上下文特征的深度微博情感分析方法。本发明方法包括以下步骤:1)采集微博数据并对其进行预处理。具体包括采集和预处理微博文本信息和发布微博的用户信息即社交上下文信息;2)使用一种深度学习方法对微博社交上下文信息进行表示,将每个微博表示成为连续分布的实数向量;3)建立一个基于长短期记忆网络的深度学习分类模型,结合微博文本特征和社交上下文特征对微博进行情感分析。本发明针对微博数据的特点,提取了微博文本之间的上下文信息,并对其进行表示,将其作为特征同文本信息一起进行微博文本情感分析,本发明方法能够提高微博情感分析的效果。
-
公开(公告)号:CN109508380A
公开(公告)日:2019-03-22
申请号:CN201910041751.0
申请日:2019-01-16
Applicant: 哈尔滨工程大学
Abstract: 本发明涉及一种结合用户结构相似度进行微博情感分析的方法。方法包括以下步骤:(1)根据微博用户之间的关注关系,计算用户之间的结构相似度,建立用户相似度矩阵,即情绪感染性矩阵,同时建立情绪感染性模型;(2)根据社会学中的情感一致性理论,建立微博之间的情感一致性关系矩阵,同时建立情绪一致性模型;(3)使用前两步生成的模型,建立根据微博间关系矩阵形成的微博情感分析模型;(4)在前三步的基础上,加入使用微博文本内容的情感分析模型;(5)对第四步建立的模型进行优化,求解出微博情感分析器。本发明的优势在于针对微博数据的特点,提出了结合微博数据间关系的方法进行情感分析,有效的提高了微博情感分析的准确率。
-
公开(公告)号:CN109492924A
公开(公告)日:2019-03-19
申请号:CN201811393912.4
申请日:2018-11-21
Applicant: 哈尔滨工程大学
IPC: G06Q10/06 , G06Q50/00 , G06F16/951
Abstract: 一种基于微博用户自身和行为价值二阶的影响力评估方法,属于计算机数据挖掘技术领域。包括:(1)利用爬虫技术和微博官方API接口采集微博数据;(2)对采集后的数据处理,得出所需用户的特征向量;(3)通过用户所有粉丝的自身价值来计算该用户的自身价值;(4)通过用户所有推送转发者的行为价值来计算用户的行为价值;(5)综合用户的自身与行为价值计算用户最终的影响力。本发明通过对用户粉丝数量、质量的计算和用户推送微博的转发者行为质量的计算,即避免了僵尸粉、推销商造成的虚假影响力又突出了推送较少但质量极高的用户的隐藏影响力;对于发现微博平台中信息的传播规律、广告投放、病毒式营销和舆情管控等工作具有重要意义。
-
公开(公告)号:CN108830842A
公开(公告)日:2018-11-16
申请号:CN201810561043.5
申请日:2018-06-04
Applicant: 哈尔滨工程大学
Abstract: 本发明提供的是一种基于角点检测的医学图像处理方法。一:对医学图像进行预处理;二:提取Harris角点;三:计算尺度归一化算子,检测每个点在某一个尺度响应值是否达到最大,获得提取的角点矩阵;四:获得了图像的角点矩阵之后将获得的点在图像中绘制出来,之后将角点矩阵传给聚类算法,进行聚类处理;五:给出一个K值,按照Kmeans算法进行聚类处理,用相似度矩阵作为判别函数,相似度低于阈值的类,不再进行合并。本发明无论是效果还是处理效率,亦或是在实际中的应用方面,均表现出了优越性与极大的适用价值。
-
-
-
-
-
-
-
-
-