-
公开(公告)号:CN111782659A
公开(公告)日:2020-10-16
申请号:CN202010663640.6
申请日:2020-07-10
Applicant: 东北大学
IPC: G06F16/22 , G06F16/23 , G06F16/245 , G06F16/28
Abstract: 本发明适用于计算机领域,提供了一种数据库索引创建方法、装置、计算机设备和存储介质,其中,所述一种数据库索引创建方法包括获取第一索引与检索条件,以及根据所述检索条件对所述第一索引进行调整得到目标索引,所述检索条件至少包含检索目标的上界和下界。本发明实施例提供的一种数据库索引创建方法,通过第一索引实现对数据的快速访问,第一索引是根据数据库中存储的数据预先构建的索引,具有较短的初始化时间,同时,根据检索条件对第一索引进行调整得到目标索引,通过不断查询自适应的构建索引,最终形成一个完整的索引,解决了一次性构建的完整索引在初始化阶段等待耗时过长的问题。
-
公开(公告)号:CN110472115A
公开(公告)日:2019-11-19
申请号:CN201910728636.0
申请日:2019-08-08
Applicant: 东北大学
IPC: G06F16/9035 , G06F16/906 , G06F16/951 , G06Q50/00
Abstract: 本发明提供一种基于深度学习的社交网络文本情感细粒度分类方法,涉及情感多分类领域,本发明使用Scrapy框架爬取社交网络文本数据,进行数据清洗、分词,将分词结果作为word2vec的输入进行词向量转化;基于CNN模型进行文本的情感8分类,将词向量转化结果作为CNN嵌入层的输入,进行卷积、池化、概率计算等前向、反向传播过程训练模型,实现对网络评论情感分类的迁移学习,对社交网络文本进行二轮抽样实现实例迁移、训练分类器,并对评论进行情感预测;对前述工作进行系统设计,对分析结果进行可视化展示,利用MVC三层架构设计展示模块,并针对单文本或多文本情感细粒度分类、跨平台迁移学习文本情感细粒度分类、社交网络热度地图等三方面功能对界面进行设计。
-
公开(公告)号:CN110472014A
公开(公告)日:2019-11-19
申请号:CN201910729469.1
申请日:2019-08-08
Applicant: 东北大学
Abstract: 本发明提供一种面向社交网络文本基于识别新词旧义的情感分类方法,涉及情感分析技术领域,本发明使用词语的相邻词语计算条件熵值,以识别语境变化,提出了基于条件熵识别语境的DCC-CE算法,通过DCC-CE算法识别语境变化并结合词语共现度,来解决旧词新义识别以及新词发现问题,由此提出基于共现度识别旧词新义相关新词的DNEW-DCC算法,将DCC-CE和DNEW-DCC算法作为旧词新义识别的步骤添加到情感分类中,以改善旧词新义对情感分类准确度的影响,并由此提出通过旧词新义改善情感分类的NMOW-AC算法。
-
公开(公告)号:CN109901932A
公开(公告)日:2019-06-18
申请号:CN201910185650.0
申请日:2019-03-12
Applicant: 东北大学
Abstract: 本发明公开了一种基于虚拟机的服务器整合方法,所述基于虚拟机的服务器整合方法包括基于动态阈值的服务器局部整合算法和基于遗传算法的服务器全局整合算法。本发明科学合理,使用安全方便,通过局部整合和全局整合,可以有效地实现依据云数据中心负载变化动态来进行服务器整合的重要功能,从而提升业务支撑能力和运维效率、降低投资和决策风险,达到节省投资和节约能源的目的。提出的服务器局部整合算法的目标是对处于高载状态和低载状态的服务器进行小范围内的局部整合,满足节能要求;服务器全局整合算法的目标是在更大范围内对服务器进行整合,在保证服务质量的同时使虚拟机运行在尽可能少的服务器上,从而提升整体资源利用率和降低能源消耗。
-
公开(公告)号:CN109145090A
公开(公告)日:2019-01-04
申请号:CN201811009372.5
申请日:2018-08-31
Applicant: 东北大学
IPC: G06F16/33 , G06F16/953 , G06Q50/00 , G06N3/04
CPC classification number: G06Q50/01 , G06N3/0454
Abstract: 本发明提供一种基于深度学习的微博用户情感影响力分析方法,涉及自然语言处理领域。包括:获取某一话题下的用户三元组和微博五元组,并计算用户Ui的自身情感影响力;计算用户Ui与用户Uj交互得到的交互情感影响力;计算用户Ui的情感影响力;计算用户Ui的整体情感强度;计算用户Uj的整体情感强度;计算用户Ui和Uj整体情感强度的相似度;计算用户Ui对其粉丝施加的影响力;计算用户Ui的全局情感影响力;得到用户的全局情感影响力排名。本方法可用于目前备受关注的心理健康问题,通过数据获取平台分析某一个心理健康话题,找到话题影响者,从而帮助心理研究人员对这些用户进行后续的评估与诊断,也可以用于帮助商品推广、引领舆论导向、帮助有关部门决策。
-
公开(公告)号:CN108537782A
公开(公告)日:2018-09-14
申请号:CN201810280577.0
申请日:2018-04-02
Applicant: 东北大学
Abstract: 本发明公开了一种基于轮廓提取的建筑物图像匹配与融合的方法,包括:对历史照片进行预处理;对预览照片和预处理后的历史照片进行轮廓提取,得到历史照片和预览照片的轮廓图;对两个照片的轮廓图进行直线提取,并使用直线匹配算法,按照直线特征对历史照片和预览照片的直线进行配对,得到最优匹配队集合;对最优匹配队集合内直线间夹角进行计算,得到两个夹角矩阵,并对夹角矩阵进行相似度计算,得到历史照片和预览照片的相似度;对预览照片与历史照片进行图像融合处理,使得相似照片与历史照片同时显示在一张照片中,能够将历史建筑与现有的预览照片进行实时的匹配,判断两个建筑物图像的匹配程度,使得建筑照片的比对更加准确和快速。
-
公开(公告)号:CN104330089B
公开(公告)日:2017-12-29
申请号:CN201410649530.9
申请日:2014-11-17
Applicant: 东北大学
IPC: G01C21/30
Abstract: 本发明公开了一种利用历史GPS数据进行地图匹配的方法,将历史GPS点记录按车辆ID、记录时间、坐标区域组织成轨迹形式,并将轨迹转换成KML文件;将对应区域的路网数据裁剪出来并转换成KML格式文件;将得到的KML文件叠加在一起,利用标记方法为轨迹中的每一个GPS点标记其所在路段ID,此部分标记数据记为数据集A;只需为其补充方向角信息即可作为训练数据,所得标记数据记为数据集B;将得到的数据集A和第四步得到的数据集B合并作为ELM算法的训练数据集,选定部分与数据集A不相交的历史数据集作为测试数据,用寻参算法寻找ELM参数,直至预测精度最高,此时对应的ELM模型即为该区域内的地图匹配模型。
-
公开(公告)号:CN105046107A
公开(公告)日:2015-11-11
申请号:CN201510555372.5
申请日:2015-08-28
Applicant: 东北大学
IPC: G06F19/18
Abstract: 本发明公开了一种限定性模体的发现方法,涉及生物信息领域,包括以下步骤:1)构建字典表,所构述字典表用于存储指定模式P的模式实例;2)在字典表中以字典顺序列出指定模式P的所有实例集合I={I1…IN},其中,Ii为模体实例;3)对每个模体实例Ii与待检测的核苷酸序列进行比较验证,若第i个实例满足只出现在待检测的核苷酸正例序列集合中,而不出现在反例序列集合中,则该实例作为最终满足条件的模体输出。本发明以简单的方法解决了限定性模体发现问题,最后的实验证明,在合理的时间内,倒排索引算法总是可以找到所有满足条件的模体,从而保证了算法的有效性。
-
公开(公告)号:CN104298598A
公开(公告)日:2015-01-21
申请号:CN201410544602.3
申请日:2014-10-01
Applicant: 东北大学
IPC: G06F11/36
Abstract: 本发明公开了一种分布式环境下RDFS本体的调试方法,本发明首先运用字典编码技术对RDFS本体数据进行压缩处理,降低了数据的存储空间,同时加快了本体推理及调试的速度;之后实现了基于并行分布式计算框架Spark的RDFS本体推理算法,并将推理后的本体调试信息压缩后,存储在HBase分布式数据库中,为本体调试阶段的调试信息查询做准备;本发明实现了基于Spark框架的分布式增量存储更新算法;为了能在分布式环境下求取蕴含辩解,本发明对以往的方法进行了改进,并实现了两种蕴含辩解求取方法。
-
公开(公告)号:CN116775662A
公开(公告)日:2023-09-19
申请号:CN202310768160.X
申请日:2023-06-26
Applicant: 东北大学
IPC: G06F16/22 , G06F16/23 , G06F16/245
Abstract: 本发明提供一种并发的内存数据库分裂的方法,涉及数据库技术领域。针对ART索引进行改进,得到IART索引,并在IART索引的基础上提出IARTC算法,IARTC算法使用IART索引作为分裂索引来驱动数据库分裂;同时基于IARTC算法得到一种新的数据库分裂并发算法PIARTC,PIARTC算法通过乐观锁耦合的并发策略来对IART索引上的节点进行加解锁控制,以实现并发的分裂和索引的更新,使其在并发执行过程中保持小的锁定粒度。与现有算法相比,在面对动态环境以及大规模数据集查询的情况下,本发明提出的两种自适应索引在单核和多核系统中均表现出良好的查询性能,且仍保持原始数据库分裂算法轻量级的特性。
-
-
-
-
-
-
-
-
-