-
公开(公告)号:CN110673966A
公开(公告)日:2020-01-10
申请号:CN201910908610.4
申请日:2019-09-25
Applicant: 东北大学
IPC: G06F9/54 , G06F21/64 , G06F16/27 , G06F16/2458 , G06F16/23
Abstract: 本发明涉及计算机区块链技术领域,提供一种基于区块链链上-链下协同的数据交互方法。首先构建链上-链下协同交互框架;当用户请求写入/更新数据时,在链下数据中心写入/修改原始数据,从原始数据/要修改的数据中提取数据摘要并签名,选取主节点构建区块并接入区块链,再通知其他节点同步;当用户请求查询数据时,发送签名给验证节点,验证节点查询链上数据并广播数据,当多于半数的验证节点查询到相同的数据时,选取主节点,主节点从链下数据中心查询原始数据并提取数据摘要,对比链上数据与链下数据,若一致则返回用户的查询权限,若不一致则通知用户数据损坏。本发明能够保证数据安全性和完整性,且在进行大型数据的交互时速度快。
-
公开(公告)号:CN108923932A
公开(公告)日:2018-11-30
申请号:CN201810748682.2
申请日:2018-07-10
Applicant: 东北大学
CPC classification number: H04L9/3247 , H04L67/104 , H04L67/1097
Abstract: 本发明公开一种去中心化协同验证模型及验证算法,模型包括:数据所有者、云服务提供商、协作网络和区块链四个关键组件,其中区块链的块体存储由POR记录生成的POR Merkle树,POR Merkle树的叶子节点由一个二元组构成,二元组记录POR记录和数据所有者的数字签名。本发明将区块链的特性带入了不可信环境下外包数据存储和验证过程中,可以提高数据安全性,避免了在传统数据外包服务中将数据验证过程移交给第三方可能造成的安全问题,效率提高,安全性提高。
-
公开(公告)号:CN105677757A
公开(公告)日:2016-06-15
申请号:CN201511020637.8
申请日:2015-12-30
Applicant: 东北大学
IPC: G06F17/30
CPC classification number: G06F17/30619 , G06F17/30699
Abstract: 本发明提供一种基于双缀过滤的大数据相似性连接方法,包括:提取不同数据源的文本格式数据,得到待清洗的实体记录;对实体记录中的元素进行词频统计并对实体记录中的元素按词频升序排序;将实体记录前缀中的每一个元素作为该实体记录的索引,对实体记录建立倒排索引表;对同一个索引内的实体记录对进行双缀过滤相似性连接,得到相似度大于相似度阈值的实体记录对,实现分布式计算。本发明利用实体记录对中前后缀中元素位置信息实现过滤,极大地降低了候选集合的大小,针对不同大小的数据源以及不同阈值的情况,双缀过滤可以达到良好的时间效果。并且双缀过滤可以实现面向大数据的分布式计算,可以将其应用于分布式计算中,提高大数据清洗效率。
-
公开(公告)号:CN102298624B
公开(公告)日:2014-08-20
申请号:CN201110233554.2
申请日:2011-08-15
Applicant: 东北大学
IPC: G06F17/30
Abstract: 本发明提供一种同构对称发布订阅系统的近似动态环匹配方法,包括以下步骤:步骤1:获得订阅概率;步骤2:计算阈值位置间隔宽度和域中近似分界线;步骤3:估算节省的存储空间比例。本发明方法适用于任意数据分布的近似动态环匹配,能够应用在实时环境中,精确度提高了平均15个百分点。本发明方法的节省空间比例预测公式可计算任何数据分布类型,且具有高精确度,进一步挖掘订阅被匹配的概率在整个域尺寸空间的分布及分析各订阅维度之间的关系和不同维数据的分布特点,运用降低维度等策略使得预测结果更加接近真实值,可以得到更好的预测效果。
-
公开(公告)号:CN103020712A
公开(公告)日:2013-04-03
申请号:CN201210583886.8
申请日:2012-12-28
Applicant: 东北大学
IPC: G06N5/00
Abstract: 一种海量微博数据的分布式分类装置及方法,属于数据挖掘技术领域。该装置采用分布式结构,根据ELM的处理方法,每个从控制机将自身处理的用于生成最终微博数据分类器的中间结果发送给主控制机,主控制机接收所有从控制机发送来的中间结果后,根据ELM的原理,得到最终的微博数据分类器,利用产生的微博数据分类器实现对微博数据的分类。克服了以往的利用极限学习机技术仅能应用于集中式环境,无法适应大规模训练样本集的ELM分类的缺陷,使得处理和分析海量微博数据成为可能,令应用中积累的海量微博数据的效用得到充分发挥,起到了更好的为应用服务的效果。
-
-
公开(公告)号:CN101408901A
公开(公告)日:2009-04-15
申请号:CN200810229043.1
申请日:2008-11-26
Applicant: 东北大学
IPC: G06F17/30
Abstract: 一种基于主题词条的跨类型数据的概率聚类方法,属于数据库领域,包括以下步骤:(1)定义主题词条的类型;将跨类型数据分为主题相关词条、主题半相关词条和主题不相关词条;(2)对每类词条分配概率;(3)用概率表示数据主题;(4)构建数据的主题词条概率相似性矩阵M;对步骤(3)中跨类型数据的任意两个数据dx和dy,计算dx和dy任意两种描述形式的相似度,将相似度大于某一阈值的相似性的概率相加,将任意两个数据的直接相关概率存储在矩阵M中;(5)基于矩阵M构建聚类模型Mc;(6)基于聚类模型Mc的聚类方法。本发明利用与主题相关的词条项的相似性来对跨类型数据进行聚类,提高了数据聚类的精度,减少了聚类时间。
-
公开(公告)号:CN101266607A
公开(公告)日:2008-09-17
申请号:CN200810011323.5
申请日:2008-05-09
Applicant: 东北大学
IPC: G06F17/30
Abstract: 一种基于最大间隙空间映射的高维数据索引方法,属于数据库领域,包括以下步骤:步骤1进行最大间隙空间映射计算给定数据空间的每个维间隙值,选择维间隙值较大的前K值,将给定空间的实际数据点投影到K个维空间;步骤2构造MS-treeMS-tree首先找到适当的插入节点M,如果该节点没有满,则该对象被直接插入到该节点中;如果该节点已满,则该节点将被分裂,然后检查插入对象是否在结点M的MBR中,如果不在,则更新M的MBR并将原始空间映射到一个低维空间;步骤3进行相似性查找本发明的有益效果是通过减少假活动子树的访问来提高查询性能,因此,减少对假活动子空间的访问次数来改善索引相似性查询的性能。
-
公开(公告)号:CN115048377B
公开(公告)日:2025-03-28
申请号:CN202210650145.0
申请日:2022-06-10
Applicant: 东北大学 , 东软集团股份有限公司
IPC: G06F16/22 , G06F16/2455 , G06F16/2458 , G06F16/27 , G06F21/62
Abstract: 本发明针对链上链下混合存储区块链的时空关键字查询问题,提出了一种混合存储区块链环境下的时空关键字查询方法,涉及计算机区块链查询技术领域;首先,针对查询语义较弱,构建按属性分类且赋予语义的区块链模型CSBM,为区块内的事务划分属性类型并添加语义;其次,针对查询效率较低,构建基于B2F‑BKM结构的链上两级索引结构,该结构能够对所有区块和事务进行索引,有效提升查询效率;最后,针对通信开销较大,设计链上链下时空关键字查询方法,通过遍历B2F‑BKM结构进行链上条件查询,然后根据连接属性值进行链上链下数据连接查询,相比传统查询方法减少了不必要的通信开销;经试验证明本发明索引具有良好稳定性,查询效率大幅提升并且通信开销明显降低。
-
公开(公告)号:CN111859074B
公开(公告)日:2023-12-29
申请号:CN202010743881.1
申请日:2020-07-29
Applicant: 东北大学
IPC: G06F16/951 , G06F16/28 , G06F21/31 , G06F18/214 , H04L41/14 , G06N3/08 , G06F18/243
Abstract: 本发明提供一种基于深度学习的网络舆情信息源影响力评估方法及系统,涉及信息源影响力评估及深度学习技术领域。该方法及系统首先获取多个目标信息源结构及其中的半结构化和非结构化数据,并将获取的数据处理成统一格式的结构化数据;然后建立网络信息源评估数据集及深度学习Xgboost评估模型并设定模型参数;对模型进行训练测试,得到测试集上的模型准确率;优化修改模型参数后对模型进行迭代训练,保存准确率最高的模型;最后将获取的多个目标信息源数据输入到准确率最高的模型中,得到各目标信息源的评分以及排名。该方法及系统可以更高效、可靠地评估舆情信息源,大大提高舆情(56)对比文件CN 109359857 A,2019.02.19CN 109508373 A,2019.03.22CN 109933656 A,2019.06.25CN 111062202 A,2020.04.24US 2016098738 A1,2016.04.07US 2016267377 A1,2016.09.15何龙.输入理解XG Boost:高效机器学习算法与进阶.机械工业出版社,2020,316-320.环博文化等.网站SEO运营实战手册.机械工业出版社,2019,219-223.郭岩 等.网络舆情信息源影响力的评估研究《.中文信息学报》.2011,64-71.Mohamad Hazim et al..Detectingopinion spams through supervised boostingapproach《.PLOS ONE Journal》.2018,1-23.郭岩等.网络舆情信息源影响力的评估研究.中文信息学报.2011,第25卷(第3期),64-71.Mohamad Hazim等.Detecting opinionspams through supervised boostingapproach.PLOS ONE Journal.2018,第13卷(第6期),1-23.
-
-
-
-
-
-
-
-
-