-
公开(公告)号:CN106909623B
公开(公告)日:2019-11-26
申请号:CN201710043645.7
申请日:2017-01-19
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种支持高效海量数据分析和检索的数据装置及数据存储方法。本装置包括若干文件夹,在每一文件夹中包含多个索引分段;每一索引分段包括一全文索引组件、一数据定位模块和一数据存储模块;全文索引组件用于存储索引分段中的记录的倒排索引信息;数据存储模块,包含多个横向分块,每个横向分块包含多个列分片,每个列分片包含多个用于存储数据记录的数据页;数据定位模块,提供针对数据存储模块的嵌套索引结构,每个横向分块索引存储了横向分块记录起始Id、横向分块位置、各列分片的位置以及列分片索引集合;每个列分片索引记录了列分片中数据页起始位置和数据页索引集合;每个数据页索引记录了数据页所在文件位置和页记录起始Id。
-
公开(公告)号:CN110059194A
公开(公告)日:2019-07-26
申请号:CN201910155583.8
申请日:2019-03-01
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种融合表示学习和分治策略的大规模本体合并方法,其步骤包括:1)对于待合并的两本体,学习每一本体的组成要素在假设的公共语义空间中的语义表示;2)根据本体层级结构将每一本体中的所有类别划分为若干不相交的类别簇;然后根据同一类别簇中的类别在本体中的层级结构,恢复该类别簇中类别之间的关系,得到该本体的块集合;3)根据两待合并本体的块集合生成两本体之间的块映射,并基于本体的组成要素的语义表示对块进行对齐;4)将对齐后的本体区分为源本体和目标本体,将源本体和目标本体之间等价的类别合并成一个公共的类别放入一合并本体中,然后将源本体中剩余的类别信息放入该合并本体中,完成两本体合并。
-
公开(公告)号:CN105516127B
公开(公告)日:2019-01-25
申请号:CN201510888587.9
申请日:2015-12-07
Applicant: 中国科学院信息工程研究所
IPC: H04L29/06
Abstract: 本发明涉及一种面向内部威胁检测的用户跨域行为模式挖掘方法。该方法首先分别为各个检测域构建归一化的用户单域行为特征,并基于时间窗口通过集成各域域内行为特征构建用户多域行为描述;然后通过从用户多域行为描述中提取基模式,生成用户行为特征;最后,使用非监督学习技术挖掘多元的用户行为模式。本发明中结构化的用户行为特征生成方法使得用户行为特征对用户行为的解释变得方便,用户行为特征粒度和表达倾向可以根据分析需要通过观察和计算进行调整;该方法不依赖任何领域知识和用户背景,完全以数据驱动的方式挖掘用户行为的多元模式;该方法能够利用多元的用户跨域行为模式进行内部攻击检测。
-
公开(公告)号:CN108399185A
公开(公告)日:2018-08-14
申请号:CN201810023335.3
申请日:2018-01-10
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种多标签图像的二值向量生成方法及图像语义相似度查询方法。本发明1利用训练数据集对卷积神经网络模型进行训练,直至该卷积神经网络模型的损失值趋于稳定;然后利用训练后的卷积神经网络模型对图像数据库中的图片进行计算,得到每张图片的二值向量并进行存储;利用训练后的卷积神经网络模型计算待查询图片的二值向量,并将其与存储的二值向量进行相似度计算,根据相似度计算结果返回与该待查询图片最相似的若干图片。本发明大大提高了图像的存储效率和查询效率;而且可以根据与查询图片的多级语义相似度对目标图片进行排序。
-
公开(公告)号:CN103218423B
公开(公告)日:2016-09-07
申请号:CN201310113295.9
申请日:2013-04-02
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
Abstract: 本发明涉及一种数据查询方法及装置。其中,数据查询方法包括:接收用户提供的查询条件,所述查询条件包括查询关键字、编辑距离阈值以及滑动窗口宽度;提取所述查询关键字的特征值,组成关键字特征索引;提取当前滑动窗口中基本窗口的特征值,组成滑动窗口的特征索引,所述滑动窗口包含设定数目的基本窗口,所述滑动窗口的特征索引为该滑动窗口中所有基本窗口的特征索引组成的队列;在达到预设的查询触发条件时,触发对当前滑动窗口的查询;根据所述关键字特征索引和编辑距离阈值,对当前滑动窗口的特征索引进行过滤,得到满足过滤下限的候选字符串集。本发明的数据查询方法及装置能有效弥补在数据流场景下进行关键字精确查询的不足,具备较好的查询容错能力。
-
公开(公告)号:CN105516127A
公开(公告)日:2016-04-20
申请号:CN201510888587.9
申请日:2015-12-07
Applicant: 中国科学院信息工程研究所
IPC: H04L29/06
CPC classification number: H04L63/1425
Abstract: 本发明涉及一种面向内部威胁检测的用户跨域行为模式挖掘方法。该方法首先分别为各个检测域构建归一化的用户单域行为特征,并基于时间窗口通过集成各域域内行为特征构建用户多域行为描述;然后通过从用户多域行为描述中提取基模式,生成用户行为特征;最后,使用非监督学习技术挖掘多元的用户行为模式。本发明中结构化的用户行为特征生成方法使得用户行为特征对用户行为的解释变得方便,用户行为特征粒度和表达倾向可以根据分析需要通过观察和计算进行调整;该方法不依赖任何领域知识和用户背景,完全以数据驱动的方式挖掘用户行为的多元模式;该方法能够利用多元的用户跨域行为模式进行内部攻击检测。
-
公开(公告)号:CN105302487A
公开(公告)日:2016-02-03
申请号:CN201510684785.3
申请日:2015-10-20
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于流量控制的树状存储结构写放大优化方法。本方法:1)在存储系统中设置一流量监听器;其中,该存储系统的磁盘空间和内存空间采用树状存储结构进行数据存储;2)该流量监听器根据磁盘空间的每一待监控组件的当前数据量,判断所述磁盘空间是否需要进行流量控制;如果需要控制,则选取若干待监控组件的当前数据量计算一流量控制力度;3)该流量监听器根据该流量监控力度计算一延长时间,然后根据该延长时间延长写请求的到达时间间隔。本发明能够有效降低写放大,提升LSM-Tree的整体性能;使用本发明提供的方式优化LSM-Tree,可以将LSM-Tree的整体写吞吐量提升30%以上。
-
公开(公告)号:CN103309966A
公开(公告)日:2013-09-18
申请号:CN201310219213.9
申请日:2013-06-04
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
Abstract: 本发明涉及基于时间滑动窗口的数据流点连接查询方法,该方法将一定时间内到来的数据流的元组存入缓冲区,进而对缓冲区内的元组批量与其要连接的时间滑动窗口内的元组进行连接,将完成连接的元组批量删除,将未完成连接的元组批量插入到其对应的时间滑动窗口中;从而大大减少了对时间滑动窗口加锁和解锁操作次数;将缓冲区未完成连接的元组插入到其对应的时间滑动窗口时用顺序存储链表存储元组在时间滑动窗口中的位置,顺序存储链表的头结点中存储该缓冲区的开辟时间,避免查找时间滑动窗口中过期数据时对整个时间窗口进行遍历,只需对顺序存储链表头结点进行遍历,即可找到时间滑动窗口中一批过期元组,降低了运算量,提高了效率。
-
公开(公告)号:CN114219017B
公开(公告)日:2025-04-22
申请号:CN202111459333.7
申请日:2021-12-02
Applicant: 中国科学院信息工程研究所
IPC: G06F18/214 , G06F16/36 , G06F18/24 , G06N5/022 , G06N3/096
Abstract: 本发明公开了一种隐式语义数据增强方法。本发明第一阶段利用原始数据训练特征提取器和分类器,然后利用分类器构建知识图谱,并基于提取的特征计算每个类别的类中心和协方差矩阵;第二阶段利用构建的知识图谱识别出尾部类别的相似类别,然后将相似类别的特征变换方向迁移到每个尾部样本上进行特征变化。通过挖掘类别之间的相关关系,极大地丰富了尾部类别多样性。最后,对每个样本沿着迁移的协方差矩阵进行变化方向的无限次高斯分布采样可以获得无穷样本,通过优化无限样本损失函数的上界,得到一个新的基于推理的隐式语义数据增强损失进行模型训练。
-
公开(公告)号:CN119364369A
公开(公告)日:2025-01-24
申请号:CN202411559776.7
申请日:2024-11-04
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种5G核心网网元行为信任评估方法及系统,属于网络通信安全领域。本发明从5G核心网各网元采集通信数据并分析,确定网元之间是否存在符合标准的交互关系;对于符合标准的交互关系的网元,计算其基准信任值;根据网元的交互行为对基准信任值进行动态调整,计算奖惩评分;将基准信任值与奖惩评分进行综合计算,得到网元的综合信任度;聚合所有服务生产网元对某服务消费网元的综合信任度,得到聚合信任度;基于聚合信任度进行信任分级,根据信任分级制定相应的访问控制策略,决定网元的操作权限和资源访问级别。本发明实现了分布式与集中式信任评估模块相结合的架构,对5G核心网元进行动态、精准的信任评估。
-
-
-
-
-
-
-
-
-