一种基于自动化数据收集的情感分析与预测系统

    公开(公告)号:CN108763210A

    公开(公告)日:2018-11-06

    申请号:CN201810496384.9

    申请日:2018-05-22

    IPC分类号: G06F17/27 G06F17/30

    CPC分类号: G06F17/2785

    摘要: 本发明公开一种基于自动化数据收集的情感分析与预测系统,包括:用户交互模块接收用户的输入的进行情感分析指令,并提供可视化界面供用户进行信息查看;数据管理模块用于对待进行情感分析的数据进行收集和管理,通过网页、API和URL三种爬虫实现预设条件下的历史文本信息或实时文本流的爬取并存储;情感分析模块用于对待进行情感分析的数据进行情感分析,包括词性标注、句法结构分析和情感倾向性分析,结合不同情感分析过程给出综合情感分析结果;情感预测模块用于根据一段时间内的综合情感分析结果对待进行情感分析的数据对应的情感倾向进行预测。本发明可以自动收集数据并在此过程中不断基于历史数据给出情感预测结果。

    基于角色的访问控制模型构建系统

    公开(公告)号:CN102156833A

    公开(公告)日:2011-08-17

    申请号:CN201110090645.5

    申请日:2011-04-12

    IPC分类号: G06F21/00 G06F17/30

    摘要: 本发明提供了一种基于角色的访问控制模型构建系统,该系统包括数据库、权重模块、角色模块、约束模块、结果显示模块、用户权限分配管理模块和审计管理模块;其中权重模块包括相似度模块和权重计算模块,角色模块包括角色生成模块和角色层次生成模块,约束模块包括角色约束模块、权限约束模块、用户约束模块和互斥约束模块,结果显示模块包括角色显示模块、约束显示模块和结果调整模块。本发明对用户权限的重要程度进行了度量、对基于角色的访问控制模型的约束进行了生成,从而提高了角色的准确性和系统的安全性。本发明系统可以实现基于角色的访问控制模型的构建,保证了构建基于角色的访问控制模型的自动化和半自动化构建。本发明系统具有安全性强、可解释性强、可扩展性强的特点。

    一种基于分块组织的密文索引结构及其管理方法

    公开(公告)号:CN101655858B

    公开(公告)日:2011-05-18

    申请号:CN200910063738.1

    申请日:2009-08-26

    IPC分类号: G06F17/30 G06F21/24

    摘要: 本发明公开了一种基于分块组织的密文索引结构及其管理方法。针对分块的密文索引结构,在创建索引时,首先是采用基于合并的索引创建方式创建明文索引,然后统一对明文索引进行分块加密。基于密文索引的维护机制则是分为索引中文档的添加、删除、修改。文档的添加主要分为二种情况,批量添加和少量添加,批量添加通过在磁盘上创建临时索引,少量添加则是通过创建内存索引。文档的删除首先为删除文档做一个删除标记,等到适当的时机文档进行统一删除。索引修改则是先删除原始文档,然后重新添加新文档。密钥管理策略是对索引加密密钥进行分层管理以及通过时间戳机制来实现密钥的更新。基于索引的访问控制策略是将访问控制信息整合到索引当中,实现文档级粒度的访问控制。

    一种基于密文的安全全文索引和检索系统

    公开(公告)号:CN101520800B

    公开(公告)日:2010-09-01

    申请号:CN200910061325.X

    申请日:2009-03-27

    IPC分类号: G06F17/30 G06F21/24

    摘要: 本发明公开一种基于密文的安全全文索引和检索系统。系统中,密文索引库包含密文词条倒排索引和内部文档对象集合;密文文档库负责存储和管理密态XML文档;分词加密服务器将明文文本进行中文分词并逐条加密;密文全文索引服务器将原始明文文档规范为XML文档,加密存储到密文文档库,并结合文档元信息在密文索引库中创建相应内部文档对象,再利用密文词条为其构建密文倒排索引;密文全文检索服务器利用用户权限信息和密文词条检索密文索引库得到内部文档对象集合,根据其指针从密文文档库获取相应密态XML文档结果集,解密后返回给用户。本发明基于满足密文全文索引特殊要求的中文分词方法、安全高效的索引结构和检索机制,实现了结合访问控制策略的密文全文检索,具有索引过程安全高效、检索过程检索词不脱密、在密文环境中查全率和查准率高等特点。

    一种基于分块组织的密文索引结构及其管理方法

    公开(公告)号:CN101655858A

    公开(公告)日:2010-02-24

    申请号:CN200910063738.1

    申请日:2009-08-26

    IPC分类号: G06F17/30 G06F21/24

    摘要: 本发明公开了一种基于分块组织的密文索引结构及其管理方法。针对分块的密文索引结构,在创建索引时,首先是采用基于合并的索引创建方式创建明文索引,然后统一对明文索引进行分块加密。基于密文索引的维护机制则是分为索引中文档的添加、删除、修改。文档的添加主要分为二种情况,批量添加和少量添加,批量添加通过在磁盘上创建临时索引,少量添加则是通过创建内存索引。文档的删除首先为删除文档做一个删除标记,等到适当的时机文档进行统一删除。索引修改则是先删除原始文档,然后重新添加新文档。密钥管理策略是对索引加密密钥进行分层管理以及通过时间戳机制来实现密钥的更新。基于索引的访问控制策略是将访问控制信息整合到索引当中,实现文档级粒度的访问控制。

    一种模糊语义搜索方法、系统及设备

    公开(公告)号:CN101566988A

    公开(公告)日:2009-10-28

    申请号:CN200810093969.2

    申请日:2008-04-24

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种模糊语义搜索方法,包括以下步骤:对用户输入的代表模糊概念的关键词以及代表语气算子的关键词,利用所述模糊本体知识库进行推理计算,并将推理计算产生的关键词组合作为扩展后的查询条件;根据所述扩展后的查询条件,在所述资源索引库中检索出符合条件的查询结果。同时,本发明还公开了一种模糊语义搜索方法及设备。本发明通过基于本体的关键词解析,可将关键词扩展为其相等概念、子概念等,并能够在一定程度上处理模糊关键词,从而提高了查全率。

    一种关联关系搜索结果的排序方法及装置

    公开(公告)号:CN100524317C

    公开(公告)日:2009-08-05

    申请号:CN200710163152.3

    申请日:2007-10-10

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种关联关系搜索结果的排序方法及装置,该方法包括:解析本体的各个实例的三元组信息,构建实例关联关系图;根据输入的两个实例,遍历实例关联关系图中所述两个实例间的所有关联关系的路径,生成搜索结果信息;计算领域相关度和/或关联关系长度和/或关联关系频度;对所述搜索结果信息进行排序。该装置包括:包括:本体解析模块、关联关系搜索模块、关联关系排序模块。由上述技术方案可知,通过计算领域相关度和/或关联关系长度和/或关联关系频度的参数,可以灵活的对搜索结果进行排序,从而使用户能够更准确、有效的从搜索结果中获取到其想要的信息。

    基于密文的全文检索系统

    公开(公告)号:CN1932816A

    公开(公告)日:2007-03-21

    申请号:CN200610124691.1

    申请日:2006-09-30

    IPC分类号: G06F17/30 G06F21/00

    摘要: 本发明提供的一种基于密文的全文检索系统,该系统包括数据库、登录模块、查询模块、结果集处理模块、电子文档处理模块、索引模块、审计管理模块、用户管理模块和权限管理模块。其中查询模块包括查询分词模块、查询加密模块、逻辑组合模块、查询子模块、访问控制模块和结果集排序模块;结果集处理模块包括文摘模块和快照模块;索引模块包括索引分词模块、索引加密模块和索引子模块。本发明系统针对索引库不包含索引词在原文的位置信息的情况,提出了一种分词策略——中文语义与自动切分相结合的分词策略,并且在用户访问文档的过程中加入访问控制来限制用户的权限,以保证敏感信息的安全性。本发明系统可以实现密文条件下的全文信息检索,保证了敏感数据的安全性检索,本发明系统具有安全性强、执行效率高的特点。

    一种基于链接分析的域名层级结构探测方法

    公开(公告)号:CN108804576B

    公开(公告)日:2021-08-20

    申请号:CN201810504726.7

    申请日:2018-05-22

    摘要: 本发明公开了一种基于链接分析的域名层级结构探测方法,包括:对初始URL进行数据爬取并跟踪链接进行深度分布式爬取,得到待分析机构的域名集合与域名链接关系;利用待分析机构的域名集合与域名链接关系构建链接网络有向图,利用链接网络有向图进行聚类计算,得到聚类结果,计算链接有向图中每个节点的重要度;利用聚类结果和链接有向图中每个节点的重要度对链接网络有向图进行有向图边加权,得到加权有向图;在加权有向图上使用基于最短路的算法计算节点从属关系,得到待分析机构的域名从属关系树形结构。本发明具有较高的数据爬取效率和域名采集覆盖率;本发明在保证结构提取高效性的同时,也极大提高了域名从属关系探测的准确率。

    一种基于深度学习的用户情感分析方法

    公开(公告)号:CN107341145B

    公开(公告)日:2019-11-12

    申请号:CN201710473195.5

    申请日:2017-06-21

    IPC分类号: G06F17/27 G06N3/04 G06N3/08

    摘要: 本发明公开了一种基于深度学习的用户情感分析方法,其中,方法的实现包括数据预处理、词向量学习、文本向量学习、用户特征向量表示、用户情感分析以及模型更新。本发明方法使用用户发表的文本信息提取用户的特征向量,并基于该用户特征向量及词向量信息实现基于用户特征的文本情感分析,基于本发明不仅优化了用户特征学习的复杂程度、而且得到的用户特征向量具有更丰富的用户画像信息,使得基于该用户特征向量及词向量对文本进行情感分析时提升了情感分析的准确度及效率。