一种基于搜索引擎的人物检索系统及方法

    公开(公告)号:CN107908749B

    公开(公告)日:2020-04-10

    申请号:CN201711147336.0

    申请日:2017-11-17

    Abstract: 本发明涉及一种基于搜索引擎的人物检索系统及方法,包括依次连接的数据采集模块、数据预处理模块、特征抽取模块、聚类模块;数据采集模块爬取搜索引擎检索人名返回的网页信息;数据预处理模块过滤与人名无关的网页,进行分块处理,过滤网页中与检索人名无关的视觉块;特征抽取模块抽取与检索人物相关的属性和实体,统计视觉块中词频,构造每个网页的向量表示形式,适当增加抽取的特征词在向量空间中对应维数的值,聚类模块将每个网页的向量表示形式作为输入,进行网页文本的聚类,输出网页类别标签组成的列表。本发明有效解决检索人物时返回网页中的人名歧义和信息杂乱的问题,通过抽取人物属性和人物关系构造人物摘要,为用户检索人名提供便利。

    一种面向情报分析的人机交互系统及其数据处理方法

    公开(公告)号:CN110363586A

    公开(公告)日:2019-10-22

    申请号:CN201910594639.X

    申请日:2019-07-03

    Abstract: 本发明公开了一种面向情报分析的人机交互系统及其数据处理方法,所述系统包括人机交互界面、数据输入模块、数据获取模块、数据处理模块、数据分析模块、结果展示模块,所述数据输入模块用于为用户提供输入接口;所述数据获取模块采用信息爬取方式获取情报信息,数据获取方式包括但不限于通用搜索、新闻搜索、社交搜索、论坛搜索、本地搜索、暗网搜索、学者搜索、企业搜索;所述数据处理模块用于对获取的情报信息进行数据处理,提高情报信息的质量,并保存处理结果;所述数据分析模块用于深入挖掘情报,并将挖掘结果交给结果展示模块进行可视化展示。本发明实现数据处理可视化,提高情报分析的准确性。

    一种基于泊松模型的递增型对称NAT的UDP穿透方法与系统

    公开(公告)号:CN109120737A

    公开(公告)日:2019-01-01

    申请号:CN201810908823.2

    申请日:2018-08-10

    Abstract: 本发明提供一种基于泊松模型的递增型对称NAT的UDP穿透方法与系统,考虑对称型NAT的两种类型、NAT分配端口的全局性特征、NAT对于释放端口的处理、以及NAT端口分配触底处理这四个重要因素,采用时齐泊松过程模拟内网访问外网的随机过程,从而预测出时间T内可能的内网访问外网数,实现递增型对称NAT的穿透,进而实现真正意义上的P2P通信网络。采用泊松模型模拟网络工作量,预测出NAT分配的下一个端口范围,进而实现递增型对称NAT的穿透。递增型对称NAT穿透前的数据采集、分析与训练;递增型对称NAT所处网络工作量的模拟;对地址敏感的递增型对称NAT的穿透;对端口敏感的递增型对称NAT的穿透。

    一种基于BWT的协议字段逆向分析系统及方法

    公开(公告)号:CN109040081A

    公开(公告)日:2018-12-18

    申请号:CN201810908816.2

    申请日:2018-08-10

    Abstract: 本发明提供一种基于BWT的协议字段逆向分析系统及方法,构建了特定的后缀索引,从而使特定的子字符串匹配在每次比对过程中只需要完整一次,并且基于后缀索引的比对算法设计灵活性大,索引阶段空间消耗较少,子序列长度或可变,能够快速识别协议字段。本发明在识别固定字段后,通过随机多流多段匹配的方法,统计高频率出现的字段,并依据字段位置和字段数量构建文法树,提取字段结构,从而实现字段格式的逆向。本发明对于逆向的字段进行分类后,作为模糊测试工具的输入,向目标通信实体发送大量畸形测试用例,同时结合调试器和嗅探器对目标通信实体进行异常监控,发现异常并分析异常,以便后续提高目标通信实体的安全性。

    一种暗网数据采集与抽取系统及方法

    公开(公告)号:CN107808000A

    公开(公告)日:2018-03-16

    申请号:CN201711115185.0

    申请日:2017-11-13

    Abstract: 本发明涉及一种暗网数据采集与抽取系统及方法,包括依次连接的暗网站点发现模块、暗网数据爬取模块、页面解析与内容抽取模块、数据融合与存储模块;暗网站点发现模块获取多源数据中的暗网url;暗网数据爬取模块配置Tor服务,修改Nutch的配置,使其与socks协议交互,进行数据的爬取;页面解析与内容抽取模块进行页面解析、页面向量化、特征码生成、相似度计算与模板集更新、页面内容抽取;数据融合与存储模块采用数据对齐策略对抽取得到的内容重组,将内容相近的数据记录融合存入数据库中。本发明实现了完整的页面保存到内容抽取的系统设计流程,为暗网中违法交易活动的发现与暗网知识图谱的建立提供数据支撑。

    一种钓鱼网站检测方法
    48.
    发明授权

    公开(公告)号:CN104166725B

    公开(公告)日:2018-01-12

    申请号:CN201410422615.3

    申请日:2014-08-26

    Abstract: 本发明实施例公开一种钓鱼网站检测方法,应用于计算机网络领域,以解决现有的检测钓鱼网站不能主动检测、误报、漏报、不及时的问题。该方法包括:建立待测网页对应的基于视觉内容的特征向量;将特征向量与预设的特征向量集合里的特征向量进行比对;根据比对结果判断待测网页是否是钓鱼网站。本发明实施例适用于钓鱼网站检测。

    传感器网络异常数据检测方法与系统

    公开(公告)号:CN106792883A

    公开(公告)日:2017-05-31

    申请号:CN201710047973.4

    申请日:2017-01-20

    CPC classification number: H04W24/08 H04W84/18

    Abstract: 本发明公开一种传感器网络异常数据检测方法,包括步骤:获取传感器网络的监测数据;根据数据的空间相关性特征,对所述监测数据进行空间相关检测,获得其中的异常数据;根据数据的时间相关性特征,对所述监测数据进行时间相关检测,获得其中的异常数据;针对任一异常数据,结合所述空间相关检测及所述时间相关检测的检测结果,判断该异常数据是事件数据或恶意数据。本发明可实时检测传感器网络中的异常数据,并对检测出的异常数据进行准确鉴别。

Patent Agency Ranking