一种自动分发、运行和更新可执行程序的方法及系统

    公开(公告)号:CN103473287A

    公开(公告)日:2013-12-25

    申请号:CN201310385972.2

    申请日:2013-08-30

    Abstract: 本发明涉及一种自动分发、运行和更新可执行程序的方法及系统,包括客户端将可执行程序及相关文件所在目录打包成一个文件,并采用大文件分割及索引存储方法将打包文件存储到状态存储集群;工作节点定期到状态存储集群检测索引状态,当检测到有新的索引或已有索引有更新,按照索引方式将可执行程序下载到本地目录;工作节点定期到状态存储集群获取程序相关信息;工作节点根据程序相关信息,每隔心跳时间到本地目录检测可执行程序的下载状态,直到检测到可执行程序下载完成时,执行可执行程序;本发明可实现可执行程序的自动分发、运行及更新,尤其在线更新正在执行的可执行程序,无需重新提交Job信息,增加了系统的灵活性与稳定性。

    一种识别微博异常用户的方法和系统

    公开(公告)号:CN103150374A

    公开(公告)日:2013-06-12

    申请号:CN201310076056.0

    申请日:2013-03-11

    Abstract: 本发明涉及一种识别微博异常用户的方法,包括:获取多个用户微博数据存储入数据库中;根据用户微博数据,以用户行为的时间间隔的统计分布做为用户的行为时间特征,并生成行为时间特征向量和界定参数;计算正常用户行为时间特征向量与待测用户行为时间特征间的Kullback-Leibler距离,将计算出的Kullback-Leibler距离超出界定参数的待测用户判定为异常用户;对异常用户的内容进行关键词抽取和展示。对应该方法,本发明还提供了一种识别微博异常用户的系统。本发明可以快速提取出异常用户的博文内容关键词,可以准确识别营销,广告等垃圾信息发布者,适用于多个微博服务平台检测,且具有准确性高,效率高,适用性广的优点。

    一种基于网络流量多字段识别的人流量检测方法及系统

    公开(公告)号:CN106878102A

    公开(公告)日:2017-06-20

    申请号:CN201611204278.6

    申请日:2016-12-23

    Abstract: 本发明提供一种基于网络流量多字段识别的人流量检测方法,步骤包括:1)获取网络流量,对所含的数据包进行预处理,包括IP碎片重组、链接还原和协议识别;2)识别预处理后的数据包所含的多字段信息,该多字段信息包括基准字段、设备指纹字段、位置信息和时间戳信息;3)将多字段信息填充于设备表中;4)通过检测设备表中的联网设备位置信息和时间戳信息来统计人流量。本发明还提供一种基于网络流量多字段识别的人流量检测系统,包括流量获取模块、数据预处理模块、多字段识别模块、设备表模块及人流量统计模块。

    一种微博热点事件的地理位置发现方法

    公开(公告)号:CN105630884A

    公开(公告)日:2016-06-01

    申请号:CN201510957634.0

    申请日:2015-12-18

    CPC classification number: G06F17/3087 G06F17/30705

    Abstract: 本发明公开了一种微博热点事件的地理位置发现方法。本方法为:1)基于行政区规划地理词词典及中文简称词的命名规则构建一简称词词典,然后将该简称词词典与全称词词典进行关联;2)根据事件关键字,获取包含该事件关键字的微博信息;3)对获取的微博信息进行分词处理,得到该微博的分词集合,然后判断该分词集合中每一名词是否在该简称词词典或全称词词典中,如果存在则将该名词作为候选地理位置词保留;当该微博中出现多个候选地理位置词时,则选取一候选地理位置词作为该微博的地点;4)获取确定的每一地点的地理位置经纬度信息,然后对得到的地理位置经纬度信息进行聚类,根据聚类中心判断出事件爆发地点。本方法可更好的了解突发事件。

    一种分布式多用户的数据调度方法及系统

    公开(公告)号:CN113626161B

    公开(公告)日:2023-12-22

    申请号:CN202110778053.6

    申请日:2021-07-09

    Abstract: 本发明公开一种分布式多用户的数据调度方法及系统,包括通过解析用户A1发送的调度数据,获取用户B1绑定的工作节点B路由信息,且生成调度任务Ti;将调度任务Ti存储至对应的任务队列中;解析各调度任务Ti的路由信息并分类批量执行数据调度任务,以使用户B1从工作节点B的专有数据队列中获取所述调度数据。本发明将不同的用户分散绑定在分散的数据调度工作节点,对各用户之间的数据调度,采取异步批量分类执行的策略,并使用管理节点对工作节点进行管理,从而提高了调度的负荷能力、稳定性和可靠性。

    一种通用的条款与文档匹配方法

    公开(公告)号:CN111209375B

    公开(公告)日:2023-01-17

    申请号:CN202010031467.8

    申请日:2020-01-13

    Abstract: 本发明公开了一种通用的条款与文档匹配方法,其步骤包括:1)根据条款切割体系对所选每一条款句子进行分词块操作,并对相应词块添加解释词和扩展词,生成针对每一条款的多个查询语句;2)根据条款i的每一查询语句查询收集该条款i的相关文档数据并标注所收集每一文档所对应的条款,获得每一条款i对应的标注数据集;3)对于每一条款i,根据条款i的标注数据集I训练得到该条款i的条款主题模型和条款分类模型;4)对于一待匹配条款的文档材料a,计算该文档材料a与每一条款的条款主题模型相似度和类别分类;5)根据返回的类别概率值和相似度计算各条款的匹配概率值,返回匹配概率最高的条款。本发明解决了条款与文档难以匹配的问题。

    一种在网关上的实时恶意网页识别方法及系统

    公开(公告)号:CN111447169B

    公开(公告)日:2021-06-08

    申请号:CN201910043510.X

    申请日:2019-01-17

    Inventor: 檀国林 张鹏 郑超

    Abstract: 本发明公开了一种在网关上的实时恶意网页识别方法,包括:采集用户访问网页的流量,从中提取轻量级的恶意网页分类特征;基于这些分类特征,构建实时恶意网页分类模型;将该模型部署到核心网络设备上,以实时预测网页是否为恶意网页。本发明还公开了一种在网关上的实时恶意网页识别系统,包括流量采集模块、分类模型训练模块和预测模块。本发明基于恶意网页在上述特征上存在明显的倾斜分布,采用点分十进制来处理目的IP地址和源IP地址,即以每个IP地址字节作为一项分类特征,实现了在大型网关上快速、实时地识别和过滤恶意网页。

    一种基于图卷积网络的图可视化方法

    公开(公告)号:CN109753589A

    公开(公告)日:2019-05-14

    申请号:CN201811432008.X

    申请日:2018-11-28

    Abstract: 本发明公开了一种基于图卷积网络的图可视化方法,其步骤包括:1)对于目标领域的网络G=(V,E),将网络G中的节点嵌入到一个低维欧式空间中,得到网络G的低维嵌入向量;所述低维嵌入向量包含网络G中节点的特征信息和网络G的拓扑结构信息;其中,V是节点集合,E是边集合;2)将所述低维嵌入向量构造成一张K近邻图,即KNN图;3)基于概率模型将所述KNN图在二维空间中绘制出来。本发明学习到的嵌入向量同时保留了节点的结构信息和特征信息,可以对可视化结果进行粒度化调整。

    一种微博热点事件的地理位置发现方法

    公开(公告)号:CN105630884B

    公开(公告)日:2019-03-08

    申请号:CN201510957634.0

    申请日:2015-12-18

    Abstract: 本发明公开了一种微博热点事件的地理位置发现方法。本方法为:1)基于行政区规划地理词词典及中文简称词的命名规则构建一简称词词典,然后将该简称词词典与全称词词典进行关联;2)根据事件关键字,获取包含该事件关键字的微博信息;3)对获取的微博信息进行分词处理,得到该微博的分词集合,然后判断该分词集合中每一名词是否在该简称词词典或全称词词典中,如果存在则将该名词作为候选地理位置词保留;当该微博中出现多个候选地理位置词时,则选取一候选地理位置词作为该微博的地点;4)获取确定的每一地点的地理位置经纬度信息,然后对得到的地理位置经纬度信息进行聚类,根据聚类中心判断出事件爆发地点。本方法可更好的了解突发事件。

Patent Agency Ranking