-
公开(公告)号:CN111882062A
公开(公告)日:2020-11-03
申请号:CN202010722933.7
申请日:2020-07-24
Applicant: 哈尔滨工业大学(威海) , 威海天之卫网络空间安全科技有限公司
Abstract: 本发明涉及一种基于强化学习的Windows窗体应用程序自学习智能机器人及其工作方法,包括学习任务下发模块、学习任务解析模块、自学习模块、知识库构建模块;学习任务下发模块下发任务配置文件;学习任务解析模块接收到任务配置文件进行解析,将解析后的信息作为自学习模块的参数;自学习模块用于接收解析后的信息并选取学习策略后对目标软件进行自学习;知识库构建模块用于存储所述自学习模块自学习后获取的知识。本发明可以对所有的Windows窗体应用程序进行自主学习,这种学习完全是机器人自主选择学习策略,自主归纳知识,对知识进行组织构建。可以有效地为网络安全科研人员研究互联网用户的软件行为提供有效的基础。
-
公开(公告)号:CN111881678A
公开(公告)日:2020-11-03
申请号:CN202010747924.3
申请日:2020-07-30
Applicant: 哈尔滨工业大学(威海) , 威海天之卫网络空间安全科技有限公司
IPC: G06F40/289 , G06F40/284 , G06F40/211 , G06N3/08
Abstract: 本发明涉及一种基于无监督学习的领域词发现方法,属于计算机文本信息处理技术领域,输入通用语料和领域语料便可提取出来领域词,步骤为先把通用语料和领域语料切分,获得通用候选词库和领域候选词库,两种领域词库的处理方式相同;获取了通用候选词库和领域候选词库,对领域文本进行无监督学习,将两个词库中的词频转换为对应的概率,对两个词库的未分割句子任意切分,计算每一种切分方式的标准化概率得分,统计得分靠前的句子切分组合中的词语,收集领域词汇,把领域候选词库中的通用词转移到通用候选词库中,并保存获得领域词汇。无需人工标注语料,提高了含有标点符号的实体名称识别率。
-
公开(公告)号:CN111800343A
公开(公告)日:2020-10-20
申请号:CN202010641005.8
申请日:2020-07-06
Applicant: 哈尔滨工业大学(威海) , 威海天之卫网络空间安全科技有限公司
IPC: H04L12/741 , H04L12/819 , H04L12/825 , H04L12/851
Abstract: 本发明涉及一种适用于工控互联网的限速方法和装置,属于互联网限速技术领域,该方法对传统的令牌桶算法进行了改进,设置了一个阈值来处理突发流量的情况,在一定时间内,如果令牌桶中已无令牌可用,则消耗阈值中的令牌,并且把限速等级上调一级,当限速等级达到某一程度时,则禁止流量通过;然而,当接下来,令牌桶中有剩余令牌时,则下调限速等级。可以有效的缓解令牌桶算法处理流量剧增的不足性,极大程度的缓解令牌桶算法应对突发流量程度差的问题。本发明不针对工控流量限速,只针对非工控流量进行限速,适用于工控互联网的安全防护,并且,能够适当的自动上调和下调协议解析顺序,最大程度的减少装置给工控协议带来的延时。
-
公开(公告)号:CN107808000B
公开(公告)日:2020-05-22
申请号:CN201711115185.0
申请日:2017-11-13
Applicant: 哈尔滨工业大学(威海) , 威海天之卫网络空间安全科技有限公司
IPC: G06F16/951 , G06F16/2458 , G06F16/22 , G06F16/28 , G06F16/25
Abstract: 本发明涉及一种暗网数据采集与抽取系统及方法,包括依次连接的暗网站点发现模块、暗网数据爬取模块、页面解析与内容抽取模块、数据融合与存储模块;暗网站点发现模块获取多源数据中的暗网url;暗网数据爬取模块配置Tor服务,修改Nutch的配置,使其与socks协议交互,进行数据的爬取;页面解析与内容抽取模块进行页面解析、页面向量化、特征码生成、相似度计算与模板集更新、页面内容抽取;数据融合与存储模块采用数据对齐策略对抽取得到的内容重组,将内容相近的数据记录融合存入数据库中。本发明实现了完整的页面保存到内容抽取的系统设计流程,为暗网中违法交易活动的发现与暗网知识图谱的建立提供数据支撑。
-
公开(公告)号:CN110399718A
公开(公告)日:2019-11-01
申请号:CN201910482385.2
申请日:2019-06-04
Applicant: 哈尔滨工业大学(威海) , 哈工大(威海)创新创业园有限责任公司
Abstract: 本发明公开了一种针对工业控制系统的远程渗透取证的方法,包括如下步骤:(1)本地提权;(2)权限驻留;(3)信息收集;(4)本地漏洞扫描;(5)远程扫描利用,本发明所公开的方法可以在目标工控内网中,以渗透人员的视角,对目标网络和目标主机进行内网渗透测试,为工控安全防护提供了参考价值并为工控安全评估提供了专业性工具,对工控安全评估、取证和防护具有重要意义。
-
公开(公告)号:CN109102061A
公开(公告)日:2018-12-28
申请号:CN201810908324.3
申请日:2018-08-10
Applicant: 哈尔滨工业大学(威海)
IPC: G06N3/00
Abstract: 本发明提供一种符合人类动力学规律的群体用户行为产生系统,设备及存储介质,群体用户行为产生系统能够产生指定规模的虚拟用户,通过确定用户在时间域、空间域上的微观行为模式,从而实现群体用户在信息域上的行为生成,使得每个用户可以发出一定程度上真实的Web行为,所有用户形成的用户群体的行为规律符合人类动力学特征:单用户行为间隔时间分布、用户行为数量分布、群体用户行为间隔时间分布均符合幂律分布。人类动力学规律的表现结果就是人类行为间隔时间分布满足幂律分布,本发明能够在互联网的环境下,模拟产生出一种在个体用户行为间隔时间、行为数量分布、群体用户行为间隔时间符合人类动力学规律的群体用户Web行为。
-
公开(公告)号:CN108960833A
公开(公告)日:2018-12-07
申请号:CN201810909350.8
申请日:2018-08-10
Applicant: 哈尔滨工业大学(威海)
CPC classification number: G06Q20/382 , G06Q40/04
Abstract: 本发明提供一种基于异构金融特征的异常交易识别方法,设备及存储介质,能够利用疑似异常或与某些确定异常账号相关的大量待检测金融交易流水信息数据,提取自定义交易熵特征和交易活跃度、金额统计特征,并构建异构金融特征向量表示,然后基于异构特征向量利用投票分类器进行待检测交易账号是否为传销异常交易关系的分类识别。本发明提出的可疑金融交易关系识别方法利用金融交易流水数据实现了对交易主体复杂行为规律特征的较丰富的抽象和表达,取得较好的异常金融交易关系检测识别效果。本方法提供的异常金融交易关系检测结果可以辅助相关工作人员进行传销等异常金融活动的侦查研判,在一定程度上可以提高工作效率以及提高研判准确率。
-
公开(公告)号:CN107911360A
公开(公告)日:2018-04-13
申请号:CN201711115196.9
申请日:2017-11-13
Applicant: 哈尔滨工业大学(威海)
CPC classification number: H04L63/1466 , G06F16/951 , G06F16/955 , H04L63/1416 , H04L63/1483
Abstract: 本发明涉及一种被黑网站检测方法及系统,包括:(1)获取原始数据;(2)数据清洗;(3)分别抽取出文本检测、图片检测、启发式检测所需的数据;(4)查询文本检测的索引库,返回相似度值S1;(5)采用匈牙利算法计算两个图片之间的emd距离并转化成相似性S2;(6)相似度值S1和相似性S2线性融合;(7)如果融合结果S≥T,则判定该网站没有被黑,标记为0;否则,判定该网站被黑,标记为1;(8)采用决策树模型对待检测网页进行判断,输出结果为0(未被黑)或1(被黑),如果(7)、(8)至少有一个为1,则表示网页被黑,否则网页正常。本发明采取两种方式检测,根据阈值判断,精确度更高,可及时发现互联网中一些恶意网页或被黑网页。
-
公开(公告)号:CN107908749A
公开(公告)日:2018-04-13
申请号:CN201711147336.0
申请日:2017-11-17
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明涉及一种基于搜索引擎的人物检索系统及方法,包括依次连接的数据采集模块、数据预处理模块、特征抽取模块、聚类模块;数据采集模块爬取搜索引擎检索人名返回的网页信息;数据预处理模块过滤与人名无关的网页,进行分块处理,过滤网页中与检索人名无关的视觉块;特征抽取模块抽取与检索人物相关的属性和实体,统计视觉块中词频,构造每个网页的向量表示形式,适当增加抽取的特征词在向量空间中对应维数的值,聚类模块将每个网页的向量表示形式作为输入,进行网页文本的聚类,输出网页类别标签组成的列表。本发明有效解决检索人物时返回网页中的人名歧义和信息杂乱的问题,通过抽取人物属性和人物关系构造人物摘要,为用户检索人名提供便利。
-
公开(公告)号:CN118981531A
公开(公告)日:2024-11-19
申请号:CN202310413475.2
申请日:2023-04-13
Applicant: 哈尔滨工业大学(威海) , 威海天之卫网络空间安全科技有限公司
IPC: G06F16/34 , G06F40/205 , G06F16/35 , G06F18/25 , G06N3/045 , G06N3/0475 , G06N3/0442 , G06Q10/10 , G06Q50/26
Abstract: 本申请涉及自然语言处理技术领域,具体为一种基于多模态融合的金融诈骗对话摘要与关键词联合生成方法,利用犯罪嫌疑人手机中的聊天记录,通过融合金融诈骗领域信息的文本摘要与关键词联合生成模型,得到犯罪嫌疑人聊天记录的对话摘要与关键词。本申请的方法拥有较强的泛化能力,解决现有方法处理数据类型单一、难以处理聊天记录短文本和金融诈骗口语化信息等问题;实现了对犯罪嫌疑人聊天记录的全方位搜集整理,协助办案人员重点研究从事犯罪活动的联系人,提取犯罪同伙的关键对话信息,定位关键证据,掌握犯罪事实;应用前景广泛,可用于各种现实场景中的对于金融诈骗对话摘要与关键词生成的需要,减少人力成本,提高工作效率。
-
-
-
-
-
-
-
-
-