-
公开(公告)号:CN108154174A
公开(公告)日:2018-06-12
申请号:CN201711399101.0
申请日:2017-12-22
Applicant: 北京工业大学
CPC classification number: G06K9/6282 , G06K9/6256 , G06N3/006 , G06N20/00
Abstract: 本发明公开一种基于核极限学习机及并行化的随机森林分类系统,包括:单机模块和并行化模块,其中,单机模块主要针对的是非海量数据集的处理,其包含四个子模块分别是数据抽取模块、模型训练模块、模型评估模块、模型优化模块。采用本发明的技术方案,不仅可以支持海量数据的处理,而且能够提高对数据的分类性能。
-
公开(公告)号:CN108108762A
公开(公告)日:2018-06-01
申请号:CN201711399080.2
申请日:2017-12-22
Applicant: 北京工业大学
Abstract: 本发明公开一种用于冠心病数据分类的基于核极限学习机及并行化的随机森林分类方法,采用Bootstrap方法对冠心病样本集进行有放回的采样,生成不同的冠心病数据训练子集和测试子集以供基分类器使用;采用混合核形式的核函数作为核极限学习机的核函数,减少核类型对分类模型的性能影响;使用冠心病数据训练子集对核极限学习机进行模型训练并使用测试子集对基分类器进行性能测试,采用排序加粒子群优化的方式循环判断重新生成优化的新基分类器,剔除并代替分类性能较差的基分类器,从而达到提高整体分类性能的目的;形成随机森林模型之后,采用相对多数投票法选取分类结果。
-
公开(公告)号:CN104881607B
公开(公告)日:2017-12-29
申请号:CN201510262307.3
申请日:2015-05-21
Applicant: 北京工业大学
IPC: G06F21/57
Abstract: 一种基于模拟浏览器行为的XSS漏洞动态检测系统。该系统由爬虫模块和漏洞检测模块组成。爬虫模块含有浏览器的内核,可以模拟浏览器行为来解析JavaScript和加载Ajax以得到页面中隐藏式注入点,相比传统而言,该系统大大增加了对注入点的覆盖。漏洞检测模块使用黑盒测试的方法,在提交攻击向量后,通过模拟浏览器行为检测页面是否有异常情况出现,即能够检测浏览器是否执行了网页脚本,直接判断出当前注入点是否有漏洞,相比传统方法更加准确。此外,该系统完全采用python语言开发,具有易于维护和进行二次开发的特点,对XSS漏洞的检测与研究有非常重要的应用价值。
-
公开(公告)号:CN106845248A
公开(公告)日:2017-06-13
申请号:CN201710036839.4
申请日:2017-01-18
Applicant: 北京工业大学
IPC: G06F21/57
CPC classification number: G06F21/577 , G06F2221/034
Abstract: 一种基于状态转换图的XSS漏洞动态检测方法,该方法包括Crawler模块、Fuzzing模块和Report模块以及封装浏览器操作的Browser层。Browser层对Selenium API进一步封装,被其他三大模块调用,实现页面执行动作、执行脚本和判断页面状态等功能。Crawler模块对Web应用动态构造状态转换图并挖掘注入点,相对于传统挖掘方法具有更高的覆盖率。Fuzzing模块使用攻击向量对注入点进行模拟攻击,并对攻击结果进行动态判定。Report模块收集结果信息,总和汇总成漏洞报告。系统采用java语言开发,具有可移植性强、可维护性好等特点,对XSS漏洞扫描甚至网站抓取的研究具有重要价值。
-
公开(公告)号:CN104536977A
公开(公告)日:2015-04-22
申请号:CN201410736156.6
申请日:2014-12-04
Applicant: 北京工业大学
IPC: G06F17/30
CPC classification number: G06F17/30929 , G06F17/30938
Abstract: 一种基于查询状态机的XML流数据查询方法,属于数据库技术领域,针对各个查询步中采用路径表达式方式表示的筛选条件,在预处理后,采用相同方法构造筛选状态机,合并到整体的查询状态机中。路径表达式中各查询步的状态机上配置了缓冲队列,根据查询需求将入队动作,清空动作,上传动作和输出动作附加在不同的状态转移上。XML流数据的查询过程从查询状态机的初始状态开始,当输入的XML标签和转移标记匹配时,执行附加的处理动作,完成状态转移:在末端查询步的状态机中,将输入的XML元素加入到缓冲队列;这种查询方法支持采用多重查询步所组成的路径表达式描述的查询模式,能够有效地实现XML格式等复杂类型数据的流数据查询。
-
公开(公告)号:CN114494728B
公开(公告)日:2024-06-07
申请号:CN202210123900.X
申请日:2022-02-10
Applicant: 北京工业大学
IPC: G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种基于深度学习的小目标检测方法,包括以下步骤:对训练数据中的小目标进行数据增强。通过特征提取网络对处理后的图像进行特征提取,将特征图通过级联进行融合作为特征图。特征图经过通道注意力模块加权后再经过空间注意力模块得到最终的特征图。将所提取的潜在目标根据面积大小划分为常规目标与小目标。对小目标区域进行RoIAlign区域池化操作,对池化结果进行类别判断与位置回归得到最终检测结果;使用混合注意力模块,提升RPN区域提取能力,将提取的区域按照面积大小区分为小目标与其他目标两类,对小目标区域使用RoIAlign区域池化,充分利用了小目标区域的特征信息,从而在减少计算量增加的同时提升了网络对小目标的检测能力。
-
公开(公告)号:CN117874086A
公开(公告)日:2024-04-12
申请号:CN202410056289.2
申请日:2024-01-15
Applicant: 北京工业大学
IPC: G06F16/2455 , G06F16/25 , G06F16/2453
Abstract: 复杂事件处理中多聚合查询的动态共享方法属于数据处理领域,研究了一种针对包含Kleene模式和嵌套模式的事件趋势聚合查询的共享方法。首先通过设计共享图数据结构和代价模型,提出三个节点生成原则和修剪原则,生成最优的共享计划;然后引入在线增量聚合执行共享方法,执行聚合结果的生成过程;最后在执行过程中不断反馈共享收益,对生成的共享计划即时调整,以适应实时变化的事件流信息,保证共享计划的最优性,提高复杂事件系统的吞吐量和整体匹配效率。
-
公开(公告)号:CN115934969A
公开(公告)日:2023-04-07
申请号:CN202310022929.3
申请日:2023-01-08
Applicant: 北京工业大学
IPC: G06F16/36 , G06F16/901 , G06Q10/0635 , G06Q50/26
Abstract: 本发明公开了一种不可移动文物风险评估知识图谱构建方法,包括本体模型设计、多源异构数据处理、不可移动文物风险评估领域RDF数据到图数据库的映射方法和基于Neo4J图数据库的领域知识图谱构建方法;采用图数据库的方式存储不可移动文物本体及风险评估信息,根据不可移动文物风险评估模型对领域本体建模方法——七步法进行改进,按照改进后的方法建立本体模型。本体模型构建完成后,根据本体模型和领域数据使用图数据库Neo4J构建不可移动文物风险评估领域知识图谱。
-
公开(公告)号:CN113095074A
公开(公告)日:2021-07-09
申请号:CN202110303360.9
申请日:2021-03-22
Applicant: 北京工业大学
IPC: G06F40/289 , G06F40/284 , G06F40/237 , G06N3/04 , G06N3/08
Abstract: 本发明公开了中文电子病历的分词方法及系统,该方法的主体为基于GNN‑BiLSTM‑CRF的中文电子病历分词模型,包含步骤如下:数据集的构建及数据的处理。将来源于合作医院的中文电子病历数据进行人工标注,完成中文电子病历分词数据集的构建。将构建好的数据集中的数据转为CoNLL格式。训练中文电子病历分词模型。本发明提出的中文电子病历模型充分利用GNN及LSTM的优势,通过图结构和链结构交互捕获医疗术语构词规律等局部特征和上下文序列信息及长期特征,提高分词的质量。通过图神经网络高效将领域词典融入到分词模型中,通过其学习术语构词规律扩展了词典的应用价值,降低了模型对数据集的依赖同时缓解了医学术语繁多且与日俱增而导致的分词问题。
-
公开(公告)号:CN113066546A
公开(公告)日:2021-07-02
申请号:CN202110258625.8
申请日:2021-03-09
Applicant: 北京工业大学
Abstract: 本发明公开了一种电子病历结构化数据组织方法及实现系统,通过分析目前电子结构化水平不高、粒度不够细化等不足,提出了一种更加细化、高效的电子病历结构化存储设计方法。该方法以病人为中心,细化了电子病历信息,并引入时间概念,更加方便的查询病人电子病历信息,为医务人员提供帮助。
-
-
-
-
-
-
-
-
-