-
公开(公告)号:CN108376254A
公开(公告)日:2018-08-07
申请号:CN201810236422.7
申请日:2018-03-21
Applicant: 北京理工大学
Abstract: 本发明涉及融合多源特征的内部威胁人物检测方法,属于计算机与信息科学技术领域。本发明首先对待处理的多源数据进行预处理与特征提取,包括处理数据中的空缺值、异常值,进而根据不同数据的特点,遵循特征提取的基本原则,对不同数据进行特征提取,得到53维的内部威胁人物特征向量;然后进行孤立森林模型训练,构建内部威胁人物检测模型;最后利用构建的原始模型进行内部威胁人物检测,并给出判定结果。本发明在实际应用场景中,可明显提升内部威胁人物检测性能,且算法执行时间较传统算法短,有效实现了内部威胁人物检测。
-
公开(公告)号:CN107179939A
公开(公告)日:2017-09-19
申请号:CN201710332983.2
申请日:2017-05-12
Applicant: 北京理工大学
Abstract: 本发明涉及一种信息安全竞赛题目可用性检测方法,属于计算机与信息科学技术领域。本发明通过撰写定时监控脚本,对竞赛题目的相关服务,相关服务密码以及题目文件的完整性进行监控,从而对题目可用性状态进行检测,保证竞赛的顺利进行。本发明可以对信息安全竞赛题目的可用性进行检测,其方法适用于各种信息安全竞赛。
-
公开(公告)号:CN107169351A
公开(公告)日:2017-09-15
申请号:CN201710331198.5
申请日:2017-05-11
Applicant: 北京理工大学
CPC classification number: G06F21/552 , G06F21/566
Abstract: 本发明涉及一种结合动态行为特征的Android未知恶意软件检测方法,属于计算机与信息科学技术领域。本发明首先将被检测软件输入到系统中;然后,系统会对软件包进行解压缩与反编译,并提取结果文件中的静态特征;同时,系统会在Android模拟器中运行该软件包,使用基于LKM(Loadable Kernel Module,可加载内核模块)的行为监控系统监控软件的动态行为,并记录日志,在日志中提取软件的动态行为特征;最后,将提取出的动静态特征进行归一化处理,输入到训练好分类算法分类检测模块中,该模块可根据输入的动静态特征数据自动判断出被检测软件是否为恶意软件。本发明具有较高的检测效率及准确率,可应用于Android应用市场等软件平台的安全检测中。
-
公开(公告)号:CN106445921A
公开(公告)日:2017-02-22
申请号:CN201610868390.3
申请日:2016-09-29
Applicant: 北京理工大学
IPC: G06F17/27
CPC classification number: G06F17/277
Abstract: 本发明涉及一种利用二次互信息的中文文本术语抽取方法,属于计算机科学与自然语言处理技术。本发明首先基于核心词前后扩展,结合二次互信息、词频、词长和词性特征,将核心词扩展成多个候选术语,然后根据术语间的嵌套关系、词长、词频特征去除候选集中的冗余术语并对术语进行打分排序。本发明综合考虑了术语的语言规则和统计特征,提高了术语抽取的准确性。
-
公开(公告)号:CN103235772B
公开(公告)日:2016-06-08
申请号:CN201310074883.6
申请日:2013-03-08
Applicant: 北京理工大学
IPC: G06F17/27
Abstract: 本发明涉及一种从中文文本或文本集中自动提取人物关系的方法,属于计算机科学与信息抽取技术领域。在该方法中,利用了句义模型特征用于判定关系属性归属,并结合关系属性消歧、人物关系强度计算的方法等,将分散在文本或文本集中的人物关系自动提取出来,利用人物关系网络进行组织,并且通过人物关系图的方式进行展示(包括展示人物关系属性和关系强度)。本发明引入句义模型特征提升了实体关系提取方法的准确性,丰富了人物关系提取方法。此外,随着文本集中关于中心人物的文本数目的增加,该发明方法对中心人物的人物关系提取将越来越准确和全面,适用范围越来越广。
-
公开(公告)号:CN103198833B
公开(公告)日:2015-10-21
申请号:CN201310075089.3
申请日:2013-03-08
Applicant: 北京理工大学
Abstract: 本发明涉及一种基于文本无关说话人确认方法。本发明提出了Turbo-Boost分类算法与2D-Haar音频特征的相结合的说话人确认方法,首先使用基础音频特征构成音频特征图;进而利用音频特征图提取2D-Haar音频特征,再使用Turbo-Boost算法,通过两轮迭代运算分别完成对2D-Haar音频特征的筛选和说话人分类器的训练;最终使用训练好的说话人分类器实现说话人确认。与现有技术相比,本发明可以在同样的运算消耗下获得更高的准确率,特别适合对于运算速度和说话人确认精度有着严格要求的说话人确认场合,例如电话自动接听系统、计算机身份认证系统、高密级门禁系统等。
-
公开(公告)号:CN103176963B
公开(公告)日:2015-06-03
申请号:CN201310074933.0
申请日:2013-03-08
Applicant: 北京理工大学
Abstract: 本发明涉及一种基于CRF++的汉语句义结构模型自动标注方法,属于计算机科学与自然语言处理语义分析技术领域。本发明首先使用BFS-CTC汉语标注语料库语料,训练得到谓词识别模型、词关系识别模型和语义格类型识别模型;进而使用上述三种识别模型,对原始句子进行识别,得到句子中谓词信息、词关系信息和语义格类型信息;最终根据谓词、词关系和语义格类型的搭配规则得到汉语句义结构模型。本发明为语义分析领域,提供了更多的更全面的语义特征,为使用计算机对句子进行句义结构模型分析奠定了基础。同时为BFS-CTC汉语标注语料库的自动标注,提供了一定的可能,语料数据无论是研究还是实际应用,都是极其重要的,将对BFS-CTC汉语标注语料库的扩充,起到极大的推动作用。
-
公开(公告)号:CN103198211A
公开(公告)日:2013-07-10
申请号:CN201310074038.9
申请日:2013-03-08
Applicant: 北京理工大学
Abstract: 本发明涉及2型糖尿病发病危险因素对血糖影响的定量分析方法,属于生物信息处理及医学领域。本发明首先使用C4.5和EM聚类算法实现重要发病危险因素的选择;再根据性别和年龄对全体人群进行划分,进而利用BP神经网络算法对细化人群进行敏感度计算,最终通过敏感度实现多因素对血糖影响的定量分析。与现有大量统计学方法相比,本发明采用数据挖掘方法,在充分考虑多因素之间相互影响的同时,在细化人群中实现多因素对血糖影响的定量分析,大大提高了定量分析的准确率,并可为个体发病的细化干预提供判定方法。本发明可对个体2型糖尿病发病进行干预指导,不仅可以预防或延缓发病,而且该方法可应用推广到其它疾病危险因素的定量分析。
-
公开(公告)号:CN103177089A
公开(公告)日:2013-06-26
申请号:CN201310074970.1
申请日:2013-03-08
Applicant: 北京理工大学
Abstract: 本发明涉及一种基于中心块的句义成分关系分层识别方法,属于计算机科学与中文信息处理技术领域。本发明基于现代汉语语义学,解决了汉语句义结构模型中汉语句义成分关系识别的问题。本发明首先给出一种“层次中心块”的概念,实现句法结构到句义结构的有效映射;将句义成分关系识别问题划分为三类层次关系识别问题,谓词间关系、基本格与谓词关系、一般格与各句义成分关系;分别提出了中心块识别算法、基本格识别算法、一般格识别算法、谓词间关系识别算法、基本格与谓词间关系识别算法、一般格与各句义成分间关系识别算法,使得计算机能够以较高的准确率及效率分析得到句义成分关系,进一步推进了汉语句义结构模型的研究。
-
公开(公告)号:CN103150303A
公开(公告)日:2013-06-12
申请号:CN201310074015.8
申请日:2013-03-08
Applicant: 北京理工大学
IPC: G06F17/27
Abstract: 本发明涉及一种基于词法、句法和句义结构特征的汉语语义格分层识别方法,属于计算机科学与自然语言处理技术领域。本发明在增加了句义结构特征的基础上,首先获取最小完整语义单元;进而提取词法、句法和句义结构特征并使用C4.5决策树算法进行汉语语义格的初步识别;然后选择词法、句法和句义特征并使用C4.5决策树算法与最大熵算法相结合的方法实现汉语语义格中基本格的精确识别;最后再次选择词法、句法和句义特征并使用C4.5决策树算法实现汉语语义格中一般格的精确识别。与现有语言分析技术相比,本发明为语义学自动分析自然语言提供了汉语语义格的自动识别,是实现自动语义分析的基础。本发明可实现并行处理,能够提高计算机处理效率。
-
-
-
-
-
-
-
-
-