-
公开(公告)号:CN103150381A
公开(公告)日:2013-06-12
申请号:CN201310080760.3
申请日:2013-03-14
Applicant: 北京理工大学
Abstract: 本发明涉及一种基于规则和统计相结合的谓词识别方法,属于自然语言处理与机器学习领域,目的是为解决谓词高精度高效率识别问题。本发明采用分步识别方法,从已进行词法和句法标注的句子中识别谓词,首先对待测句子进行词法分析,得到可疑谓词及其个数;接着利用初步识别判定条件进行谓词初步识别;对不满足初步识别判定条件的可疑谓词提取相关词法和句法特征并利用C4.5训练得到的决策树判定模型对其进行判定;最终汇总两步识别结果给出每个待测句子中的谓词。本发明具有准确率高、识别速度快、对非动词性谓词识别率高等特点,适用于要求高精度的汉语谓词识别领域,对句义分析的发展具有很大的推动作用,具有很好的应用价值和推广价值。
-
-
公开(公告)号:CN116257845B
公开(公告)日:2025-04-18
申请号:CN202310173239.8
申请日:2023-02-16
Applicant: 北京理工大学
IPC: G06F21/55 , G06F18/2415 , G06F18/25 , G06F18/22 , G06F16/2458 , G06N3/0442 , G06N3/0464
Abstract: 本发明涉及融合查询行为特征的分类模型窃取检测方法,属于计算机与信息科学领域。本发明首先从原始流量数据包中提取查询行为数据流,并基于查询行为数据流提取查询样本;然后对查询样本进行正态分布校验计算样本特征恶意值,同时利用CNN和LSTM提取查询行为数据流的时空特征,再判断查询行为类型并计算行为恶意值;最后结合样本特征恶意值和行为恶意值进行分类模型窃取检测。本发明针对攻击者生成的恶意查询样本与良性查询样本间的特征差异不明显的问题,提出了一种融合查询行为特征的分类模型窃取检测方法,提高了分类模型窃取检测召回率。
-
公开(公告)号:CN115056829B
公开(公告)日:2024-09-20
申请号:CN202210533015.9
申请日:2022-05-16
Applicant: 北京理工大学
IPC: B61L27/60 , G06N3/0464 , G06N3/08 , G06F18/2135
Abstract: 本发明涉及多车型连续学习的列车运动状态估计方法,属于计算机与人工智能技术领域。首先通过特征抽取方法确定列车运行数据的基础特征集合,针对每一特征的样本关系构建单层图结构,根据特征关联关系组合单层图为多重图;其次,基于神经气体网络学习多重图的拓扑结构,并使用多车型运行数据对拓扑结构迭代更新;然后,对多重图的层内与层间关系进行数据聚合,并根据多车型知识拓扑结构生成样本的关系编码;最后,通过非线性变换组合基础特征,并与样本的关系编码结合,用于预测列车的运动状态。本发明将单一车型运行数据与多车型知识拓扑相结合,实现在真实运行数据有限的条件下多车型运行数据的连续建模与运动状态估计。
-
公开(公告)号:CN115056825B
公开(公告)日:2024-04-05
申请号:CN202210536855.0
申请日:2022-05-17
Applicant: 北京理工大学
IPC: B61L27/04
Abstract: 本发明涉及自适应性能的列车加速方法,属于计算机与信息科学技术领域。本发明首先对含噪的列车运行数据建立目标列车性能估计模型,拟合级位序列和速度与加速度之间的函数关系;然后依次查询不同速度区间下各级位对应加速度值,建立加速度随级位和速度变化的关系表,称为列车专属性能表;最后将加速度范围约束引入专属性能表,逐车生成与目标车辆相适配的推荐速度。本发明利用车辆专属性能表,对推荐加速度范围进行约束,生成与受控列车匹配的自适应性能推荐速度,减少级位切换频率,提高自动驾驶平稳性及节能水平。
-
公开(公告)号:CN117668159A
公开(公告)日:2024-03-08
申请号:CN202311674549.4
申请日:2023-12-07
Applicant: 北京理工大学
IPC: G06F16/33 , G06F40/30 , G06F40/284 , G06F40/247 , G06N3/0895
Abstract: 本发明涉及强化多模态语义的对比学习代码搜索技术,属于自然语言处理与机器学习领域。本发明首先将代码片段表示为token序列、抽象语法树和程序表达式图三种模态,利用BERT模型生成各模态特征向量,并拼接为联合代码特征向量;然后通过构建一种对比损失函数,缩小查询语句与对应代码片段在特征空间中的距离;最后利用余弦相似度计算查询语句特征向量与联合代码特征向量的距离并排序,输出代码搜索结果。本发明针对现有方法未充分提取代码结构特征、查询语句与代码片段存在语义鸿沟的问题,提出强化多模态语义的对比学习代码搜索技术,提高代码搜索的准确率。
-
公开(公告)号:CN117171637A
公开(公告)日:2023-12-05
申请号:CN202311013557.4
申请日:2023-08-11
Applicant: 北京理工大学
IPC: G06F18/241 , G06N5/04 , G06F18/213 , G06N3/0499 , G06N3/08 , G06N3/042
Abstract: 本发明涉及时序异质图嵌入的互联网AS关系推断方法,属于网络空间安全与深度学习领域。首先在AS注册信息和BGP报文中提取特定AS属性和AS关系,构造以AS为节点、AS关系为边的时序异质图;然后基于时序异质图通过Hawkes过程提取节点时序特征,同时依据AS关系对时序异质图进行子图拆分,并通过图注意力网络提取节点交互特征;最后融合节点的时序特征和交互特征,并利用MLP分类器进行AS关系推断。本发明针对基于图神经网络的AS关系推断方法无差别建模不同AS关系以及忽略时间依赖特征的问题,提出一种利用时序异质图嵌入的AS关系推断方法,捕获AS间多类型关系并关注路由交换的时序特征,提升AS关系分类精确率。
-
公开(公告)号:CN117171611A
公开(公告)日:2023-12-05
申请号:CN202311013406.9
申请日:2023-08-11
Applicant: 北京理工大学
IPC: G06F18/24 , G06F18/213 , G06F16/955 , G06F18/25 , G06F40/30 , G06N3/0895 , G06N3/047
Abstract: 本发明涉及结合图注意力网络和对比学习的网站服务分类方法,属于计算机与信息科学领域。本发明首先利用BERT提取网站的文本语义特征;其次根据网页的HTML代码构建网页DOM解析树,同时根据URL链接生成网页关系图;然后利用图注意力网络并结合对比学习方法,提取网页DOM解析树和网页关系图的结构特征,生成网站结构表示;最后融合网站的文本语义特征和结构表示进行网站服务分类。本发明针对现有方法未充分利用网站结构信息的问题,提出结合图注意力网络和对比学习的网站服务分类方法,强化网站结构特征,提高网站服务分类准确率。
-
公开(公告)号:CN117118847A
公开(公告)日:2023-11-24
申请号:CN202311013458.6
申请日:2023-08-11
Applicant: 北京理工大学
IPC: H04L41/12
Abstract: 本发明涉及强化拓扑网络结构特征的互联网自治域组织机构映射方法,属于计算机与信息科学领域。本发明首先通过whois和AS Rank数据库获取自治域注册信息和自治域路由连接及商业关系;其次根据自治域路由连接关系和注册信息中的特定自治域属性生成自治域拓扑网络;然后基于自治域拓扑网络和自治域间商业关系利用双曲图卷积神经网络得到自治域特征嵌入;最后计算拓扑网络中所有自治域特征嵌入对的相似度,再制定归并规则实现互联网自治域组织机构映射。本发明针对现有方法忽略拓扑网络树状层次关系的问题,提出强化拓扑网络结构特征的自治域组织机构映射方法,在双曲空间中提取拓扑网络的树状层次特征,提升互联网自治域组织机构映射准确率。
-
公开(公告)号:CN116933048A
公开(公告)日:2023-10-24
申请号:CN202310504903.2
申请日:2023-05-06
Applicant: 北京理工大学
IPC: G06F18/21 , G06F18/214 , G06F18/241 , G06F18/2415 , G06N3/0455 , G06N3/08
Abstract: 本发明涉及结合数据分布和图分析的深度学习测试样本排序方法,属于计算机与信息科学领域。本发明首先利用变分自编码器计算样本的LR评分,过滤不符合模型任务的样本;其次将模型各隐藏层分别全连接输出层生成子模型,根据样本在各子模型中的预测概率生成转移矩阵;然后捕获模型神经元激活值,按顺序排列构建神经元激活图并提取其邻接矩阵;最后拼接转移矩阵和邻接矩阵训练XGBoost和LightGBM模型,并几何加权两种模型对样本的输出,作为测试样本得分指导样本排序。本发明提出一种结合数据分布和图分析的方法,改善了现有深度学习测试样本排序方法缺少对样本符合模型任务的过滤机制和缺少对模型参数的充分利用的问题,提升了测试样本检测模型错误的效率。
-
-
-
-
-
-
-
-
-