-
公开(公告)号:CN104050556B
公开(公告)日:2017-06-16
申请号:CN201410228073.6
申请日:2014-05-27
Applicant: 哈尔滨理工大学
Abstract: 本发明涉及一种垃圾邮件的特征选择方法及其检测方法,包括:基于字节的N‑grams方法进行邮件的特征提取;根据提取的特征与预设邮件类别的相关度进行特征排序生成初始特征子集;根据近似马尔科夫毯算法删除所述初始特征子集中的冗余特征得到候选特征子集;通过在线逻辑回归分类器对所述候选特征子集进行预测并根据预测结果对所述候选特征子集进行评价选择最优特征子集;根据所述最优特征子集利用在线逻辑回归分类器对垃圾邮件进行检测。采用本发明提出的垃圾邮件的特征选择方法及其检测方法,使得垃圾邮件的特征选择及垃圾邮件检测的计算过程简单,时间复杂度低,而且使得垃圾邮件检测的准确率大大提高。
-
公开(公告)号:CN103973589B
公开(公告)日:2017-04-12
申请号:CN201310414970.1
申请日:2013-09-12
Applicant: 哈尔滨理工大学
IPC: H04L12/813
Abstract: 本发明提供了一种网络流量分类方法及装置,涉及计算机网络安全领域。该方法包含离线训练阶段和在线识别阶段:离线训练阶段包含:S1、构建训练数据集的应用类型分布图,得到对应关系,并计算概率;S2、构建端口与应用的对应关系表;S3、确立决策因子;在线识别阶段包含:S4、获取端口对,选择其中一个端口作为决策端口;S5、进行分类器选择;S6、选择基于载荷的分类模块为分类器,当分类结果不为空时,对对应关系及其概率值进行单向监督,评价对应关系并更新概率。本发明在网络流量分类过程中减少对于数据包内容的检测,降低对内存和带宽的需求,以及对用户隐私的侵犯,实现在高速网络链路下高速度、高精度的流量分类。
-
公开(公告)号:CN105652429A
公开(公告)日:2016-06-08
申请号:CN201610165283.4
申请日:2016-03-22
Applicant: 哈尔滨理工大学
IPC: G02B21/24
CPC classification number: G02B21/244
Abstract: 一种基于机器学习的显微镜细胞载玻片扫描自动聚焦方法,本发明涉及基于机器学习的显微镜细胞载玻片扫描自动聚焦方法。本发明的目的是为了解决现有聚焦速度慢、计算量大、计算速度慢的问题。具体过程为:一、开始;二、根据载玻片情况选择螺旋扫描、蛇形扫描或随机蛇形扫描以及待扫描区域的数量;三、计算出低灰度值统计法的阈值、门限和三个步长大小;四、按照选择扫描方式控制载物平台沿XY轴移动到下一个待采集图像区域;五、控制载物平台到达焦点;摄像头采集当前区域图像;六、判断采集当前区域图像数量是否满足步骤二中待扫描区域的数量,若满足,则执行七,若没满足,则执行四;七、结束。本发明应用于显微镜聚焦领域。
-
公开(公告)号:CN104050556A
公开(公告)日:2014-09-17
申请号:CN201410228073.6
申请日:2014-05-27
Applicant: 哈尔滨理工大学
IPC: G06Q10/10
Abstract: 本发明涉及一种垃圾邮件的特征选择方法及其检测方法,包括:基于字节的N-grams方法进行邮件的特征提取;根据提取的特征与预设邮件类别的相关度进行特征排序生成初始特征子集;根据近似马尔科夫毯算法删除所述初始特征子集中的冗余特征得到候选特征子集;通过在线逻辑回归分类器对所述候选特征子集进行预测并根据预测结果对所述候选特征子集进行评价选择最优特征子集;根据所述最优特征子集利用在线逻辑回归分类器对垃圾邮件进行检测。采用本发明提出的垃圾邮件的特征选择方法及其检测方法,使得垃圾邮件的特征选择及垃圾邮件检测的计算过程简单,时间复杂度低,而且使得垃圾邮件检测的准确率大大提高。
-
公开(公告)号:CN104036777A
公开(公告)日:2014-09-10
申请号:CN201410217411.6
申请日:2014-05-22
Applicant: 哈尔滨理工大学
IPC: G10L15/20 , G10L21/0308
Abstract: 本发明涉及一种语音活动检测方法及装置,包括:提取干净语音信号的信号特征和混噪语音信号的信号特征;根据所述干净语音信号的信号特征进行字典训练得到语音字典;根据所述混噪语音信号的信号特征动态更新预设的噪声训练数据,提取更新后的所述噪声训练数据的信号特征进行在线字典训练得到噪声字典;根据所述语音字典和噪声字典对输入的混噪语音信号的信号帧进行稀疏表示;提取所述稀疏表示中的稀疏系数,根据所述稀疏系数对输入的混噪语音信号的信号帧进行检测。采用本发明提出的方法及装置,能够准确分辨出噪声环境下语音信号的语音部分和非语音部分,提高在变化噪声环境下语音活动检测的性能。
-
公开(公告)号:CN103973589A
公开(公告)日:2014-08-06
申请号:CN201310414970.1
申请日:2013-09-12
Applicant: 哈尔滨理工大学
IPC: H04L12/813
Abstract: 本发明提供了一种网络流量分类方法及装置,涉及计算机网络安全领域。该方法包含离线训练阶段和在线识别阶段:离线训练阶段包含:S1、构建训练数据集的应用类型分布图,得到对应关系,并计算概率;S2、构建端口与应用的对应关系表;S3、确立决策因子;在线识别阶段包含:S4、获取端口对,选择其中一个端口作为决策端口;S5、进行分类器选择;S6、选择基于载荷的分类模块为分类器,当分类结果不为空时,对对应关系及其概率值进行单向监督,评价对应关系并更新概率。本发明在网络流量分类过程中减少对于数据包内容的检测,降低对内存和带宽的需求,以及对用户隐私的侵犯,实现在高速网络链路下高速度、高精度的流量分类。
-
公开(公告)号:CN103971700A
公开(公告)日:2014-08-06
申请号:CN201310332075.5
申请日:2013-08-01
Applicant: 哈尔滨理工大学
Abstract: 本发明提供一种语音监控方法及装置,涉及语音信号处理技术领域。该方法包括:S1、获取电话的语音数据,提取语音数据的语音特征;S2、进行说话人跳变检测,将语音特征按两个说话人进行分离,得到两类分离的语音特征;S3、对于分离的每一类语音特征,判断是否存在与之匹配的诈骗分子的说话人模型,如为是,则判定存在诈骗份子;如为否,则执行步骤S4;S4、检测所述分离的语音特征中是否存在预先设置的诈骗行为相关的关键词,如果存在至少一个关键词,则判定存在诈骗行为,训练该诈骗分子的说话人模型,并保存该诈骗分子的说话人模型;否则,判定不存在诈骗行为。本发明实现电话环境下对诈骗分子自动进行监控,节约了公安系统的打击电信诈骗的成本。
-
-
-
-
-
-