基于Spark分布式的并行二进制飞蛾扑火算法的特征选择方法

    公开(公告)号:CN109871934A

    公开(公告)日:2019-06-11

    申请号:CN201910040185.1

    申请日:2019-01-16

    Abstract: 本发明公开了一种基于Spark分布式的并行二进制飞蛾扑火算法的特征选择方法,首先读取原始数据集D,存储在HDFS中;然后初始化RDD数据集和飞蛾种群M,将RDD作map转换处理;根据M计算出适应度值OM;更新火焰的数量,求出飞蛾与其对应火焰的距离;在Spark分布式平台上根据公式更新飞蛾位置,然后根据螺旋公式计算出新的适应度值OM,并找出最好的值和飞蛾比较,若优于则代替;最后判断,若满足终止条件则找出最好的飞蛾的位置,否则回到步骤4。本发明使用二进制飞蛾扑火算法的特征选择,应用Spark分布式平台上对其进行优化,提高分类性能和运行效率。

    一种基于多粒子群协同演化的人车混合疏散仿真优化方法

    公开(公告)号:CN106022510B

    公开(公告)日:2019-04-05

    申请号:CN201610306666.9

    申请日:2016-05-11

    Abstract: 本发明提供了一种基于多粒子群协同演化的人车混合疏散仿真优化方法,主要通过粒子群优化算法解决大型建筑物和路网集成环境中的人车混合疏散问题,利用粒子的运动过程模拟疏散个体,包括人员、车辆的混合疏散过程,并且采用基于信息素的多粒子群通信机制模拟人员和车辆之间的交互和信息共享,克服了粒子群算法只考虑了粒子之间的交互而忽略了环境对粒子运动过程的影响等不足,能够更好地模拟人车混合疏散过程中不同交通对象的竞争和协作,形成满足多个目标需求的疏散优化方案,提供合理高效的决策依据。

    一种数据特征的选择方法及系统

    公开(公告)号:CN108288074A

    公开(公告)日:2018-07-17

    申请号:CN201810092412.0

    申请日:2018-01-31

    CPC classification number: G06K9/6229

    Abstract: 本发明公开了一种数据特征的选择方法及系统,数据特征的选择方法包括:首先获取数据集,数据集包括若干个数据,数据包括若干个数据特征;对各数据特征进行0-1标准化处理;设置阈值;获取飞蛾种群,飞蛾种群包括若干飞蛾个体,飞蛾个体包括若干飞蛾特征;筛选飞蛾特征;根据筛选出的飞蛾特征选择数据特征;通过分类器计算选择出的数据特征的正确率;计算获取飞蛾种群的次数,判断获取飞蛾种群的次数是否小于所述阈值,若是,更新飞蛾种群,然后返回步骤“筛选飞蛾特征”;否则,输出所述选择出的数据特征的正确率最高的数据特征。本发明提出的数据特征的选择方法及系统大大提高了数据特征选择的精确度,缩短了获取数据特征的时间。

    一种垃圾邮件识别方法及系统

    公开(公告)号:CN108199953A

    公开(公告)日:2018-06-22

    申请号:CN201810092360.7

    申请日:2018-01-31

    Abstract: 本发明公开一种垃圾邮件识别方法及系统。该方法包括:获取邮件数据集;提取所述邮件数据集中邮件的特征;确定所述特征为烟花,利用训练的烟花算法寻优得到全局最优权值;将所述全局最优权值作为加权朴素贝叶斯算法的权值,利用所述加权朴素贝叶斯算法确定垃圾邮件。本发明提供的垃圾邮件识别方法及系统,可以提高垃圾邮件的识别准确度。

    一种基于频繁项集增长算法的电影推荐方法及系统

    公开(公告)号:CN108182294A

    公开(公告)日:2018-06-19

    申请号:CN201810092694.4

    申请日:2018-01-31

    Abstract: 本发明公开了一种基于频繁项集增长算法的电影推荐方法及系统。该方法包括:统计数据库中每个电影ID出现的次数,所述数据库包括用户ID和电影ID,所述电影ID出现的次数表示为支持度;将所述电影ID的支持度进行排序,得到最小支持度;提取支持度大于所述最小支持度的电影ID及对应的支持度,得到频繁一项集列表;将所述频繁一项集列表进行分组,得到多个频繁一项集组;根据所述频繁一项集组构建频繁模式树;通过粒子群算法对所述频繁模式树进行剪枝,得到条件子树,所述条件子树表示所述电影ID之间的关联关系;根据所述关联关系向用户推荐电影。本方法和系统能够快速的挖掘电影之间的关联关系,从而提高电影推荐的效率。

    一种对等网络应用流量优化方法

    公开(公告)号:CN103179199A

    公开(公告)日:2013-06-26

    申请号:CN201310072485.0

    申请日:2013-03-06

    Abstract: 本发明公开了一种对等网络应用流量优化方法,涉及计算机对等网络的应用,主要用于开放的网络环境中。本发明中对等网络服务提供商为对等网络用户提供较好的索引和内容服务,对等网络用户根据用户体验向对等网络服务提供商付费;对等网络服务提供商根据互联网服务提供商提供的缓存服务质量将对等网络用户的付费支付一部分给互联网服务提供商。这样通过网络经济思想的引入,促进对等网络服务提供商、互联网服务提供商、对等网络用户之间共同合作,实现整体上的对等网络应用流量优化。本发明的优点是在于动态地、整体地分析对等网络应用流量优化中对等网络服务提供商、互联网服务提供商、对等网络用户之间的博弈关系、提出一种对等网络流量优化方法,在优化对等网络网络流量的同时,保证对等网络用户的服务质量,兼顾对等网络服务提供商和互联网服务提供商的利益分配,实现三者共赢。

    一种基于改进CSP网络的行人检测方法

    公开(公告)号:CN115035550B

    公开(公告)日:2024-08-13

    申请号:CN202210678342.3

    申请日:2022-06-13

    Abstract: 本发明针对中心和尺度预测的(Central and Scale Prediction,CSP)行人检测模型在复杂场景下出现漏检或者误检的问题,提出了一种基于改进的CSP网络的行人检测方法,首先将原主干网络Resnet50替换为Resnet101,使得网络能够更好的提取被其它物体遮挡的特征。其次引入了基于通道和压缩注意力机制的方法,以获得更高的训练速度和检测速度。最后利用非极大值抑制算法形成最优先验候选框数量以及难样本的再训练。经实验表明该算法在cityperson数据集上,严重遮挡和部分遮挡的指标比当前的行人检测算法的性能有所提高,在公共数据集上取得了较好的鲁棒性。

    生物医学数据特征选择方法及装置、计算设备及存储介质

    公开(公告)号:CN112908416B

    公开(公告)日:2024-02-02

    申请号:CN202110393715.8

    申请日:2021-04-13

    Abstract: 本发明提供了一种生物医学数据特征选择方法,包括:提取生物医学数据集中的特征构成原始特征集合;根据所述原始特征集合,对种群进行初始化得到初始种群,并设置生物医学数据特征选择所需的参数;将初始种群中的个体映射为相应的特征组合,通过适应度函数计算种群中个体的适应度值;利用轮盘赌选择对所述初始种群进行三系种群的划分,分别随机从不育系和保持系中选择个体作为父本和母本进行杂交操作;随机选择恢复系中的个体进行自交操作;当达到最大自交次数时,对恢复系个体进行重置操作,在搜索空间中随机选择一组基因序列替换原始个体,并将自交次数归0;判断是否满足终止条件,输出全局最优的个体。(56)对比文件杨娟“.基于杂交水稻算法的分类器权重优化研究”《.中国优秀硕士学位论文全文数据库》.2019,(第第9期期),全文.

Patent Agency Ranking