一种基于空间布局的钓鱼网页检测及其实现方法

    公开(公告)号:CN101894134B

    公开(公告)日:2012-04-11

    申请号:CN201010204724.X

    申请日:2010-06-21

    Abstract: 一种基于空间布局的钓鱼网页检测方法涉及了一种基于页面视觉布局特征结合空间数据库的设计方案,主要解决了基于网页视觉相似性角度进行快速钓鱼网页检测的问题,系统由5个模块组成,其中最上层是用户界面模块,主要负责获取用户输入并将结果反馈回用户,中间是控制模块,负责调度所有功能模块完成钓鱼网站检测。最核心的是3个功能模块,即:布局特征抽取模块、空间数据库模块、机器学习匹配模块。经大量实验数据检验证明,该方法构建了一种高速高精度钓鱼网页检测系统,在保证高准确率的同时,处理数据容量上有了重大提升,并显著减小网页检测时间。

    基于动态贝叶斯模型的网页垃圾检测方法

    公开(公告)号:CN102243659A

    公开(公告)日:2011-11-16

    申请号:CN201110200276.0

    申请日:2011-07-18

    Abstract: 基于动态贝叶斯模型的网页垃圾检测方法涉及一种作弊网页检测的方法,主要采用一种改进的动态贝叶斯网络模型为用户点击行为建模,对作弊网页进行判断和识别,搜索引擎查询日志记录了用户与搜索引擎的交互信息。它的内容包括查询词、搜索引擎返回的网址、用户点击的网址以及时间戳等信息。日志中被点击的网址及其点击顺序等信息反映了用户的喜好。本发明为日志点击行为建模,挖掘搜索引擎返回列表序列中网址之间的点击因果关系,从用户的角度说明了哪些网址是用户认为和查询词相关联的,得到从用户角度出发的网页与查询的相关性,它是一种隐含的回馈,从而使作弊网页的排名位置靠后,而相关网页的排名则靠前了。

    利用改进的高斯混合模型分类器检测图像垃圾邮件的方法

    公开(公告)号:CN102129568A

    公开(公告)日:2011-07-20

    申请号:CN201110112414.X

    申请日:2011-04-29

    Abstract: 利用改进的高斯混合模型分类器检测垃圾邮件的方法,利用健壮特征的加速提取算法来提取图片中垃圾信息的不变区域特征,对不变区域特征进行高斯混合模型拟合,使用期望最大化方法来进行权重、均值以及协方差矩阵的评估,具体为:对待检测数据集的图片进行标签,分为垃圾图片与正常图片;采用健壮特征的加速提取算法提取所有数据集的局部不变特征的向量;采用高斯混合模型对局部不变特征进行密度函数拟合,得到所有图片的均值与协方差矩阵;改进均值聚类算法,使其适用于对上一步骤中得出的特殊特征向量进行聚类,使用交叉熵作为分布之间相似度的衡量指标,实现基于高斯混合模型的均值聚类算法;利用基于高斯混合模型的均值聚类算法来构建分类器。

    基于陆地移动距离的相似度检测图像型垃圾邮件的方法

    公开(公告)号:CN102103700A

    公开(公告)日:2011-06-22

    申请号:CN201110020901.3

    申请日:2011-01-18

    Abstract: 基于陆地移动距离的相似度检测图像型垃圾邮件的方法,利用了尺度不变特征转换算法来提取图片中垃圾信息的不变区域特征,使用陆地移动距离计算待测图片与垃圾邮件特征库中图片的相似度,从而检测出图像型垃圾邮件。本发明提供了一种使用图片的局部不变特征的基于陆地移动距离的相似度检测图像型垃圾邮件的方法。目前现有的利用相似度检测图像型垃圾邮件技术主要是使用欧式距离,而欧式距离无法处理结构大小可变的特征,需要先对特征进行聚类规范化特征,因此影响了检测速度。本发明利用陆地移动距离直接处理结构大小可变的局部不变特征,大大提高了图像型垃圾邮件的检测速度,同时保证了高精确度和低误判率。

    利用图片文字与局部不变特征检测图像垃圾邮件的方法

    公开(公告)号:CN101887523A

    公开(公告)日:2010-11-17

    申请号:CN201010204722.0

    申请日:2010-06-21

    Abstract: 利用图片的局部不变特征检测图像型垃圾邮件的方法,利用了尺度不变特征转换算法来提取图片中垃圾信息的不变区域特征,提取嵌入图片中文字来对图片进行分类,从而形成图片的两种特征结合的特征向量库。经过实验能够提高垃圾邮件的召回率,节省程序运算时间和空间。用这种方法来提取图片中的不变区域特征,从而生成图片的特征向量,使用支持向量机分类器来训练与测试。本发明提出的利用嵌入图片中的文本信息,使用图形文字识别技术挖掘出图片中的文本字符串,将字符串作为图片的特征,使用贝叶斯分类器来训练与测试。每张图片的特征向量是由图片的局部不变特征与文本字符串构成的,使用堆栈方法综合两种分类器进行分类,来检测图像型垃圾邮件的实现方法。

    一种基于相似性的半监督学习垃圾网页检测方法

    公开(公告)号:CN101814093A

    公开(公告)日:2010-08-25

    申请号:CN201010139921.8

    申请日:2010-04-02

    Abstract: 本发明的目的是设计基于相似性的半监督学习垃圾网页检测方法,解决利用网页链接关系进行半监督学习出现的问题。该方法根据网页间的相似性建立一个隐含的“链接”关系图。步骤1:从网页中提取基于内容和链接的特征步骤2)对步骤1)所提取的特征用主成分分析方法进行特征提取;步骤3)根据网页间的相似性建立隐含的“链接”关系图;步骤4)在“链接”关系图上建立高斯随机域模型,利用调和函数进行半监督学习,步骤5)将步骤4)的模型与其它分类器的分类结果结合,提高分类效果,在关系图中,网页间的链接根据相似性赋予权重,然后建立高斯随机域模型,使用调和函数进行半监督学习,提高了半监督学习的能力。

    一种基于多模态融合和动态加权损失的短临降水预测方法

    公开(公告)号:CN119398268A

    公开(公告)日:2025-02-07

    申请号:CN202411534770.4

    申请日:2024-10-31

    Abstract: 本发明公开了一种基于多模态融合和动态加权损失的短临降水预测方法。包括以下步骤:首先输入历史雷达和地面站点数据,进行归一化和降采样处理;接着将雷达和地面站点气象要素数据分别输入三层包含上采样和RNN的网络中进行特征编码;然后输入三层包含融合、上采样和RNN的网络进行特征融合与解码。最后在动态加权损失的约束下输出准确的降水预测。该方法实现了对雷达和地面站点气象要素数据的编码、融合和解码。在基于注意力机制的融合网络和动态加权损失的加持下,提高了短临降水预测的准确率,在强降水预测的性能提升更加显著。

    一种基于有向图的代码仓库代码块级别冲突排序分组方法

    公开(公告)号:CN115098109B

    公开(公告)日:2024-11-22

    申请号:CN202210726119.1

    申请日:2022-06-24

    Abstract: 一种基于有向图的代码仓库代码块级别冲突排序分组方法,首先提取出发生冲突的文件列表、冲突文件内部的方法名称以及冲突代码片段的信息进行保存;然后对不同分支上的冲突文件内部的所有方法构造出依赖关系图;其次对比依赖关系图中的节点,将不同分支上构造出的依赖关系图进行合并;接着遍历依赖关系图,将节点携带的文件全路径名、方法名称、方法开始和结束的行号与保存对比,将符合条件的冲突文件全路径名、方法名称按照节点序号从大到小进行保存;最后将处在同一个依赖关系图中的冲突方法分入到同一分组。本方法能够有效地针对当前代码仓库存在的代码块级别进行排序,同时对代码块级别的冲突进行有效的分组从而帮助开发人员有序的解决冲突。

    一种基于跨通道融合的多模态蛋白质-配体结合亲和力预测方法

    公开(公告)号:CN117912545A

    公开(公告)日:2024-04-19

    申请号:CN202410010427.3

    申请日:2024-01-04

    Abstract: 本发明公开了一种基于跨通道融合的多模态蛋白质‑配体结合亲和力预测方法,旨在提高蛋白质‑配体结合亲和力的预测性能。具体包括:构建蛋白质‑配体复合物结构和亲和力标签;数据预处理,提取残基序列,构建蛋白质口袋残基图、配体分子图和口袋残基‑配体原子相互作用图;生成相应的输入特征,并进行特征提取;融合所有模块的输出生成复合体的向量表示;通过全连接层来预测结合亲和力。值得注意,本发明通过GNN和Transformer的联合框架表征蛋白质口袋和配体分子,解决了GNN的消息传递局部性限制,为节点提供了全局视野。此外,通过残基序列的全局表示与口袋、配体间交互的建模,赋予模型捕获长程相互作用的能力。

Patent Agency Ranking