由钓鱼网页查找目标网页的方法

    公开(公告)号:CN102629261B

    公开(公告)日:2014-07-16

    申请号:CN201210051171.8

    申请日:2012-03-01

    Abstract: 本发明是一种由钓鱼网页查找目标网页的方法,首先从网页文本和网页图片中提取关键词,组成该钓鱼网页的词汇签名,然后在多个搜索引擎上用词汇签名进行检索,综合这些搜索引擎的结果,找出最相近的前K个网页,将这K个网页和钓鱼网页以图片形式保存,提取图像感知哈希序列,最后分别计算这K个网页图片与钓鱼网页图片之间的海明距离,根据距离的大小可以选出该钓鱼网页模仿的一个或者多个合法网页,即目标网页。

    远程打印电子商务平台订单配送服务的实现方法

    公开(公告)号:CN102999847A

    公开(公告)日:2013-03-27

    申请号:CN201210560619.9

    申请日:2012-12-21

    Abstract: 本发明是一种远程打印电子商务平台订单配送服务的实现方法,实现远程打印电子商务平台订单的配送服务,同时保证打印用户可以随时查看订单的配送位置信息情况,远程打印电子商务平台主要利用了电子地图技术,显示订单位置和配送终端位置信息,并通过计算配送终端位置与订单配送位置之间的距离,利用由近及远的距离信息规则,生成配送终端信息队列,从而在该队列中,根据配送终端当前的工作量状态是否超支,选择合适的配送终端来完成订单的配送服务,最终,利用订单验证码验证技术,交付订单,同时,打印平台立即自动修改订单配送服务状态,保存订单的更新信息于数据库中,提高了配送效率,节省了打印用户的时间、精力和费用,满足了实际打印市场需求。

    远程打印电子商务平台时间估算方法

    公开(公告)号:CN102663523A

    公开(公告)日:2012-09-12

    申请号:CN201210129213.5

    申请日:2012-04-28

    Abstract: 为了节约打印时间,以按时提交打印材料,打印用户需要明确打印服务提供者的任务完成时间。本发明的目的在于估算出打印任务完成的时间,使打印用户可以寻找合适的打印服务提供者为其提供各类打印相关服务。利用打印平台对每项服务的估算时间以及服务之间的依赖关系,来估算订单完成所需要的时间,进而估算打印服务提供者完成当前所有订单所需要的时间,从而为打印用户从时间角度选出合适的打印服务提供者家,满足了实际打印市场需求。

    基于半监督的垃圾图片过滤方法

    公开(公告)号:CN102663435A

    公开(公告)日:2012-09-12

    申请号:CN201210129234.7

    申请日:2012-04-28

    Abstract: 基于半监督的垃圾图片过滤技术研究对图像型垃圾邮件进行检测判定工作时,先提取文本和图片特征进行特征处理,利用已经得到的分类模型进行检测分类,并不断加入新的标签样本,训练分类器,提高分类精度同时误判率将大大降低。经大量实验数据检验证明,该方法构建了一种高效率垃圾邮件网页过滤系统,在保证高准确率的同时,处理效率有很大的提高,并显著减小网页检测时间。

    基于改进的支持向量机的软件缺陷优先级预测方法

    公开(公告)号:CN102637143A

    公开(公告)日:2012-08-15

    申请号:CN201210057888.3

    申请日:2012-03-07

    Abstract: 基于改进的支持向量机的软件缺陷优先级预测方法主要采用一种改进的支持向量机模型为缺陷优先级的预测建模,对缺陷报告的处理优先级进行判断和预测,步骤1)选取状态为已解决的,已关闭的,已确定的错误报告做为训练数据;步骤2)提取出我们需要的特征;步骤3)对所有样本赋以一个抽样权重在此样本上用支持向量机训练一个分类器对样本分类,步骤4)用得到的错误率去更新分布权值向量:对错误分类的样本分配更大的权值,正确分类的样本赋予更小的权值。步骤5)就这样依次迭代,最后我们得到的强分类器就是多个弱分类器的加权和。本发明用机器学习的发法训练出分类器,从而使缺陷优先级的确定自动化,减少人员和成本的消耗。

    一种基于场景的社交网络位置兴趣点推荐方法

    公开(公告)号:CN102594905A

    公开(公告)日:2012-07-18

    申请号:CN201210057711.3

    申请日:2012-03-07

    Abstract: 本发明提供了一种基于场景的社交网络位置兴趣点推荐方法。该方法主要借助用户的社交网络关系,好友的位置兴趣点历史,给用户进行个性化的位置兴趣点推荐。位置兴趣点可以是某个餐馆,某个休闲场所,某家商场,这些位置既有地理意义上的描述如经纬度,也有文字性上的描述如西餐店。该方法提供了一种个性化推荐方法,使得针对用户的位置推荐更合理,更有意义,同时推荐的结果也更易为用户接受,给日常出行,移动生活提供了方便。

    一种基于空间布局的钓鱼网页检测及其实现方法

    公开(公告)号:CN101894134A

    公开(公告)日:2010-11-24

    申请号:CN201010204724.X

    申请日:2010-06-21

    Abstract: 一种基于空间布局的钓鱼网页检测方法涉及了一种基于页面视觉布局特征结合空间数据库的设计方案,主要解决了基于网页视觉相似性角度进行快速钓鱼网页检测的问题,系统由5个模块组成,其中最上层是用户界面模块,主要负责获取用户输入并将结果反馈回用户,中间是控制模块,负责调度所有功能模块完成钓鱼网站检测。最核心的是3个功能模块,即:布局特征抽取模块、空间数据库模块、机器学习匹配模块。经大量实验数据检验证明,该方法构建了一种高速高精度钓鱼网页检测系统,在保证高准确率的同时,处理数据容量上有了重大提升,并显著减小网页检测时间。

    基于匈牙利匹配算法的钓鱼网页检测方法

    公开(公告)号:CN101826105A

    公开(公告)日:2010-09-08

    申请号:CN201010139929.4

    申请日:2010-04-02

    Abstract: 基于匈牙利匹配的钓鱼网页检测方法首先提取渲染后网页的文本特征签名、图像特征签名以及网页整体特征签名,比较全面地刻画了网页访问后的特征;然后通过匈牙利算法计算二分图的最佳匹配来寻找不同网页签名之间匹配的特征对,在此基础上能够更加客观地度量网页之间的相似性,从而提高钓鱼网页的检测效果。在方法中还利用曲线下面积值来确定文本特征、图像特征以及全局图像特征的内部权重;利用对数回归分析法确定了网页相似性计算中的文本相似性、图像相似性和全局图像相似性之间的相对权重。本发明提出的基于匈牙利匹配的钓鱼网页检测方法,在精度、召回率上都有了很大提高。

    一种适用于代码仓库中的针对查询相关代码的commit查询方法

    公开(公告)号:CN116360843A

    公开(公告)日:2023-06-30

    申请号:CN202310290279.0

    申请日:2023-03-23

    Abstract: 本发明涉及计算机技术领域,公开一种适用于代码仓库中的针对查询相关代码的commit查询方法,对初始版本的代码仓库进行遍历,将所有代码文件写入增量索引中并记录最新一次提交的commitID,当代码仓库版本更新时,获取版本更新后最新一次的提交的commitID,将其记录与此次提交之前记录的commitID提交进行比较,得到出现新增、删除和修改的代码文件,并更新到增量索引中。最后通过增量索引,完成对代码仓库的搜索、查询和管理。利用增量索引完成对代码仓库版本更新时新增、删除或修改的代码文件的记录和管理,能够有效地针对代码仓库的版本更新相关问题,更好地完成版本更新中出现修改的代码文件的标记和查询任务,对版本更新中不同版本的代码仓库中的代码文件进行管理。

    一种基于文本匹配的重复冲突方案检测方法

    公开(公告)号:CN114692595A

    公开(公告)日:2022-07-01

    申请号:CN202210606284.3

    申请日:2022-05-31

    Abstract: 本发明一种基于文本匹配的重复冲突方案检测方法,对于具有大量历史合并代码的数据库,从一个代码仓库向另一个代码仓库迁移,或一个代码库存在相似更新的现实场景,利用大量已经解决好合并问题的代码仓库信息,抽取出相关的合并解决方案。其次,对于获取到历史合并冲突的解决方案将其存储到数据库。然后,我们遇到现有冲突的时候,利用保存的冲突解决方案来进行合并方案的推荐。最后,基于历史信息解决的冲突,将其在数据库中的是更新时间进行更新,表明解决好的冲突使用频度。冲突是开发人员手动解决的话,将解决方案保存到数据库中。

Patent Agency Ranking