一种基于高阶函数的C++过程间异常分析系统及方法

    公开(公告)号:CN114647575B

    公开(公告)日:2024-05-10

    申请号:CN202210168542.4

    申请日:2022-02-23

    Abstract: 本发明公开了函数式编程和程序分析技术领域的一种基于高阶函数的C++过程间异常分析系统及方法,包括:确定过程调用图中每个被调用子过程的分析顺序,将C++程序中的语句进行分类;收集各个被调用子过程异常相关语句和函数调用语句的集合约束,按照集合约束规则对集合约束进行求解,获取过程内异常分析信息后,通过高阶函数的形式将所有被调用子过程的异常分析结果保存为异常分析函数摘要;按照函数的参数传递方式,根据形参和实参对应参数信息,在过程调用点处,对高阶函数式异常分析函数摘要的参数集合信息进行相应代入。本发明降低了传统方法需要构建过程间异常控制流图对异常进行过程间分析的时空开销,解决了异常分析效率较低的问题。

    一种基于循环不变式的间接跳转目标地址识别方法及装置

    公开(公告)号:CN115129320A

    公开(公告)日:2022-09-30

    申请号:CN202210686923.1

    申请日:2022-06-17

    Abstract: 本发明提供了一种基于循环不变式的间接跳转目标地址识别方法及装置。方法包括:将二进制程序解码成中间表示BRIL;根据BRIL语义和控制流结构计算循环不变式,并将其保存到分析树的结点中;深度优先遍历分析树,将循环不变式不断约简合并,生成约束表达式集;对约束表达式集求解,得到间接跳转目标地址;将目标地址处的语句作为分析入口,目标地址作为初始值,重新进行分析树的构建、约束表达式集的生成和求解,直到间接跳转目标地址不再发生变化(不动点)。本发明相比于传统数据流分析的方法,利用循环不变式来增加对地址数据的分析深度,并能够减少对循环结构的分析次数,从而提高间接跳转目标地址识别的准确度和效率。

    一种基于多特征缺陷再分配图分配缺陷报告的方法

    公开(公告)号:CN102629230B

    公开(公告)日:2015-04-01

    申请号:CN201210057825.8

    申请日:2012-03-07

    Abstract: 基于多特征缺陷再分配图分配缺陷报告的方法综合运用机器学习模型和缺陷再分配图预测缺陷修复人员,用已修复的缺陷报告中开发人员之间的再分配关系,将再分配关系转化为缺陷再分配图,使用机器学习模型预测完缺陷报告开发人员后,结合缺陷再分配图更新缺陷报告开发人员,完成缺陷报告修复人员的预测;具体方法为以下步骤:步骤1)对选取的缺陷报告数据集进行分类,分为训练集和测试集;步骤2)用训练集来训练机器学习模型和创建缺陷再分配图;步骤3)用机器学习模型预测测试集的缺陷修复人员;步骤4)结合缺陷再分配图更新缺陷修复人员;通过使用本发明的方法,能有效地减少缺陷再分配的路径长度,提高缺陷分配的预测精度,降低缺陷修复人员搜索的失败率。

    基于动态贝叶斯模型的网页垃圾检测方法

    公开(公告)号:CN102243659B

    公开(公告)日:2014-07-16

    申请号:CN201110200276.0

    申请日:2011-07-18

    Abstract: 基于动态贝叶斯模型的网页垃圾检测方法涉及一种作弊网页检测的方法,主要采用一种改进的动态贝叶斯网络模型为用户点击行为建模,对作弊网页进行判断和识别,搜索引擎查询日志记录了用户与搜索引擎的交互信息。它的内容包括查询词、搜索引擎返回的网址、用户点击的网址以及时间戳等信息。日志中被点击的网址及其点击顺序等信息反映了用户的喜好。本发明为日志点击行为建模,挖掘搜索引擎返回列表序列中网址之间的点击因果关系,从用户的角度说明了哪些网址是用户认为和查询词相关联的,得到从用户角度出发的网页与查询的相关性,它是一种隐含的回馈,从而使作弊网页的排名位置靠后,而相关网页的排名则靠前了。

    基于最邻近标签传播算法的图像型垃圾邮件检测方法

    公开(公告)号:CN103150574A

    公开(公告)日:2013-06-12

    申请号:CN201310001117.7

    申请日:2013-01-05

    Abstract: 为了提高图像型垃圾邮件检测的精度和召回率,节省检测图像型垃圾邮件的时间,导致需要一个高效率的检测图像型垃圾邮件的方法。本发明的目的是提供一种利用基于最邻近的标签传播算法检测图像型垃圾邮件的方法。通过提取图片的加速鲁棒性特征描述符,确保了图片的旋转和尺度不变性;通过获取图片聚类中心点信息,再按照该信息均值聚类图片加速鲁棒性特征描述符,确保了所有图片聚类后的信息具有可比性;通过利用基于最邻近的标签传播,选择与每个图像相似度最接近的K(K=已知类别的图像数+测试的图像数/10,表示表示选取与图像相似度最相近的图像幅数)个图像的标签进行传播,提高了标签的传播速率,节省了检测图像型垃圾邮件的时间。

    一种基于位置服务采集新浪微博团购信息的方法

    公开(公告)号:CN103117919A

    公开(公告)日:2013-05-22

    申请号:CN201310020773.1

    申请日:2013-01-21

    Abstract: 本发明是一种基于位置服务采集新浪微博团购信息的方法,为了使得商家用户能实时发布团购消息,普通用户也能实时看到不同位置的团购信息,商家用户通过新浪微博平台发布团购信息,首先,利用新浪微博提供的开放位置服务接口,抽取在该位置附近发布的所有的微博数据信息;然后,将抽取出来的微博数据存放在数据库中,针对这些微博数据进行语料模式匹配预处理操作;接着,初步筛选出所有包含团购信息特征的微博数据;其次,使用语义分析技术,确定该条数据是否为团购信息;最后,成功地将团购信息从某一位置发布大量的微博数据中采集出来。

    利用图片文字与局部不变特征检测图像垃圾邮件的方法

    公开(公告)号:CN101887523B

    公开(公告)日:2013-04-10

    申请号:CN201010204722.0

    申请日:2010-06-21

    Abstract: 利用图片的局部不变特征检测图像型垃圾邮件的方法,利用了尺度不变特征转换算法来提取图片中垃圾信息的不变区域特征,提取嵌入图片中文字来对图片进行分类,从而形成图片的两种特征结合的特征向量库。经过实验能够提高垃圾邮件的召回率,节省程序运算时间和空间。用这种方法来提取图片中的不变区域特征,从而生成图片的特征向量,使用支持向量机分类器来训练与测试。本发明提出的利用嵌入图片中的文本信息,使用图形文字识别技术挖掘出图片中的文本字符串,将字符串作为图片的特征,使用贝叶斯分类器来训练与测试。每张图片的特征向量是由图片的局部不变特征与文本字符串构成的,使用堆栈方法综合两种分类器进行分类,来检测图像型垃圾邮件的实现方法。

    利用改进的高斯混合模型分类器检测图像垃圾邮件的方法

    公开(公告)号:CN102129568B

    公开(公告)日:2012-09-05

    申请号:CN201110112414.X

    申请日:2011-04-29

    Abstract: 利用改进的高斯混合模型分类器检测垃圾邮件的方法,利用健壮特征的加速提取算法来提取图片中垃圾信息的不变区域特征,对不变区域特征进行高斯混合模型拟合,使用期望最大化方法来进行权重、均值以及协方差矩阵的评估,具体为:对待检测数据集的图片进行标签,分为垃圾图片与正常图片;采用健壮特征的加速提取算法提取所有数据集的局部不变特征的向量;采用高斯混合模型对局部不变特征进行密度函数拟合,得到所有图片的均值与协方差矩阵;改进均值聚类算法,使其适用于对上一步骤中得出的特殊特征向量进行聚类,使用交叉熵作为分布之间相似度的衡量指标,实现基于高斯混合模型的均值聚类算法;利用基于高斯混合模型的均值聚类算法来构建分类器。

    基于程序切片技术的Web服务平台

    公开(公告)号:CN101873323B

    公开(公告)日:2012-09-05

    申请号:CN201010204709.5

    申请日:2010-06-21

    Abstract: 基于程序切片技术的Web服务平台的设计方法提出了通过服务间的依赖关系进行Web服务平台开发的模型。本发明包括服务识别、服务生成、服务发布、服务发现、服务度量以及服务调用这几个功能模块。以用户上传的遗留系统为输入,对遗留系统进行分析,生成构件依赖图,对遗留系统进行构件抽取,进行服务识别。之后为每个服务代码生成WSDL文档,实现服务生成。分析WSDL文档以及WSBD文档,为服务生成带有依赖关系的tModel文档和UDDI文档,完成服务发布。分析所有tModel文档,生成服务依赖图,并对其切片,进行服务发现和服务度量。最终,Web服务平台为每个服务建立一个代理服务,帮助用户方便快捷的调用Web服务。

    一种基于最近邻及相似度测量检测钓鱼网页的方法

    公开(公告)号:CN102170447A

    公开(公告)日:2011-08-31

    申请号:CN201110112442.1

    申请日:2011-04-29

    Abstract: 一种基于最近邻及相似度测量检测钓鱼网页的方法是以网页整体图像的图片为出发点,提取其尺度不变转化特征:在钓鱼网页检测阶段进行相似特征的快速查询,查询所得相似特征交给机器学习匹配模块进行识别;机器学习匹配模块在系统训练阶段接收特征提取模块传来的特征数据进行训练,优化网页相似性阈值的参数;在钓鱼网页检测阶段,接收特征提取模块传来的特征数据,计算网页之间的相似度,最后根据网页相似性阈值判断钓鱼网页;另外,还加入了一种分类方法——贝叶斯可添加回归树,对可疑网页进行预测;在钓鱼网页检测过程中通过提取特征,以此作为钓鱼网页检测的依据,在保证高准确率的同时,显著减小网页检测时间。

Patent Agency Ranking