-
公开(公告)号:CN111273911A
公开(公告)日:2020-06-12
申请号:CN202010036852.1
申请日:2020-01-14
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于双向LSTM和注意力机制的软件技术债务识别方法。该方法基于双向LSTM来实现技术债务的识别,利用注意力机制捕捉不同特征的重要性以提高模型的准确率。另外,该方法使用平衡交叉熵损失函数解决样本不均衡问题。通过本发明方法能够高效识别软件技术债务,降低软件维护的成本,对软件维护具有非常重要的意义。
-
公开(公告)号:CN117390469A
公开(公告)日:2024-01-12
申请号:CN202311359734.4
申请日:2023-10-20
Applicant: 杭州电子科技大学
Abstract: 本发明提出了一种基于业务主题聚类的微服务架构粒度异味检测方法,该方法利用源代码分析工具从微服务系统代码中分析出抽象语法树、函数调用图、TOKEN数据流图;对函数的抽象语法树的TOKEN根据其语义结构赋予不同权重并获取候选业务主题CBT,对TOKEN数据流进行抽象后获取TOKEN(即不带权的CBT)的数据关联关系CBTR,结合CBT与CBTR进行函数业务主题挖掘,以接口为单位聚合其调用函数的业务主题,通过共现矩阵聚类方式形成业务主题聚类。最终通过构建接口的业务主题聚类之间的相关度矩阵,结合谱聚类与轮廓系数划分业务功能团,以此检测和评估微服务内存在的粒度异味与微服务架构存在的粒度异味。
-
公开(公告)号:CN115994330A
公开(公告)日:2023-04-21
申请号:CN202211470595.8
申请日:2022-11-23
Applicant: 杭州电子科技大学
IPC: G06F18/2415 , G06F18/214 , G06F18/22 , G06N20/00 , G06N5/01
Abstract: 本发明公开了一种基于多源信息的技术债务严重程度识别方法。方法首先将代码转换成抽象语法树(AST),并利用AST中不同语义路径的加权融合来表示其语义化信息;然后通过抽取方法中包含的不同指标来表示方法的结构化信息;最后基于XGBoost(eXtreme Gradient Boosting)构建分类模型识别方法存在严重技术债务的概率。同时,本发明使用了数据增强方法,能有效增加样本集多样性,提升模型性能。通过本发明方法,能有效缓解单一类型信息造成的偏差,更精确地识别技术债务的严重程度。
-
公开(公告)号:CN115757141A
公开(公告)日:2023-03-07
申请号:CN202211453486.5
申请日:2022-11-21
Applicant: 杭州电子科技大学
IPC: G06F11/36 , G06F40/289 , G06F40/242 , G06F40/253 , G06F16/901 , G06N3/0464
Abstract: 本发明公开了一种基于异构图表示学习的软件缺陷自动定位方法。该方法首先从项目中获取所需数据,通过将各类数据抽象成不同类型的顶点和边,构造出一张异构图;然后通过三个模块将异构图中的信息进行聚合,获得源程序中各方法的特征表示;最后基于卷积神经网络(Convolutional Neural Networks,CNN)构建预测模型计算各方法存在缺陷的概率,获得缺陷定位结果。同时,本发明引入了重采样策略,有效克服了问题中存在的类不平衡问题。通过本发明方法,能够有效提升特征学习的有效性和缺陷定位的准确性,对降低软件开发和维护成本有着非常重要的现实意义。
-
公开(公告)号:CN114330314A
公开(公告)日:2022-04-12
申请号:CN202111593675.8
申请日:2021-12-22
Applicant: 杭州电子科技大学
IPC: G06F40/258 , G06F40/289 , G06K9/62
Abstract: 本发明涉及一种基于多示例学习的工业互联网专利识别方法,利用自然语言处理技术,将专利中的摘要信息切分成句子,并利用基于句子关系图的文本主题句抽取算法来抽取摘要中的主题句,可以有效减少计算开销。同时通过结合标题和摘要中抽取的主题句,将专利转换为为句子包,其中每个专利看作包,包中的每个句子看作示例。最后,通过采用K近邻算法(K Nearest Neighbors,KNN)来预测新样本的类别。通过本发明方法能有效提高工业互联网专利识别效果,极大地减少人工审查代价,对专利检索有着非常重要的意义。
-
公开(公告)号:CN114154730A
公开(公告)日:2022-03-08
申请号:CN202111491975.5
申请日:2021-12-08
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于多层迭代的软件维护规模预测方法,首先进行数据获取:获取一个现有公开软件系统中所有可用的类,记为训练数据集,然后度量因子选择:获取训练数据集中的各类的原始度量值;采样度量归一化处理训练数据集,再进行训练数据采样:将归一化后的训练数据集分为验证集和训练集;之后构建并训练多层迭代的预测模型:最后通过训练好的多层迭代的预测模型完成软件维护规模的预测。本发明通过设计多层迭代模型不断排除预测效果不好的中间层模型,最终获得比较精确的软件维护规模的预测模型。使用本发明提出的方法预测软件维护规模,最终得到了较好结果,能够准确地预测软件的维护规模。
-
公开(公告)号:CN113780366A
公开(公告)日:2021-12-10
申请号:CN202110955974.5
申请日:2021-08-19
Applicant: 杭州电子科技大学
IPC: G06K9/62 , G06F11/36 , G06F40/30 , G06F40/289 , G06F40/216 , G06F40/247
Abstract: 本发明公开了一种基于AP近邻传播算法的众包测试报告聚类方法。本发明首先利用自然语言处理技术抽取关键词,并利用同义词林将相同或相近的词替换为同一个词,有效解决不同词语引起的语义偏差问题。然后采用非对称相似度策略计算测试报告之间的相似度,该策略能有效克服测试报告长度差异较大情况下相似度计算不准确问题。最后,利用AP近邻传播聚类算法对测试报告进行聚类。通过本发明方法能提高众包测试报告聚类效果,开发者仅需要从每个簇中选择一个测试报告进行审查,极大地降低了开发者审查时间,对软件维护具有非常重要的意义。
-
公开(公告)号:CN117729130A
公开(公告)日:2024-03-19
申请号:CN202311785298.7
申请日:2023-12-22
Applicant: 杭州电子科技大学
IPC: H04L43/0805 , H04L43/045 , H04L41/0803
Abstract: 本发明公开了一种基于规则驱动的云原生架构挖掘与异味检测方法,包括如下步骤:S1、从静态和动态两方面出发,获取目标云原生系统源代码及其运行时的调用链数据;S2、构建服务调用图;S3、提出完整的云原生架构元模型定义,基于此定义挖掘系统云原生架构,并对架构进行可视化;S4、利用定义的异味检测规则,对四种典型的云原生架构异味,即共享数据库、无API网关、手动配置、以及不稳定的交互进行架构异味检测;S5、结合目标云原生系统和专家意见对系统进行架构重构,消除云原生架构异味。该方法可以对云原生系统的架构进行结构化的分析和展示,对架构中各节点的重要程度进行评估,并显著提高典型的云原生架构异味的检测准确率。
-
公开(公告)号:CN117573829A
公开(公告)日:2024-02-20
申请号:CN202311585057.8
申请日:2023-11-24
Applicant: 杭州电子科技大学
IPC: G06F16/332 , G06F16/35 , G06F16/31 , G06N5/02 , G06N3/045 , G06F18/214 , G06F18/241 , G06F18/23213
Abstract: 本发明公开了一种基于注意力机制的领域大模型知识库分类和构建方法,包括如下步骤:S1、获取待分类的文档,并进行文档加载和切割;S2、使用与文档垂直领域的数据集训练attention机制;S3、应用完成训练的层次化attention机制的领域小模型在词的角度对切割后的文档进行聚类;S4、完成了句子中单词的聚类后,再次使用层次化attention机制的领域小模型对句子的权重矩阵αit再次聚类,获得句子整篇文章中的权重;S5、分类完成后,若输入的文本是构建任务,则继续执行构建知识库的流程;如果输入的文本是查询任务,则执行查询向量知识库的流程。本方法大幅度提升知识库检索的正确性,以提升大语言模型生成答案的正确率。
-
公开(公告)号:CN113780366B
公开(公告)日:2024-02-13
申请号:CN202110955974.5
申请日:2021-08-19
Applicant: 杭州电子科技大学
IPC: G06F18/23 , G06F18/2413 , G06F11/36 , G06F40/30 , G06F40/289 , G06F40/216 , G06F40/247
Abstract: 本发明公开了一种基于AP近邻传播算法的众包测试报告聚类方法。本发明首先利用自然语言处理技术抽取关键词,并利用同义词林将相同或相近的词替换为同一个词,有效解决不同词语引起的语义偏差问题。然后采用非对称相似度策略计算测试报告之间的相似度,该策略能有效克服测试报告长度差异较大情况下相似度计算不准确问题。最后,利用AP近邻传播聚类算法对测试报告进行聚类。通过本发明方法能提高众包测试报告聚类效果,开发者仅需要从每个簇中选择一个测试报告进行审查,极大地降低了开发者审查时间,对软件维护具有非常重要的意义。
-
-
-
-
-
-
-
-
-