- 专利标题: 一种基于语义相似度的中文众包测试报告聚类方法
-
申请号: CN202110112286.2申请日: 2021-01-27
-
公开(公告)号: CN112966708B公开(公告)日: 2024-05-28
- 发明人: 黄松 , 陈浩 , 史涯晴 , 郑长友 , 王梅娟 , 吴开舜 , 刘语婵 , 骆润
- 申请人: 中国人民解放军陆军工程大学
- 申请人地址: 江苏省南京市秦淮区后标营88号
- 专利权人: 中国人民解放军陆军工程大学
- 当前专利权人: 中国人民解放军陆军工程大学
- 当前专利权人地址: 江苏省南京市秦淮区后标营88号
- 代理机构: 南京纵横知识产权代理有限公司
- 代理商 侯成兵
- 主分类号: G06F18/23213
- IPC分类号: G06F18/23213 ; G06F11/36 ; G06F40/30
摘要:
本发明公开了一种基于语义相似度的中文众包测试报告聚类方法,包括:输入中文测试报告集,剔除无效测试报告,并将有效测试报告进行分句处理,得到测试报告句子对数据集;构建测试报告句子对训练集对语义相似度模型进行训练,得到语义相似度计算模型;将测试报告句子对数据集输入至语义相似度计算模型中进行语义相似度计算,得到测试报告相似度矩阵;设置测试项目预期的bug数量,根据测试报告相似度矩阵进行谱聚类,得到测试报告类簇;根据测试报告类簇对测试报告相似度矩阵进行分解,得到每个类簇的测试报告相似度矩阵,计算每类簇中累计相似度得分Top‑5的测试报告作为最终输出结果。提高了众包测试平台测试报告审查自动化流程,有效提升了测试报告审查效率。
公开/授权文献
- CN112966708A 一种基于语义相似度的中文众包测试报告聚类方法 公开/授权日:2021-06-15