-
公开(公告)号:CN117112271A
公开(公告)日:2023-11-24
申请号:CN202210506390.4
申请日:2022-05-11
Applicant: 南京大学
IPC: G06F11/07 , G06N20/00 , G06F16/903 , G06F16/33 , G06F16/332 , G06N5/01
Abstract: 本发明提供了一种面向软件开发的、基于机器学习模型的StackOverflow问答更新情况的预测方法,包含下列步骤:1)首先使用SOTorrent数据集获取引用了StackOverflow问答的GitHub项目,并通过版本控制软件git中的gitclone命令获取这些项目的源程序代码;2)对项目的源程序代码进行正则表达式匹配,提取被引用的StackOverflow问答的ID;3)利用StackOverflow的API获取这些问答的信息并提取度量;4)根据问答的编辑记录为每个样例打标记,并使用机器学习算法生成预测模型;5)对开发者新引用的StackOverflow问答进行预测,根据预测结果提示开发者关注需要进一步编辑的答案的更新情况。本发明解决了目前软件代码缺乏与StackOverflow问答的共同更新的问题,进而帮助开发者修复缺陷,提高软件的鲁棒性,从而能更好地控制软件产品的质量。