结合软件制品过程信息和文本相似度的制品自动追踪方法

    公开(公告)号:CN111460401B

    公开(公告)日:2023-08-22

    申请号:CN202010431048.3

    申请日:2020-05-20

    Applicant: 南京大学

    Abstract: 本发明属于计算机技术领域,具体涉及一种结合软件制品过程信息和文本相似度的制品自动追踪方法,包括:选择制品,挖掘待关联制品间的追踪关系,划分显隐式追踪关系;抽取待关联制品的过程信息;计算待关联制品间的文本相似度;为显式追踪关系的制品选定过程特征及关系结果标签;隐式追踪关系的制品间的追踪关系人工打标签,并借助中间制品增加相关特征;预处理数据,获取样本集,选择机器学习分类算法,训练模型,预测制品间是否存在追踪关系。本发明从过程数据出发,解决了信息检索方法受限于文本质量以及词汇失配的问题,且可以追踪多种制品间的追踪关系。本发明相较于传统依赖文本相似度的信息检索方法,精确率和召回率均有大幅度提升。

    结合软件制品过程信息和文本相似度的制品自动追踪方法

    公开(公告)号:CN111460401A

    公开(公告)日:2020-07-28

    申请号:CN202010431048.3

    申请日:2020-05-20

    Applicant: 南京大学

    Abstract: 本发明属于计算机技术领域,具体涉及一种结合软件制品过程信息和文本相似度的制品自动追踪方法,包括:选择制品,挖掘待关联制品间的追踪关系,划分显隐式追踪关系;抽取待关联制品的过程信息;计算待关联制品间的文本相似度;为显式追踪关系的制品选定过程特征及关系结果标签;隐式追踪关系的制品间的追踪关系人工打标签,并借助中间制品增加相关特征;预处理数据,获取样本集,选择机器学习分类算法,训练模型,预测制品间是否存在追踪关系。本发明从过程数据出发,解决了信息检索方法受限于文本质量以及词汇失配的问题,且可以追踪多种制品间的追踪关系。本发明相较于传统依赖文本相似度的信息检索方法,精确率和召回率均有大幅度提升。

Patent Agency Ranking