基于半监督学习的软件工程知识库的自动化构建实现方法

    公开(公告)号:CN106875014A

    公开(公告)日:2017-06-20

    申请号:CN201710120880.X

    申请日:2017-03-02

    Inventor: 董翔 沈备军 陈凯

    CPC classification number: G06N5/022 G06F17/30289

    Abstract: 一种基于半监督学习的软件工程知识库的自动化构建实现方法,解决软件工程领域知识库现阶段较为匮乏、概念数目难以达到大规模程度、概念间的关系较为稀疏、同时需要投入大量人工精力的问题,本发明通过:一、根据标签传播,采用维基百科和StackOverflow数据源扩充软件工程领域的概念集合;二、构建对软件工程领域概念进行上下位关系抽取的机器学习特征;三、分别采用模版匹配和规则匹配的方法自动化标注关系抽取的正例和反例训练数据;四、根据迭代的半监督的学习方法进行概念间关系的抽取工作,并结合评估规则优化每次迭代的抽取结果;五、采用RDF语言对知识库进行标准化构建得以实现。

    基于半监督学习的软件工程知识库的自动化构建实现方法

    公开(公告)号:CN106875014B

    公开(公告)日:2021-06-15

    申请号:CN201710120880.X

    申请日:2017-03-02

    Inventor: 董翔 沈备军 陈凯

    Abstract: 一种基于半监督学习的软件工程知识库的自动化构建实现方法,解决软件工程领域知识库现阶段较为匮乏、概念数目难以达到大规模程度、概念间的关系较为稀疏、同时需要投入大量人工精力的问题,本发明通过:一、根据标签传播,采用维基百科和StackOverflow数据源扩充软件工程领域的概念集合;二、构建对软件工程领域概念进行上下位关系抽取的机器学习特征;三、分别采用模版匹配和规则匹配的方法自动化标注关系抽取的正例和反例训练数据;四、根据迭代的半监督的学习方法进行概念间关系的抽取工作,并结合评估规则优化每次迭代的抽取结果;五、采用RDF语言对知识库进行标准化构建得以实现。

Patent Agency Ranking