知识数据的处理方法及装置

    公开(公告)号:CN105373590A

    公开(公告)日:2016-03-02

    申请号:CN201510689910.X

    申请日:2015-10-22

    Inventor: 陈琳 李浩 王波

    CPC classification number: G06F16/9535 G06F16/335

    Abstract: 本发明实施例提供一种知识数据的处理方法及装置。其中,知识数据的处理方法包括:获取包括第一实体对象的标识、属性及其属性值的实体数据;从预设的实体信息库提取分别与所述实体数据中的属性值匹配的第二实体对象的信息;将所述第二实体对象与第一实体对象进行关联,以更新与所述第一实体对象相关的知识图谱。本发明实施例的知识数据的处理方法及装置,能够自动、快速地将实体数据中描述的实体对象与实体信息库中的实体对象进行关联,从而更新完善与实体对象相关的知识图谱。

    过滤网站内链的方法及装置

    公开(公告)号:CN105183894A

    公开(公告)日:2015-12-23

    申请号:CN201510633911.2

    申请日:2015-09-29

    Abstract: 本发明公开了一种过滤网站内链的方法及装置。该方法包括:提取指定网站的内链的设定特征;将所述内链的设定特征输入训练完成的设定机器学习模型中,对所述内链进行分类;根据分类结果,对所述内链进行过滤。本发明可以根据过滤结果过滤掉网站中的低质内链,保留网站中的高质内链,提高了指定网站的内链质量,提升用户的体验。

    过滤网站内链的方法及装置

    公开(公告)号:CN105183894B

    公开(公告)日:2020-03-10

    申请号:CN201510633911.2

    申请日:2015-09-29

    Abstract: 本发明公开了一种过滤网站内链的方法及装置。该方法包括:提取指定网站的内链的设定特征;将所述内链的设定特征输入训练完成的设定机器学习模型中,对所述内链进行分类;根据分类结果,对所述内链进行过滤。本发明可以根据过滤结果过滤掉网站中的低质内链,保留网站中的高质内链,提高了指定网站的内链质量,提升用户的体验。

    知识数据的处理方法和装置

    公开(公告)号:CN105279277A

    公开(公告)日:2016-01-27

    申请号:CN201510772788.2

    申请日:2015-11-12

    Inventor: 陈琳 李浩 王波

    CPC classification number: G06F17/30 G06F17/30569 G06F17/30294 G06F17/30563

    Abstract: 本发明实施例提供一种知识数据的处理方法和装置,所述方法包括:获取从多个数据来源收集的网页知识数据;对各所述网页知识数据进行分析,从其提取多个类别的属性信息,并根据所述属性信息分别构建各所述网页知识数据的结构化数据;根据构建的各所述网页知识数据的结构化数据之间的相似度,将不同数据来源的网页知识数据进行合并,以构建不同实体的知识数据。本发明的技术方案可实现将不同知识源的数据针对相同的实体进行合并,丰富实体信息。

Patent Agency Ranking