-
公开(公告)号:CN105243120A
公开(公告)日:2016-01-13
申请号:CN201510632775.5
申请日:2015-09-29
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
CPC classification number: G06F16/3329
Abstract: 本发明公开了一种检索方法及装置。所述检索方法包括:对用户的查询语句进行语义分析;通过检索非结构化数据语料库,获得语义分析结果匹配的语料片段;对匹配的语料片段进行分词和过滤处理,并采用抽取器对过滤后的语料片段进行抽取,以获得所述查询语句的答案。本发明实施例的技术方案,提供了一种兼具高可信度及适应范围宽的检索信息方式。
-
公开(公告)号:CN105354224B
公开(公告)日:2019-07-23
申请号:CN201510640181.9
申请日:2015-09-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/2455 , G06N5/02
Abstract: 本发明实施例公开了一种知识数据的处理方法和装置。所述处理方法包括:获取待检测的知识数据;从所述待检测的知识数据提取主体、谓词和客体的数据,得到相应的第一结构化知识数据;根据预设的知识冲突检测规则,将所述第一结构化知识数据和已有的第二结构化知识数据进行比对,确定所述待检测的知识数据是否与所述已有的知识数据存在信息冲突。采用本发明实施例,便于后续对存在信息冲突的知识数据的正确性做进一步判别,以提高知识库中知识数据的准确率。
-
公开(公告)号:CN105354224A
公开(公告)日:2016-02-24
申请号:CN201510640181.9
申请日:2015-09-30
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G06F16/24564 , G06N5/022
Abstract: 本发明实施例公开了一种知识数据的处理方法和装置。所述处理方法包括:获取待检测的知识数据;从所述待检测的知识数据提取主体、谓词和客体的数据,得到相应的第一结构化知识数据;根据预设的知识冲突检测规则,将所述第一结构化知识数据和已有的第二结构化知识数据进行比对,确定所述待检测的知识数据是否与所述已有的知识数据存在信息冲突。采用本发明实施例,便于后续对存在信息冲突的知识数据的正确性做进一步判别,以提高知识库中知识数据的准确率。
-
公开(公告)号:CN104915420B
公开(公告)日:2019-12-31
申请号:CN201510315695.7
申请日:2015-06-10
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/907
Abstract: 本发明公开了一种知识库数据处理方法,所述方法包括:从知识库中提取标记的三元组数据并选取所述三元组数据中的关系信息,根据选取的所述关系信息,训练得到与所述关系信息对应的模板,以所述模板作为输入特征,训练得到机器学习模型,在对所述机器学习模型评估达标后提取所述关系信息;将提取的所述关系信息加入所述知识库中,通过搜索引擎查询请求数据,并对查询到的数据进行模板匹配,再由所述机器学习模型进行预测处理。通过采用本发明,可更加准确高效地对知识库数据进行补充。
-
公开(公告)号:CN105488105B
公开(公告)日:2019-11-05
申请号:CN201510809586.0
申请日:2015-11-19
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明实施例提供一种信息提取模板的建立方法、知识数据的处理方法和装置。所述信息提取模板的建立方法包括:从多个知识数据中的结构化数据分别获取预定属性的第一属性值;分别从所述多个知识数据中的正文数据获取与所述预定属性相关的内容片段;根据所述内容片段建立用于提取所述预定属性的属性值的属性信息提取模板。采用本发明实施例,可以使得用户不需要通过人工设置触发词的方式即可进行预定属性的属性值的提取操作,而且由于属性信息提取模板是通过知识数据中的内容片段建立,所以提高了属性信息的查全率和提取精度。
-
公开(公告)号:CN105488105A
公开(公告)日:2016-04-13
申请号:CN201510809586.0
申请日:2015-11-19
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明实施例提供一种信息提取模板的建立方法、知识数据的处理方法和装置。所述信息提取模板的建立方法包括:从多个知识数据中的结构化数据分别获取预定属性的第一属性值;分别从所述多个知识数据中的正文数据获取与所述预定属性相关的内容片段;根据所述内容片段建立用于提取所述预定属性的属性值的属性信息提取模板。采用本发明实施例,可以使得用户不需要通过人工设置触发词的方式即可进行预定属性的属性值的提取操作,而且由于属性信息提取模板是通过知识数据中的内容片段建立,所以提高了属性信息的查全率和提取精度。
-
公开(公告)号:CN104915420A
公开(公告)日:2015-09-16
申请号:CN201510315695.7
申请日:2015-06-10
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种知识库数据处理方法,所述方法包括:从知识库中提取标记的三元组数据并选取所述三元组数据中的关系信息,根据选取的所述关系信息,训练得到与所述关系信息对应的模板,以所述模板作为输入特征,训练得到机器学习模型,在对所述机器学习模型评估达标后提取所述关系信息;将提取的所述关系信息加入所述知识库中,通过搜索引擎查询请求数据,并对查询到的数据进行模板匹配,再由所述机器学习模型进行预测处理。通过采用本发明,可更加准确高效地对知识库数据进行补充。
-
-
-
-
-
-