-
公开(公告)号:CN102214208A
公开(公告)日:2011-10-12
申请号:CN201110107222.X
申请日:2011-04-27
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明的目的是提供一种基于非结构化文本生成结构化信息实体的方法与设备。其中,信息实体生成设备获取与中心词相关的非结构化文本;基于预定分类模型,对所述非结构化文本进行分类分析,以获取所述中心词的分类;根据所述分类,生成所述中心词的结构化信息实体。与现有技术相比,本发明根据中心词的非结构化文本,生成该中心词对应的结构化信息实体,由此便于对该中心词所包含的内容进行数据挖掘,并降低中心词内容维护的成本。
-
公开(公告)号:CN102214206B
公开(公告)日:2017-02-15
申请号:CN201110107202.2
申请日:2011-04-27
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明的目的是提供一种用于在信息实体之间建立关联关系的方法与设备。其中,信息实体关联设备获取用户对第一信息实体的第一属性的输入信息;根据所述输入信息,获取与所述第一属性相对应的第二信息实体;据所述第一属性,将所述第一信息实体关联到所述第二信息实体。与现有技术相比,本发明通过在信息实体之间建立关联关系,实现信息实体之间数据共享,由此,保证信息实体数据的一致性,并降低信息实体数据维护成本。
-
公开(公告)号:CN102214209A
公开(公告)日:2011-10-12
申请号:CN201110107228.7
申请日:2011-04-27
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明的目的是提供一种用于识别同名信息实体的方法与设备。其中,信息实体识别设备1获取待识别多个同名信息实体的基本区分信息;根据所述基本区分信息,识别具有不同所述基本区分信息的同名信息实体;根据具有相同所述基本区分信息的同名信息实体,获取所述同名信息实体的高级区分信息;根据所述高级区分信息,识别具有不同所述高级区分信息的所述同名信息实体。与现有技术相比,本发明通过建立多级区分信息,逐级识别多个同名信息实体,从而提高同名信息实体的可识别性,提升用户体验。
-
公开(公告)号:CN102214207A
公开(公告)日:2011-10-12
申请号:CN201110107209.4
申请日:2011-04-27
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明的目的是提供一种用于对信息实体中的属性集合进行排序方法与设备。其中,属性集合排序设备获取第一信息实体中待排序的各属性集合;根据所述属性集合,获取与所述属性集合相对应的第二信息实体,其中,所述第一信息实体与所述第二信息实体之间存在关联关系;获取所述第二信息实体的评价信息;根据所述评价信息,对所述各属性集合进行排序。与现有技术相比,本发明根据与第一信息实体的各属性集合相对应的其他信息实体的评价信息,对该各属性集合进行排序,由此,将与用户最可能相关的属性集合排列在前,提高用户的体验度。
-
公开(公告)号:CN102073729B
公开(公告)日:2013-03-06
申请号:CN201110007580.3
申请日:2011-01-14
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 王京津 , 陆海霞 , 严冰 , 曹建栋 , 陈浩然 , 陈恭明 , 严孙荣 , 唐益龙 , 梁东杰 , 夏寅 , 王坤 , 耿磊 , 李博 , 苏上海 , 韦晨曦 , 薛永刚 , 李永强 , 张伟
IPC: G06F17/30
Abstract: 本发明提供了一种关系化知识共享平台及其实现方法。该实现方法包括:获取词条以及与词条相关的原始语料;从原始语料中提取与词条相关联的至少一个属性以及对应的属性值,以形成词条属性库;获取用户的查询请求;利用查询请求在词条属性库中进行匹配;以及根据匹配结果输出并进而呈现关系化查询结果页面。通过上述所提供的技术方案,本发明提供了一种关系化知识共享平台及其实现方法,其通过对词条、属性及属性值进行关系化处理,可以根据用户的查询请求呈现关系化的查询结果页面,提高了用户的浏览体验。
-
公开(公告)号:CN102214206A
公开(公告)日:2011-10-12
申请号:CN201110107202.2
申请日:2011-04-27
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明的目的是提供一种用于在信息实体之间建立关联关系的方法与设备。其中,信息实体关联设备获取用户对第一信息实体的第一属性的输入信息;根据所述输入信息,获取与所述第一属性相对应的第二信息实体;据所述第一属性,将所述第一信息实体关联到所述第二信息实体。与现有技术相比,本发明通过在信息实体之间建立关联关系,实现信息实体之间数据共享,由此,保证信息实体数据的一致性,并降低信息实体数据维护成本。
-
公开(公告)号:CN102214208B
公开(公告)日:2014-04-09
申请号:CN201110107222.X
申请日:2011-04-27
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明的目的是提供一种基于非结构化文本生成结构化信息实体的方法与设备。其中,信息实体生成设备获取与中心词相关的非结构化文本;基于预定分类模型,对所述非结构化文本进行分类分析,以获取所述中心词的分类;根据所述分类,生成所述中心词的结构化信息实体。与现有技术相比,本发明根据中心词的非结构化文本,生成该中心词对应的结构化信息实体,由此便于对该中心词所包含的内容进行数据挖掘,并降低中心词内容维护的成本。
-
公开(公告)号:CN102073729A
公开(公告)日:2011-05-25
申请号:CN201110007580.3
申请日:2011-01-14
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 王京津 , 陆海霞 , 严冰 , 曹建栋 , 陈浩然 , 陈恭明 , 严孙荣 , 唐益龙 , 梁东杰 , 夏寅 , 王坤 , 耿磊 , 李博 , 苏上海 , 韦晨曦 , 薛永刚 , 李永强 , 张伟
IPC: G06F17/30
Abstract: 本发明提供了一种关系化知识共享平台及其实现方法。该实现方法包括:获取词条以及与词条相关的原始语料;从原始语料中提取与词条相关联的至少一个属性以及对应的属性值,以形成词条属性库;获取用户的查询请求;利用查询请求在词条属性库中进行匹配;以及根据匹配结果输出并进而呈现关系化查询结果页面。通过上述所提供的技术方案,本发明提供了一种关系化知识共享平台及其实现方法,其通过对词条、属性及属性值进行关系化处理,可以根据用户的查询请求呈现关系化的查询结果页面,提高了用户的浏览体验。
-
-
-
-
-
-
-