-
公开(公告)号:CN102214208B
公开(公告)日:2014-04-09
申请号:CN201110107222.X
申请日:2011-04-27
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明的目的是提供一种基于非结构化文本生成结构化信息实体的方法与设备。其中,信息实体生成设备获取与中心词相关的非结构化文本;基于预定分类模型,对所述非结构化文本进行分类分析,以获取所述中心词的分类;根据所述分类,生成所述中心词的结构化信息实体。与现有技术相比,本发明根据中心词的非结构化文本,生成该中心词对应的结构化信息实体,由此便于对该中心词所包含的内容进行数据挖掘,并降低中心词内容维护的成本。
-
公开(公告)号:CN102073729A
公开(公告)日:2011-05-25
申请号:CN201110007580.3
申请日:2011-01-14
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 王京津 , 陆海霞 , 严冰 , 曹建栋 , 陈浩然 , 陈恭明 , 严孙荣 , 唐益龙 , 梁东杰 , 夏寅 , 王坤 , 耿磊 , 李博 , 苏上海 , 韦晨曦 , 薛永刚 , 李永强 , 张伟
IPC: G06F17/30
Abstract: 本发明提供了一种关系化知识共享平台及其实现方法。该实现方法包括:获取词条以及与词条相关的原始语料;从原始语料中提取与词条相关联的至少一个属性以及对应的属性值,以形成词条属性库;获取用户的查询请求;利用查询请求在词条属性库中进行匹配;以及根据匹配结果输出并进而呈现关系化查询结果页面。通过上述所提供的技术方案,本发明提供了一种关系化知识共享平台及其实现方法,其通过对词条、属性及属性值进行关系化处理,可以根据用户的查询请求呈现关系化的查询结果页面,提高了用户的浏览体验。
-
公开(公告)号:CN102214209A
公开(公告)日:2011-10-12
申请号:CN201110107228.7
申请日:2011-04-27
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明的目的是提供一种用于识别同名信息实体的方法与设备。其中,信息实体识别设备1获取待识别多个同名信息实体的基本区分信息;根据所述基本区分信息,识别具有不同所述基本区分信息的同名信息实体;根据具有相同所述基本区分信息的同名信息实体,获取所述同名信息实体的高级区分信息;根据所述高级区分信息,识别具有不同所述高级区分信息的所述同名信息实体。与现有技术相比,本发明通过建立多级区分信息,逐级识别多个同名信息实体,从而提高同名信息实体的可识别性,提升用户体验。
-
公开(公告)号:CN102214207A
公开(公告)日:2011-10-12
申请号:CN201110107209.4
申请日:2011-04-27
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明的目的是提供一种用于对信息实体中的属性集合进行排序方法与设备。其中,属性集合排序设备获取第一信息实体中待排序的各属性集合;根据所述属性集合,获取与所述属性集合相对应的第二信息实体,其中,所述第一信息实体与所述第二信息实体之间存在关联关系;获取所述第二信息实体的评价信息;根据所述评价信息,对所述各属性集合进行排序。与现有技术相比,本发明根据与第一信息实体的各属性集合相对应的其他信息实体的评价信息,对该各属性集合进行排序,由此,将与用户最可能相关的属性集合排列在前,提高用户的体验度。
-
公开(公告)号:CN102118439A
公开(公告)日:2011-07-06
申请号:CN201110021505.2
申请日:2011-01-19
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明公开了一种文档内容的自动处理方法、自动处理装置及编辑器,所述方法包括:获取文档内容的格式标签;对所述文档内容的格式标签进行辨别,获取所述格式标签的类别;在预先存储的标签状态中匹配与所述格式标签的类别一致的标签状态,并根据匹配到的标签状态对所述文档内容进行处理。本发明能够对不同文档内容的格式标签对文档内容进行自动处理,满足对不同格式标签的文档内容的自动处理需求。
-
公开(公告)号:CN102214206B
公开(公告)日:2017-02-15
申请号:CN201110107202.2
申请日:2011-04-27
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明的目的是提供一种用于在信息实体之间建立关联关系的方法与设备。其中,信息实体关联设备获取用户对第一信息实体的第一属性的输入信息;根据所述输入信息,获取与所述第一属性相对应的第二信息实体;据所述第一属性,将所述第一信息实体关联到所述第二信息实体。与现有技术相比,本发明通过在信息实体之间建立关联关系,实现信息实体之间数据共享,由此,保证信息实体数据的一致性,并降低信息实体数据维护成本。
-
公开(公告)号:CN102033864A
公开(公告)日:2011-04-27
申请号:CN201010567800.3
申请日:2010-12-01
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/24
Abstract: 本发明提供了一种在线编辑时引文标记展示方法与装置。其中在线编辑时引文标记展示方法,包括步骤:在用户编辑时,采用相同的标识符号对不同插入点进行统一标识,并建立插入点与插入参考资料之间的关联关系;接收用户提交请求后,对各个插入点的位置进行排序;对排序后的插入点与相关联的参考资料赋予序号标识符展示。本发明通过对全文的整体处理,能够很好地在显示文档中对引文标记按照其在正文中出现的位置顺序进行标注展示,符合用户阅读的习惯。
-
公开(公告)号:CN104063368B
公开(公告)日:2018-09-04
申请号:CN201410242861.0
申请日:2010-12-01
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/24
Abstract: 本发明提供了一种在线编辑时引文标记展示方法与装置。其中在线编辑时引文标记展示方法,包括步骤:在用户编辑时,采用相同的标识符号对不同插入点进行统一标识,并建立插入点与插入参考资料之间的关联关系;接收用户提交请求后,对各个插入点的位置进行排序;对排序后的插入点与相关联的参考资料赋予序号标识符展示。本发明通过对全文的整体处理,能够很好地在显示文档中对引文标记按照其在正文中出现的位置顺序进行标注展示,符合用户阅读的习惯。
-
公开(公告)号:CN102137146B
公开(公告)日:2016-12-14
申请号:CN201010600715.2
申请日:2010-12-22
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提供了一种互联网多源信息处理与展示方法,包括以下步骤:向外源服务器请求数据;解析从外源服务器返回的结构化数据;根据解析的结构化数据构造内部数据,其中,内部数据的数据结构包括基本数据结构和衍生数据结构,基本数据结构是为了满足业务需求而包含的逻辑上的基本数据单元,衍生数据结构是由基本数据结构复合而成的逻辑上包含多个组成部分的数据单元;将构造的内部数据存储到数据库;以定时或随机设定时间间隔的方式重复执行上述步骤以及从数据库获取内部数据并展示在页面。本发明还提供了采用该方法的互联网多源信息处理与展示装置。本发明的方法和装置能较好地实现在词条页面将本地静态信息与从互联网上多个信息源得来的可更新的动态信息进行结合展示的效果。
-
公开(公告)号:CN104063368A
公开(公告)日:2014-09-24
申请号:CN201410242861.0
申请日:2010-12-01
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/24
Abstract: 本发明提供了一种在线编辑时引文标记展示方法与装置。其中在线编辑时引文标记展示方法,包括步骤:在用户编辑时,采用相同的标识符号对不同插入点进行统一标识,并建立插入点与插入参考资料之间的关联关系;接收用户提交请求后,对各个插入点的位置进行排序;对排序后的插入点与相关联的参考资料赋予序号标识符展示。本发明通过对全文的整体处理,能够很好地在显示文档中对引文标记按照其在正文中出现的位置顺序进行标注展示,符合用户阅读的习惯。
-
-
-
-
-
-
-
-
-