-
公开(公告)号:CN104809751A
公开(公告)日:2015-07-29
申请号:CN201510219795.X
申请日:2015-04-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06T11/20
Abstract: 本申请公开了一种生成事件组演化图的方法和装置,解决了运行用于配置事件演化图的算法的时间复杂度较高的技术问题。具体公开的方法包括:获取事件演化图,事件演化图表征事件的持续时间与关注热度之间的对应关系;根据线段树获取持续时间对应的候选区域中,未被其他事件演化图占据的可用区域;将事件演化图配置在可用区域中,以生成事件组演化图。本申请降低了运行用于配置事件演化图的算法的时间复杂度。
-
公开(公告)号:CN104951543B
公开(公告)日:2019-02-22
申请号:CN201510347745.X
申请日:2015-06-19
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提供一种通过计算机实现的信息处理方法及装置。所述方法包括:获取文章的文本信息;从文本信息提取至少一个原始地理名词;从预先建立的分级地理信息知识库分别提取与原始地理名词相应的分级地理位置信息,分级地理位置信息包括与原始地理名词相匹配的同级地理名词以及其所属的各行政划分级别的上级地理名词;根据提取的原始地理名词以及分级地理位置信息分别对提取的分级地理位置信息进行可信度评分;将可信度评分超过预定的可信度阈值的分级地理位置信息标注为与文章相关的地理信息。本发明提供的通过计算机实现的信息处理方法及装置,可较准确地获取到与文章内容相关的地理信息,并且获取的地理信息是较完整的包括各行政级别的地理信息。
-
公开(公告)号:CN104809751B
公开(公告)日:2017-11-24
申请号:CN201510219795.X
申请日:2015-04-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06T11/20
Abstract: 本申请公开了一种生成事件组演化图的方法和装置,解决了运行用于配置事件演化图的算法的时间复杂度较高的技术问题。具体公开的方法包括:获取事件演化图,事件演化图表征事件的持续时间与关注热度之间的对应关系;根据线段树获取持续时间对应的候选区域中,未被其他事件演化图占据的可用区域;将事件演化图配置在可用区域中,以生成事件组演化图。本申请降低了运行用于配置事件演化图的算法的时间复杂度。
-
公开(公告)号:CN104951543A
公开(公告)日:2015-09-30
申请号:CN201510347745.X
申请日:2015-06-19
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
CPC classification number: G06F17/30241 , G06F17/30616
Abstract: 本发明提供一种通过计算机实现的信息处理方法及装置。所述方法包括:获取文章的文本信息;从文本信息提取至少一个原始地理名词;从预先建立的分级地理信息知识库分别提取与原始地理名词相应的分级地理位置信息,分级地理位置信息包括与原始地理名词相匹配的同级地理名词以及其所属的各行政划分级别的上级地理名词;根据提取的原始地理名词以及分级地理位置信息分别对提取的分级地理位置信息进行可信度评分;将可信度评分超过预定的可信度阈值的分级地理位置信息标注为与文章相关的地理信息。本发明提供的通过计算机实现的信息处理方法及装置,可较准确地获取到与文章内容相关的地理信息,并且获取的地理信息是较完整的包括各行政级别的地理信息。
-
公开(公告)号:CN104915426B
公开(公告)日:2019-03-26
申请号:CN201510325667.3
申请日:2015-06-12
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/9537
Abstract: 本发明提供一种信息排序方法、用于生成信息排序模型的方法及装置。所述信息排序方法包括:获取关联的多篇文章;根据预先训练的地理主题模型分别从所述多篇文章提取相应的与地理位置相关的主题的信息;分别将从所述多篇文章提取的主题的信息输入预先训练的相关度排序模型,以分别获取所述多篇文章的相关度;根据所述多篇文章的相关度对所述多篇文章进行排序。本发明提供的信息排序方法、用于生成信息排序模型的方法及装置,由于在排序过程中考虑了地理位置因素,因此可较为准确地为用户推荐与地域相关的文章。
-
公开(公告)号:CN104915335B
公开(公告)日:2018-03-16
申请号:CN201510325632.X
申请日:2015-06-12
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/27
Abstract: 本发明实施例公开了一种为主题文档集生成摘要的方法和装置。所述方法包括:从主题文档集的各篇文章中选取一个和/或多个语句作为候选摘要;根据预设的句法分析算法分别对候选摘要进行切词,并基于切词结果对候选摘要进行评分;将评分所得的值最高的候选摘要作为主题文档集的摘要。采用本发明实施例,可以提高主题文档集的摘要的质量,保证生成的摘要具有较好的可读性。
-
公开(公告)号:CN104951544A
公开(公告)日:2015-09-30
申请号:CN201510347820.2
申请日:2015-06-19
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
CPC classification number: G06F16/00 , G06F16/958
Abstract: 本发明实施例提供一种用户数据处理方法、用户数据的提供方法和系统,其中,基于用户网络行为的用户数据处理方法包括:获取用户的网络行为数据;分别通过至少一种用于识别用户属性的分类模型对用户的网络行为数据进行识别,获取用户的至少一个用户属性信息;将识别获取的用户的至少一个用户属性信息添加到所述用户的用户模型数据中。本发明的技术方案实现基于用户的网络行为获取和提供用户的属性信息。
-
公开(公告)号:CN104951542A
公开(公告)日:2015-09-30
申请号:CN201510346581.9
申请日:2015-06-19
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
CPC classification number: G06F16/35
Abstract: 本发明实施例提供了一种识别社交短文本类别的方法、分类模型训练方法及装置。其中,用于识别社交短文本的类别的方法包括:获取社交短文本数据;从所述社交短文本数据提取文本特征数据;以所述文本特征数据作为输入,从经训练的至少两个短文本分类模型分别获取所述社交短文本数据的第一类别信息;根据获取的所述社交短文本数据的第一类别信息确定所述社交短文本数据的第二类别信息。本发明实施例的识别社交短文本类别的方法、分类模型训练方法及装置,能够自动、准确地识别社交短文本的类别信息,从而提高了对海量社交短文本的分类效果及准确率,广泛应用于各种短文本分析场景,且提升用户网络体验。
-
公开(公告)号:CN104915335A
公开(公告)日:2015-09-16
申请号:CN201510325632.X
申请日:2015-06-12
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/27
Abstract: 本发明实施例公开了一种为主题文档集生成摘要的方法和装置。所述方法包括:从主题文档集的各篇文章中选取一个和/或多个语句作为候选摘要;根据预设的句法分析算法分别对候选摘要进行切词,并基于切词结果对候选摘要进行评分;将评分所得的值最高的候选摘要作为主题文档集的摘要。采用本发明实施例,可以提高主题文档集的摘要的质量,保证生成的摘要具有较好的可读性。
-
公开(公告)号:CN104899908A
公开(公告)日:2015-09-09
申请号:CN201510325179.2
申请日:2015-06-12
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06T11/20
Abstract: 本发明实施例提供一种生成事件组演化图的方法和装置。所述方法包括:获取多个事件演化图,所述事件演化图指示事件被关注的热度随时间演化的状态;根据所述多个事件的时间区间以及相应的事件被关注的热度,依次标注所述多个事件在合并候选区域中的绘制位置;根据标注的绘制位置,分别将所述多个事件演化图复制到所述合并候选区域中,以生成事件组演化图。在为任一事件的事件演化图确定其在合并的绘制区域中的位置时,无需考虑其他全部事件的布局,而仅需根据已进行标注的时间点对应的纵向高度来确定其纵向绘制位置,从而降低了对事件演化图进行布局的时间复杂度,可将所述时间复杂度从通常的O(nlgn)降到O(n)。
-
-
-
-
-
-
-
-
-