-
公开(公告)号:CN102063498B
公开(公告)日:2013-01-30
申请号:CN201010624368.7
申请日:2010-12-31
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 姚远
IPC: G06F17/30
Abstract: 本发明的目的是提供一种用于基于内容特征信息对指向相同资源文件的多个链接进行去重处理的方法与设备。其中,去重设备获取多个第一链接;对所述第一链接所指向的资源文件执行基于摘要算法的处理操作,以获取与所述第一链接相对应的内容特征信息;根据所述内容特征信息,并结合所述第一链接所属的站点,对所述多个第一链接进行分组,以获取一个或多个第一链接集,其中,所述第一链接集包括多个从属于同一站点且具有相同内容特征信息的第一链接;对所述第一链接集进行去重处理。本发明使得存储这些链接的设备减少了存储空间,并降低了对这些链接进行后期检测的成本,同时在将去重后的链接作为搜索结果提供给用户时,使得用户获得更好的搜索体验。
-
公开(公告)号:CN102083100A
公开(公告)日:2011-06-01
申请号:CN201010624369.1
申请日:2010-12-31
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 姚远
Abstract: 本发明的目的是提供一种用于基于站点检测多个资源链接的状态的方法与检测设备。其中,检测设备获取一个或多个链接站点,其中,每个链接站点包括从属于所述链接站点的一个或多个资源链接;从所述一个或多个链接站点中,选择待检测站点;根据所述待检测站点所含资源链接的相关信息,检测所述待检测站点的一个或多个资源链接的状态。本发明基于站点检测多个资源链接的状态,对资源链接的状态检测更有针对性,并可以根据待检测站点的站点自身特性调整相关检测参数,如检测顺序等,使得多个资源链接的状态检测更为有效,从而保证了搜索引擎将这些资源链接作为搜索结果提供给用户时,用户获得的均为可访问的搜索结果,提升了用户的使用体验。
-
公开(公告)号:CN102063498A
公开(公告)日:2011-05-18
申请号:CN201010624368.7
申请日:2010-12-31
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 姚远
IPC: G06F17/30
Abstract: 本发明的目的是提供一种用于基于内容特征信息对指向相同资源文件的多个链接进行去重处理的方法与设备。其中,去重设备获取多个第一链接;对所述第一链接所指向的资源文件执行基于摘要算法的处理操作,以获取与所述第一链接相对应的内容特征信息;根据所述内容特征信息,并结合所述第一链接所属的站点,对所述多个第一链接进行分组,以获取一个或多个第一链接集,其中,所述第一链接集包括多个从属于同一站点且具有相同内容特征信息的第一链接;对所述第一链接集进行去重处理。本发明使得存储这些链接的设备减少了存储空间,并降低了对这些链接进行后期检测的成本,同时在将去重后的链接作为搜索结果提供给用户时,使得用户获得更好的搜索体验。
-
公开(公告)号:CN111199491A
公开(公告)日:2020-05-26
申请号:CN201811290454.1
申请日:2018-10-31
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 王楠 , 郭谢 , 罗程亮 , 周俊 , 许金泉 , 戴明洋 , 韦园园 , 王欢 , 刘少杰 , 王栋 , 石逸轩 , 陈家伟 , 潘剑飞 , 欧阳利萍 , 任建新 , 姚帅 , 贾泽强 , 刘立萍 , 姚远 , 杨胜文 , 林文聪 , 张彬彬 , 刘康
IPC: G06Q50/00 , G06F16/9535
Abstract: 本发明提供一种社交圈的推荐方法和装置。其中,方法包括:根据预设时长内多个用户的行为数据分别构建每个用户的用户画像,获得每个用户的关注点和多维度分类标签;根据每个用户的关注点和多维度分类标签,将多个用户分至N个社交圈;其中,每个社交圈包括至少两个用户,N为正整数;针对每个用户,根据该用户所属的至少一个社交圈,将至少一个社交圈的相关信息发送至该用户的终端设备,以向该用户推荐至少一个社交圈。通过服务器主动向用户推荐社交圈,提升了获取信息的效率和质量,提升了用户感受。
-
公开(公告)号:CN102033914A
公开(公告)日:2011-04-27
申请号:CN201010571640.X
申请日:2010-11-29
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 姚远
IPC: G06F17/30
Abstract: 本发明的目的是提供一种用于基于权威度确定链接资源的可靠描述信息的方法与描述设备。其中,描述设备获取对应于同一个链接资源的多个描述信息,并获取所述多个描述信息中至少一个的权威度,再根据所述权威度,处理所述多个描述信息,以获得一个或多个目标描述信息。与现有技术相比,本发明通过确定对应于同一个链接资源的多个描述信息的权威度,从而过滤与该链接资源不匹配的描述信息,使得用户最终获得相对可靠的描述信息,同时提升了用户的使用体验。
-
公开(公告)号:CN111292114A
公开(公告)日:2020-06-16
申请号:CN201811504653.8
申请日:2018-12-10
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06Q30/02
Abstract: 本申请实施例公开了用于生成标签的方法和装置。该方法的一具体实施方式包括获取用户在历史时间段内操作过的应用的应用名称列表;获取应用名称列表中的应用的相关信息;基于应用名称列表和相关信息确定用户所属的人群类别;基于用户所属的人群类别生成对应的人群类别标签。该实施方式基于用户操作过的应用确定用户所属的人群类别,提高了所确定出的人群类别的准确度,有助于提高对用户属性的刻画精准度和细化度。
-
公开(公告)号:CN111127232A
公开(公告)日:2020-05-08
申请号:CN201811291543.8
申请日:2018-10-31
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06Q50/00
Abstract: 本发明实施例公开了一种兴趣圈发现方法、装置、服务器和介质,其中,该方法包括:基于至少两种数据源构建关系网络结构,其中,关系网络结构用于描述用户和用户以及用户和每种不同的数据源之间的关系;利用特定算法发现关系网络结构中的团块,将每个团块作为发现的兴趣圈。本发明实施例解决了基于单数据源发现兴趣圈的方案合理性较低的问题,提高了兴趣圈发现的合理性。
-
公开(公告)号:CN111126731A
公开(公告)日:2020-05-08
申请号:CN201811285636.X
申请日:2018-10-31
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明实施例提供一种社区质量确定方法、装置及设备,该方法包括:确定第一社区中每个顶点对顶点对应的第一邻接顶点的引力,一个顶点对应的第一邻接顶点为与该顶点构成三角形的邻接顶点;根据第一社区中每个顶点对顶点对应的第一邻接顶点的引力,确定第一社区的凝聚度,第一社区的凝聚度用于指示第一社区的内部紧密型和外部稀疏性;根据第一社区的凝聚度,确定第一社区的质量。提高了对社区质量判断的准确性。
-
公开(公告)号:CN111125506A
公开(公告)日:2020-05-08
申请号:CN201811295606.7
申请日:2018-11-01
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/9535 , G06Q50/00
Abstract: 本发明实施例公开了一种兴趣圈主题确定方法、装置、服务器和介质,其中,该方法包括:基于目标兴趣圈中用户间发生交互行为所针对的数据源,确定出每个用户对应的至少一个关注词;统计每个关注词在目标兴趣圈的全部用户中出现的目标圈用户频数,以及每个关注词在网络内的全部用户中出现的网络用户频数;根据目标圈用户频数、网络用户频数以及目标兴趣圈总用户数、网络总用户数计算每个关注词的目标群体指数;利用目标圈用户频数和目标群体指数对至少一个关注词进行过滤,利用过滤后得到的至少一个关注词确定目标兴趣圈的主题。本发明实施例解决了现有技术中确定兴趣圈主题的准确性较低的问题,提高了兴趣圈主题确定的准确性和针对性。
-
-
-
-
-
-
-
-