基于内容特征信息对链接进行去重处理的方法与设备

    公开(公告)号:CN102063498B

    公开(公告)日:2013-01-30

    申请号:CN201010624368.7

    申请日:2010-12-31

    Inventor: 姚远

    Abstract: 本发明的目的是提供一种用于基于内容特征信息对指向相同资源文件的多个链接进行去重处理的方法与设备。其中,去重设备获取多个第一链接;对所述第一链接所指向的资源文件执行基于摘要算法的处理操作,以获取与所述第一链接相对应的内容特征信息;根据所述内容特征信息,并结合所述第一链接所属的站点,对所述多个第一链接进行分组,以获取一个或多个第一链接集,其中,所述第一链接集包括多个从属于同一站点且具有相同内容特征信息的第一链接;对所述第一链接集进行去重处理。本发明使得存储这些链接的设备减少了存储空间,并降低了对这些链接进行后期检测的成本,同时在将去重后的链接作为搜索结果提供给用户时,使得用户获得更好的搜索体验。

    一种用于基于站点检测多个资源链接的状态的方法与设备

    公开(公告)号:CN102083100A

    公开(公告)日:2011-06-01

    申请号:CN201010624369.1

    申请日:2010-12-31

    Inventor: 姚远

    Abstract: 本发明的目的是提供一种用于基于站点检测多个资源链接的状态的方法与检测设备。其中,检测设备获取一个或多个链接站点,其中,每个链接站点包括从属于所述链接站点的一个或多个资源链接;从所述一个或多个链接站点中,选择待检测站点;根据所述待检测站点所含资源链接的相关信息,检测所述待检测站点的一个或多个资源链接的状态。本发明基于站点检测多个资源链接的状态,对资源链接的状态检测更有针对性,并可以根据待检测站点的站点自身特性调整相关检测参数,如检测顺序等,使得多个资源链接的状态检测更为有效,从而保证了搜索引擎将这些资源链接作为搜索结果提供给用户时,用户获得的均为可访问的搜索结果,提升了用户的使用体验。

    基于内容特征信息对链接进行去重处理的方法与设备

    公开(公告)号:CN102063498A

    公开(公告)日:2011-05-18

    申请号:CN201010624368.7

    申请日:2010-12-31

    Inventor: 姚远

    Abstract: 本发明的目的是提供一种用于基于内容特征信息对指向相同资源文件的多个链接进行去重处理的方法与设备。其中,去重设备获取多个第一链接;对所述第一链接所指向的资源文件执行基于摘要算法的处理操作,以获取与所述第一链接相对应的内容特征信息;根据所述内容特征信息,并结合所述第一链接所属的站点,对所述多个第一链接进行分组,以获取一个或多个第一链接集,其中,所述第一链接集包括多个从属于同一站点且具有相同内容特征信息的第一链接;对所述第一链接集进行去重处理。本发明使得存储这些链接的设备减少了存储空间,并降低了对这些链接进行后期检测的成本,同时在将去重后的链接作为搜索结果提供给用户时,使得用户获得更好的搜索体验。

    基于权威度确定链接资源的可靠描述信息的方法与设备

    公开(公告)号:CN102033914A

    公开(公告)日:2011-04-27

    申请号:CN201010571640.X

    申请日:2010-11-29

    Inventor: 姚远

    Abstract: 本发明的目的是提供一种用于基于权威度确定链接资源的可靠描述信息的方法与描述设备。其中,描述设备获取对应于同一个链接资源的多个描述信息,并获取所述多个描述信息中至少一个的权威度,再根据所述权威度,处理所述多个描述信息,以获得一个或多个目标描述信息。与现有技术相比,本发明通过确定对应于同一个链接资源的多个描述信息的权威度,从而过滤与该链接资源不匹配的描述信息,使得用户最终获得相对可靠的描述信息,同时提升了用户的使用体验。

    用于生成标签的方法和装置

    公开(公告)号:CN111292114A

    公开(公告)日:2020-06-16

    申请号:CN201811504653.8

    申请日:2018-12-10

    Abstract: 本申请实施例公开了用于生成标签的方法和装置。该方法的一具体实施方式包括获取用户在历史时间段内操作过的应用的应用名称列表;获取应用名称列表中的应用的相关信息;基于应用名称列表和相关信息确定用户所属的人群类别;基于用户所属的人群类别生成对应的人群类别标签。该实施方式基于用户操作过的应用确定用户所属的人群类别,提高了所确定出的人群类别的准确度,有助于提高对用户属性的刻画精准度和细化度。

    兴趣圈主题确定方法、装置、服务器和介质

    公开(公告)号:CN111125506A

    公开(公告)日:2020-05-08

    申请号:CN201811295606.7

    申请日:2018-11-01

    Abstract: 本发明实施例公开了一种兴趣圈主题确定方法、装置、服务器和介质,其中,该方法包括:基于目标兴趣圈中用户间发生交互行为所针对的数据源,确定出每个用户对应的至少一个关注词;统计每个关注词在目标兴趣圈的全部用户中出现的目标圈用户频数,以及每个关注词在网络内的全部用户中出现的网络用户频数;根据目标圈用户频数、网络用户频数以及目标兴趣圈总用户数、网络总用户数计算每个关注词的目标群体指数;利用目标圈用户频数和目标群体指数对至少一个关注词进行过滤,利用过滤后得到的至少一个关注词确定目标兴趣圈的主题。本发明实施例解决了现有技术中确定兴趣圈主题的准确性较低的问题,提高了兴趣圈主题确定的准确性和针对性。

Patent Agency Ranking