域名分类方法、设备及计算机可读存储介质

    公开(公告)号:CN113076453A

    公开(公告)日:2021-07-06

    申请号:CN202110305374.4

    申请日:2021-03-22

    Abstract: 本发明公开了一种域名分类方法、设备及计算机可读存储介质,所述域名分类方法通过直接提取待分类域名的页面标签特征来作为模型的输入,从而减少了特征工程的复杂性;通过预先在模型中定义具有层次结构的域名类别体系,使得能够基于此挖掘待分类域名所属域名类型之间的层次依赖关系,使得此层次依赖关系能够得到利用;通过在模型中添加递归正则化方法,使得层次依赖关系能够融入到模型参数的正则化结构中;通过利用层级依赖关系与正则化的递归结构进行模型参数估计,使得层次中临近域名类型的参数相似,有助于在估计模型参数时利用域名层次中相近类型的信息,从而提高了域名分类方法的准确度。

    域名知识图谱构建方法、装置、设备及存储介质

    公开(公告)号:CN112995361A

    公开(公告)日:2021-06-18

    申请号:CN202110478706.9

    申请日:2021-04-30

    Abstract: 本发明公开了一种域名知识图谱构建方法、装置、设备及存储介质。本发明通过从域名系统的域名解析日志中,获取域名知识数据;基于域名知识数据进行网络爬取,以获取关联知识数据;对域名知识数据进行分析,以获取分析类特征数据;根据域名知识数据、关联知识数据和分析类特征数据,构建域名知识图谱,由于域名知识数据是从域名系统的域名解析日志中获取的,域名解析日志反映了用户使用域名系统进行查询的一些行为情况,因此,域名知识图谱可以客观地反映用户使用域名系统的行为,丰富了域名知识图谱的内容;同时,对域名知识数据进行网络爬取和分析,从而增加了域名知识图谱的数据来源,进一步丰富了域名知识图谱的内容。

    获取热点域名描述信息的方法、装置、设备及存储介质

    公开(公告)号:CN112784134A

    公开(公告)日:2021-05-11

    申请号:CN202110107562.6

    申请日:2021-01-26

    Abstract: 本发明属于互联网技术领域,公开了一种获取热点域名描述信息的方法、装置、设备及存储介质。该方法包括:获取预设时间粒度的若干热点域名;对若干热点域名进行筛选,得到筛选后的待处理域名;根据待处理域名的顶级域进行分组,得到待爬取列表,待爬取列表中包含顶级域以及对应的域名列表;遍历待爬取列表,对遍历到的顶级域进行爬取,得到对应的描述信息;将描述信息作为域名列表中各待处理域名对应的描述信息。通过上述方式,对热点域名进行筛选以及分组,对待处理域名的顶级域进行爬取,将爬取到的顶级域的描述信息作为对应分组内各待处理域名的描述信息,从而大大减少了海量热点域名的爬虫数量,减少了整体爬虫时间,提高了爬虫速度。

Patent Agency Ranking