网页内容处理方法、装置、电子设备和存储介质

    公开(公告)号:CN114722321A

    公开(公告)日:2022-07-08

    申请号:CN202110005229.4

    申请日:2021-01-05

    Inventor: 陈煌

    Abstract: 本申请实施例公开了一种网页内容处理方法、装置、电子设备和存储介质;本申请实施例获取网页的待处理网页内容,其中,待处理网页内容包括网页内容单元及其的网页标签,网页内容包括内容字符及其对应的识别标签;根据网页标签和识别标签,可以识别内容字符在网页中的位置信息,从而确定内容字符的处理类型;其中,当内容字符是画布绘制类型时,将内容字符绘制在预设画布上,当内容字符是标签处理类型时,按照预设规则将所述内容字符对应的识别标签添加到预设标签集中;然后根据当前画布和当前标签集生成并输出网页的目标网页内容,从而能够有效地防止爬虫抓取网页上的内容,提高了网页内容的安全性。

    网页内容处理方法、装置、电子设备和存储介质

    公开(公告)号:CN114722321B

    公开(公告)日:2024-11-12

    申请号:CN202110005229.4

    申请日:2021-01-05

    Inventor: 陈煌

    Abstract: 本申请实施例公开了一种网页内容处理方法、装置、电子设备和存储介质;本申请实施例获取网页的待处理网页内容,其中,待处理网页内容包括网页内容单元及其的网页标签,网页内容包括内容字符及其对应的识别标签;根据网页标签和识别标签,可以识别内容字符在网页中的位置信息,从而确定内容字符的处理类型;其中,当内容字符是画布绘制类型时,将内容字符绘制在预设画布上,当内容字符是标签处理类型时,按照预设规则将所述内容字符对应的识别标签添加到预设标签集中;然后根据当前画布和当前标签集生成并输出网页的目标网页内容,从而能够有效地防止爬虫抓取网页上的内容,提高了网页内容的安全性。

Patent Agency Ranking