网页表格数据处理方法、系统、计算机及可读存储介质

    公开(公告)号:CN113887177A

    公开(公告)日:2022-01-04

    申请号:CN202111107135.4

    申请日:2021-09-22

    Inventor: 唐宇飞 范渊 黄进

    Abstract: 本申请涉及一种网页表格数据处理方法、系统、计算机及可读存储介质,该方法包括:获取待处理的网页内容,并将网页内容中的表格数据采集到hdfs中;构建html标签集合,并通过正则匹配替换掉与html标签集合匹配的表格数据;获取用户的配置文件,并判断配置文件中是否包括schema;在所述配置文件中包括schema的情况下,根据所述schema对替换过后的表格数据进行格式化处理。本申请提供的网页表格数据处理方法能够在网页中快速、准确的获取到需要的表格数据,并能够根据用户的需要对获取到的表格数据进行对应的格式化处理,在提高了工作效率的同时,大幅减少了表格数据处理的成本,有利于大范围的推广与使用。

    一种恶意网站识别方法、装置、电子设备及存储介质

    公开(公告)号:CN114900363B

    公开(公告)日:2024-05-14

    申请号:CN202210539411.2

    申请日:2022-05-18

    Inventor: 唐宇飞 王顺

    Abstract: 本发明提供一种恶意网站识别方法、装置、电子设备及存储介质,涉及网络安全领域,方法包括:获取恶意网站的网页指纹信息以及待检测网站对应的网页特征信息;利用网页指纹信息生成第一哈希值,以及利用网页特征信息生成第二哈希值;利用第一哈希值确定第一分区号,并将网页指纹信息分配至第一分区号对应的分区;分区的数量小于网页指纹信息的数量;利用第二哈希值确定第二分区号,并利用第二分区号对应的分区所具有的目标网页指纹信息对网页特征信息进行检测,以确定待检测网站是否属于恶意网站;可通过分区匹配方式降低恶意网站识别的匹配计算量,避免采用全量网页指纹信息进行恶意网站识别带来的效率低下问题,进而可提升恶意网站的识别速率。

    一种网络黑灰产业识别的方法、装置和计算机设备

    公开(公告)号:CN117294508A

    公开(公告)日:2023-12-26

    申请号:CN202311338104.9

    申请日:2023-10-16

    Inventor: 唐宇飞 葛德成

    Abstract: 本申请涉及一种网络黑灰产业识别方法、装置和计算机设备。所述方法包括:利用预设的可逆加密算法,对黑产网站指纹进行加密,得到加密后的密文和密文所对应的密钥;在预设的保密环境中,利用密钥对密文进行解密,并利用有向无环图,对解密得到的黑产网站指纹以及待识别的网站的明文数据进行匹配,得到待识别的网站的明文数据的黑产标签。采用本方法能够解决现有的网络黑灰产业识别方法存在保密性差的问题。

    一种恶意网站识别方法、装置、电子设备及存储介质

    公开(公告)号:CN114900363A

    公开(公告)日:2022-08-12

    申请号:CN202210539411.2

    申请日:2022-05-18

    Inventor: 唐宇飞 王顺

    Abstract: 本发明提供一种恶意网站识别方法、装置、电子设备及存储介质,涉及网络安全领域,方法包括:获取恶意网站的网页指纹信息以及待检测网站对应的网页特征信息;利用网页指纹信息生成第一哈希值,以及利用网页特征信息生成第二哈希值;利用第一哈希值确定第一分区号,并将网页指纹信息分配至第一分区号对应的分区;分区的数量小于网页指纹信息的数量;利用第二哈希值确定第二分区号,并利用第二分区号对应的分区所具有的目标网页指纹信息对网页特征信息进行检测,以确定待检测网站是否属于恶意网站;可通过分区匹配方式降低恶意网站识别的匹配计算量,避免采用全量网页指纹信息进行恶意网站识别带来的效率低下问题,进而可提升恶意网站的识别速率。

    一种电话诈骗预警方法、装置、设备及介质

    公开(公告)号:CN114860792A

    公开(公告)日:2022-08-05

    申请号:CN202210576222.2

    申请日:2022-05-25

    Inventor: 王顺 唐宇飞

    Abstract: 本申请公开了一种电话诈骗预警方法、装置、设备及介质,涉及通信技术领域。该方法包括:获取实时电话的情报数据,并基于所述实时电话的情报数据与历史涉诈终端IP信息确定实时诈骗电话的情报数据;将所述实时诈骗电话的情报数据存储至预设数据库中;根据所述实时诈骗电话的情报数据与诈骗受害人画像确定所述实时诈骗电话对应的第一预警信息,并利用所述预设数据库在上一时间周期内存储的情报数据确定被叫用户对应的第二预警信息,以便于基于所述第一预警信息与第二预警信息进行电话诈骗预警。通过上述技术方案,对实时诈骗电话进行及时识别的同时通过批处理对诈骗电话的预警信息进行矫正。本申请能够快速识别出电话诈骗并及时进行电话诈骗预警。

    数据资源价值形态分析系统及电子设备

    公开(公告)号:CN119047706A

    公开(公告)日:2024-11-29

    申请号:CN202411238286.7

    申请日:2024-09-04

    Abstract: 本申请公开了一种数据资源价值形态分析系统及电子设备,应用于数据分析技术领域。其中,系统包括用户界面及数据分析模块;用户界面向用户提供待分析数据资源的目标参数输入页面,并将满足标准条件的目标参数传输至数据分析模块;目标参数至少包括待分析数据资源在生命周期内的人工成本参数、资源存储信息、计算资源需求信息、基础信息参数及数据质量参数;数据分析模块基于人工成本参数、资源存储信息、计算资源需求信息、基础信息参数及数据质量参数,确定待分析数据资源的资产价值。本发明解决了相关技术资产价值确定难度、效率和准确度不高的问题,能够高效、高准确度且高效率完成对数据资源的价值形态分析,节省存储资源和计算资源。

Patent Agency Ranking