一种发现互联网金融平台的方法和系统

    公开(公告)号:CN107766481B

    公开(公告)日:2020-08-07

    申请号:CN201710951000.3

    申请日:2017-10-13

    Abstract: 本发明公开了一种发现互联网金融平台的方法和系统。所述方法包括:根据互联网金融平台的金融特点,从多个预设数据渠道,采集疑似互联网金融平台;提取疑似互联网金融平台的内容特征信息,并与预设的互联网金融平台特征数据库进行匹配,以确定疑似互联网金融平台是否为互联网金融平台。本发明通过从多个数据渠道,采集疑似互联网金融平台,包含了全部互联网金融平台的扩散渠道,保证了发现范围的完整性,通过基于已知互联网金融平台的特征建立模型,对采集的互联网金融平台进行自动化判定,提高发现互联网金融平台的准确率,还通过对新发现的互联网金融平台,来进行互联网金融平台特征数据库的更新重建,有利于提到互联网金融平台判断的准确性。

    采集互联网金融网页的项目列表的方法及系统

    公开(公告)号:CN111045659A

    公开(公告)日:2020-04-21

    申请号:CN201911094400.2

    申请日:2019-11-11

    Abstract: 本发明公开了一种采集互联网金融网页的项目列表的方法及系统,该方法包括:脚本生成端展示互联网金融网页对应的可视化配置界面;脚本生成端根据用户在可视化配置界面上的配置操作生成项目列表采集脚本,并将项目列表采集脚本存储至数据库;当时间到达项目列表采集脚本的执行时间点时,脚本生成端从数据库中取出项目列表采集脚本,并将项目列表采集脚本放入任务队列;脚本生成端将任务队列中的项目列表采集脚本分发至执行端;执行端运行项目列表采集脚本,得到项目列表采集信息,并将项目列表采集信息存储至执行端的本地文件系统。通过本发明,通过可视化配置方式,极大的简化了脚本配置工作,从而提高了数据采集效率。

    网站分类方法、装置、分类设备及存储介质

    公开(公告)号:CN115374325A

    公开(公告)日:2022-11-22

    申请号:CN202210614028.9

    申请日:2022-05-31

    Abstract: 本发明实施例涉及一种网站分类方法、装置、分类设备及存储介质,所述方法包括:在提取网站中的文本信息时,对所述文本信息进行预处理,获得文本数据集;在提取网站中的图像信息时,对所述图像信息进行预处理,获得图像数据集;对所述文本数据集进行特征提取,获得文本特征向量;对所述图像数据集进行特征提取,获得图像特征向量;基于Bert‑ResNet融合模型对获取的所述文本特征向量和所述图像特征向量进行信息融合,得到相应的融合结果,所述融合结果表征所述网站的分类结果;通过将文本信息和图像信息在Bert‑ResNet融合模型中进行融合处理,实现文本信息和图像信息互补的多模态网站分类处理,提高网站分类的准确率的技术效果。

Patent Agency Ranking