-
公开(公告)号:CN111488509A
公开(公告)日:2020-08-04
申请号:CN202010277162.5
申请日:2020-04-10
Applicant: 国家计算机网络与信息安全管理中心 , 哈尔滨工业大学(威海)
IPC: G06F16/951 , G06F16/955 , G06F16/9535 , G06Q30/02
Abstract: 本发明提供一种获取互联网金融广告的方法,包括以下步骤:(1)获取金融广告爬取网站及其链接;(2)打开步骤(1)中的网站和链接,获取网站中金融广告的URL;(3)根据步骤(2)的广告URL和图片src依照Adblock插件过滤规则编写过滤规则列表;(4)根据步骤(3)编写的过滤规则列表,将过滤规则列表保存进数据库;(5)根据步骤(1)中的网站,爬取网站内容,提取相应的url、图片src属性,然后将提取到的内容根据步骤(4)的过滤规则列表通过python的adblockparser解析器进行过滤获取金融广告;其解决了站内广告不规则站点无法使用统一的Xpath规则获取站内的所有广告内容的技术问题。本发明可广泛应用于获取网站内部及其子网站里的广告内容。
-
公开(公告)号:CN119988623A
公开(公告)日:2025-05-13
申请号:CN202411978984.0
申请日:2024-12-31
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/353 , G06F16/34 , G06F40/284 , G06F40/216 , G06N20/00
Abstract: 本发明公开一种面向公共事务的负面信息细分类方法及系统,属于人工智能技术领域。所述方法包括:收集负面信息样本,并标识所述负面信息样本的标签,所述标签包括:程度标签和分类标签;抽取所述负面信息样本的摘要信息与关键词,并对所述负面信息样本进行情感分类;基于所述负面信息样本以及该负面信息样本的标签、摘要信息、关键词与情感分类结果,构建训练数据集;使用所述训练数据集微调Ernie模型,得到负面信息细分类模型;基于所述负面信息细分类模型进行目标负面信息的分类,得到该目标负面信息的细分类结果。本发明可以提升对多类别公共事务负面信息的精确分类能力,并解决现有技术中的分类混淆和准确性不足问题。
-
公开(公告)号:CN118965451A
公开(公告)日:2024-11-15
申请号:CN202410973742.6
申请日:2024-07-19
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F21/64 , G06F16/27 , G06F21/62 , G06F16/182
Abstract: 本发明公开一种基于区块链的分布式存储数据轻量化管理方法及系统,属于区块链技术领域。所述方法包括:通过调用权限管理智能合约生成交易,来实现账户的权限管理和分布式存储文件的数据管理,所述权限管理智能合约的输入参数包括:操作类型、账户id、权限id和数据id。本发明可以实现对分布式存储数据的多样化管理权限,包括数据创建、删除、检索、共享、转移等。
-
公开(公告)号:CN112182020B
公开(公告)日:2023-04-18
申请号:CN202011184465.9
申请日:2020-10-29
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F18/214 , G06F18/2415 , G06F40/289 , G06F40/30 , G06Q30/0645 , G06Q30/08 , G06Q40/03 , G06Q40/04 , G06Q40/06 , G06N3/0464 , G06N3/08
Abstract: 本申请涉及一种金融行为识别与分类的方法、装置及计算机可读存储介质。其中,方法包括:从至少两个数据源获取多源数据文本,然后按照预先设定的数据处理方式对数据文本进行预处理,得到各数据文本的向量,将各所述数据文本的向量输入到预先训练的多尺度卷积神经网络模型中,根据数据源的类型确定各所述数据文本的向量的卷积核,再利用各自的卷积核提取各向量的语义特征,从而根据各向量的语义特征确定各预设金融行为的概率,最后再根据各预设金融行为的概率确定多源数据文本对应的金融行为。多数据源能够体现出目标金融机构各个方面的实际开展的业务,从而能够更为准确地识别出目标金融机构实际的金融行为,更加便于监管。
-
公开(公告)号:CN115439204A
公开(公告)日:2022-12-06
申请号:CN202211080195.6
申请日:2022-09-05
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06Q40/00
Abstract: 本公开涉及一种区域非法集资风险评估设备。该设备获取到目标区域已注册企业的企业信息、系统判定的企业风险预警指数、人工判定的企业风险预警指数及已发生的非法集资案件信息后,根据上述信息确定目标区域已发生非法集资案件的企业对应的第一风险指数、已发生非法集资案件的除企业外的其他主体对应的第二风险指数、由人工判定了企业风险预警指数的企业对应的第三风险指数及由系统判定了企业风险预警指数的企业对应的第四风险指数,并根据上述各风险指数确定综合风险指数,使得可以通过设备自动化的对区域的非法集资风险进行量化评估,减少了人员对非法集资风险评估的参与,既提高了非法集资风险评估的准确性,又提高了非法集资风险评估的效率。
-
公开(公告)号:CN118965192A
公开(公告)日:2024-11-15
申请号:CN202410924472.X
申请日:2024-07-11
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F18/2431 , G06F18/25 , G06N3/0455 , G06N3/0499 , G06N3/098 , G06F16/958
Abstract: 本公开提供一种基于多模态融合学习的生成式AI服务网站识别方法。输入人工智能生成服务网站的原始的多维度多模态信息,通过多模态特征提取模型将所述多维度信息转化为人工智能服务网站的文本、图片、代码三种特征向量,将所述三种特征向量输入多模态特征融合识别模型,输出人工智能生成服务网站是否提供人工智能服务的判别结果。本发明通过将网站的文本、图像和代码模态的特征融合实现更加准确的人工智能生成服务网站识别,以提高模型在新兴、多样化网站数据上的泛化性能,增强网站识别与分类模型泛化能力和适应性,突破单一数据类型进行分类的局限性,提高分类系统的泛化能力,使其能够适应不断变化和多样化的人工智能生成式网站内容。
-
公开(公告)号:CN118656490A
公开(公告)日:2024-09-17
申请号:CN202410629623.9
申请日:2024-05-21
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F40/30 , G06N3/0455 , G06N5/04
Abstract: 本发明涉及一种文本分类方法、装置、设备和存储介质,文本分类方法包括:获取待处理文本,待处理文本包含对于目标事件的目标观点;将大模型运用到特定文本分类任务上,在该分类任务的目标立场下对待处理文本进行分类处理,确定目标事件的事件类别,且大模型还是基于少数据量的数据集上训练的,准确率也很高,同时在分类任务的基础上,提出了多任务间的自我校验的可解释优化任务,确定反应目标观点情感倾向的可解释的倾向信息;使用二分类模型对可解释的倾向信息进行语义分析,审核大模型的分类准确性,确定反应目标观点情感倾向的倾向类别;根据倾向类别和事件类别,确定待处理文本的目标类别,有效提高了文本分类的准确性。
-
公开(公告)号:CN118069734A
公开(公告)日:2024-05-24
申请号:CN202311521414.4
申请日:2023-11-15
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种可编辑区块链的区块数据结构和防篡改验证方法。所述区块数据结构的区块头包括:上一区块哈希字段、时间戳字段、merkle根字段、编辑前区块hash字段、编辑后区块hash字段和编辑校验字段;所述上一区块哈希字段,用于存储上一区块的哈希值;所述时间戳字段,用于存储区块生成时间;所述merkle根字段,用于存储区块体的merkle根;所述编辑前区块hash字段,用于存储编辑前区块的哈希值;所述编辑后区块hash字段,用于存储编辑后区块的哈希值;所述编辑校验字段,用于存储验证节点的同意编辑响应。本发明在支持区块链可编辑的同时,还能够防止恶意节点借区块链的可编辑特性恶意篡改区块链。
-
公开(公告)号:CN111538836B
公开(公告)日:2024-02-02
申请号:CN202010321249.8
申请日:2020-04-22
Applicant: 哈尔滨工业大学(威海) , 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/951 , G06F40/284 , G06F18/2431
Abstract: 本发明涉及一种识别文本类广告中金融广告的方法,其解决了现有广告分析模型无法有效识别金融广告的技术问题,其包括以下步骤:(1)从数据库中获取爬取到的广告文本数据;(2)对步骤(1)的文本数据进行预处理,进行分词以及去除无用信息;(3)将步骤(2)预处理后的文本通过不同的方式表示为计算机可以处理的方式,即文本表示;(4)针对步骤(3)的不同文本表示方式选择合适的分类算法,然后将文本表示的语义信息提炼成类别信息;(5)将步骤(4)中不同文本表示方式表示的分类模型进行整合,获得最终的金融广告识别模型。本发明可广泛应于在文本类广告中识别金融广告的场合。
-
公开(公告)号:CN115374064A
公开(公告)日:2022-11-22
申请号:CN202211064792.X
申请日:2022-09-01
Applicant: 湖南天河国云科技有限公司 , 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种基于可证明数据去重技术的分布式存储方法、存储系统及介质,包括:上传:用户C通过分布式网关G提供的用户数据上传接口PUT上传数据;用户C向分布式网关G发起数据上传请求,通过密钥验证方式进行具有标识化的存储;下载:用户C将需要下载的文件的文件标识FID给分布式网关G,分布式网关G判断用户身份C是否在在下载文件的文件标识FID的元数据里面,用以判定用户是否能够下载;删除:当用户需要删除指定文件时,将文件对应的文件标识FID发给分布式网关G;分布式网关G只需要将用户C的身份ID从本地或者区块链上的文件存储元数据删除。该存储系统和介质均是基于上述方法来实施。本发明具有原理简单、便于管理、适用范围广等优点。
-
-
-
-
-
-
-
-
-