一种多源数据映射关联细粒度不良信息检测方法

    公开(公告)号:CN116680419B

    公开(公告)日:2023-12-26

    申请号:CN202310955604.0

    申请日:2023-08-01

    摘要: 本发明涉及自然语言处理技术领域,提供一种多源数据映射关联细粒度不良信息检测方法,所述方法包括:获取待检测文本和历史浏览文本,待检测文本和历史浏览文本属于同一用户的浏览文本;对待检测文本进行实体关系抽取,得到待检测三元组;获取历史浏览文本中的不良信息所对应的历史三元组,并基于历史三元组与待检测三元组之间的关联度,从待检测三元组中确定出待检测文本中的不良信息所对应的三元组。本发明提供的一种多源数据映射关联细粒度不良信息检测方法,能够准确从待检测三元组中确定出待检测文本中的不良信息所对应的三元组,避免传统方法中分词演变绕过黑名单机制导致漏检的问题,进一步提高的不良信息的检测精度。

    一种不平衡条件下的文本分类器构建方法和装置

    公开(公告)号:CN117371423A

    公开(公告)日:2024-01-09

    申请号:CN202311076561.5

    申请日:2023-08-24

    IPC分类号: G06F40/20 G06N3/0442 G06N3/09

    摘要: 本发明公开了一种不平衡条件下的文本分类器生成方法和装置,所述方法包括:获取不平衡数据,基于所述不平衡数据构建训练集;生成特征向量,将特征向量作为输入数据;将输入数据输入分类网络,分类网络包括依次相连的卷积层、池化层、LSTM层、GRU层、全连接层;输入数据经所述分类网络处理,得到中间分类结果,所述中间分类结果是未经完全训练,但是已有分类效果的结果;将中间分类结果与真实标签输入损失函数,得到中间结果对应的损失值,若损失值小于预定义的损失值,则当前的分类网络结合当前的权重作为构建完毕的分类器。本方法能在训练过程中减少分对样本的损失在总的损失中的权重,使得分类器的优化更偏向分错的样本。

    一种视频分类方法及装置

    公开(公告)号:CN109902202A

    公开(公告)日:2019-06-18

    申请号:CN201910015462.3

    申请日:2019-01-08

    摘要: 本发明提供一种视频分类方法及装置,用以解决相关技术中基于显著性引导的分类模型的分类性能较低的问题。该方法包括:提取待分类视频的关键帧;将所述关键帧输入预先根据训练集训练得到的双路神经网络模型,得到所述视频的分类结果以及所述视频的显著图,所述训练集中包括按照视频类型进行分类的视频以及视频显著图,所述双路神经网络模型包括一路用于对所述视频进行分类的第一子神经网络以及一路用于确定所述视频的显著图的第二子神经网络;将得到的所述显著图中置信度高于第一阈值的显著图加入所述训练集;使用所述训练集中的视频显著图重新训练所述第二子神经网络,得到更新后的双路神经网络模型。本发明有效提高了视频分类的性能。

    一种基于环境度量的零信任单包通信方法及系统

    公开(公告)号:CN117201192A

    公开(公告)日:2023-12-08

    申请号:CN202311461257.2

    申请日:2023-11-06

    IPC分类号: H04L9/40 H04L69/04

    摘要: 本发明涉及一种基于环境度量的零信任单包通信方法及系统,引入终端所在环境中预设各环境指标度量信息所构的终端信息,构建单包认证报文进行应用,在通过用户认证信息的认证后,针对各申请业务系统所构申请策略,依次进行交集匹配、以及联系终端信息的匹配处理,获得终端对应的各目标匹配业务系统,并提供关于相应准入网络,供终端进行访问;设计方案通过扩展单包认证协议,定义基于位标识的环境度量信息交换结构,实现对终端环境度量信息的有效传递,并基于终端访问策略,支持对终端风险的评估的动态访问控制,进一步提高终端的准入控制能力,有效避免问题终端接入或访问高敏感网络或系统的风险的发生,提高整个网络安全性。