一种网络公害文本识别方法及装置

    公开(公告)号:CN115617962A

    公开(公告)日:2023-01-17

    申请号:CN202110806921.7

    申请日:2021-07-16

    Abstract: 本发明提供一种网络公害文本识别方法及装置,包括:通过提取目标网络文本中的网址链接,对目标网络文本进行初步判定;若无法判定,则计算无效信息度,并生成目标网络文本的拼音列表、关键词列表、及关键词拼音列表;通过各关键词的字元素在目标网络文本中的分布及关键词拼音在目标网络文本拼音列表中的分布,计算各关键词的网络公害分;基于无效信息度对网络公害分进行修订,并根据修订结果,得到网络公害文本识别结果。本发明通过网络公害关键词字符和拼音的模糊匹配,可以准确识别出网络公害文本,同时可以有效应对目标文本中网络公害词被分割、倒序、文字竖排、谐音字等信息隐藏手段。

    网络电话服务端的识别方法及装置、系统、电子设备

    公开(公告)号:CN115914056B

    公开(公告)日:2024-12-17

    申请号:CN202110914688.4

    申请日:2021-08-10

    Abstract: 本申请提供一种网络电话服务端的识别方法及装置、系统、电子设备,该方法包括:获取SIP流量,对SIP流量进行分析,获得目的IP信息;根据目的IP信息,对目标服务端的通信端口进行扫描,查找开放服务的目标端口;与开放服务的目标端口建立连接,并向开放服务的目标端口发送HTTP报文;根据HTTP报文的响应消息,确定目标服务端是否为网络电话服务端。由此可以高效地过滤出网络中大部分的VoIP运营平台信息,比传统的被动解析方式需要的资源更少且更加灵活,比传统的主动方式更加高效、目的性更强。在消耗少量资源的情况下,可以高效的进行定向分析,大大提高整体分析的高效性。

    电信网络诈骗事件的剧本提取方法以及装置

    公开(公告)号:CN111858925B

    公开(公告)日:2023-08-18

    申请号:CN202010501138.5

    申请日:2020-06-04

    Abstract: 本发明公开了电信网络诈骗事件的剧本提取方法、装置、电子设备以及存储介质。该方法包括:获取已知主题类别的电信网络诈骗事件文本;对文本进行分句操作;提取文本中各单句的关键词;利用预先建立的BERT模型提取已知主题类别的电信网络诈骗事件文本中各单句的关键词向量;基于任意两个具有相邻句序的单句的关键词向量的均值向量之间的空间距离,对两个具有相邻句序的单句进行剧情阶段的划分;获取各阶段所包含的单句的关键词作为所属的主题类别下电信网络诈骗事件中各阶段的情节特征的表示。本发明实现了对于电信网络诈骗事件剧情阶段的划分,提取出有助于识别电信网络诈骗事件的特征,从而达到精准提取电信网络诈骗事件剧本的目的。

Patent Agency Ranking