-
公开(公告)号:CN111541645B
公开(公告)日:2022-06-17
申请号:CN202010213474.X
申请日:2020-03-24
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: H04L61/4511 , H04L65/1101 , H04M7/00 , G06F16/2455 , G06F16/2458 , G06F16/248 , G06N5/02
Abstract: 本发明公开了一种VoIP服务知识库构建方法及系统。本方法为:1)在各选定的物理网关上分别部署一实时流量解析模块,用于从VoIP流量中解析出SIP协议和SDP协议,生成VoIP信令日志发送至消息队列;2)从各消息队列中实时读取VoIP信令日志并对其统一标准化;3)对标准化日志进行实时统计计算,并将统计计算结果实时存入实时结果数据库;4)定期从原始日志数据库中获取标准化日志进行聚合,得到各服务域名下的统计信息;然后基于服务域名下的统计信息和设定的判断条件判断该服务域名所代表的VoIP服务的网关类型、VoIP服务与PSTN的关系以及VoIP服务是否存在可疑行为,并将其保存在VoIP服务基础知识库。
-
公开(公告)号:CN114267333A
公开(公告)日:2022-04-01
申请号:CN202111509949.0
申请日:2021-12-10
Applicant: 国家计算机网络与信息安全管理中心广东分中心 , 讯飞智元信息科技有限公司
IPC: G10L15/00 , G10L15/06 , G06F40/126 , G06F40/242
Abstract: 本发明公开了一种混合双语语音识别方法及系统,所述方法包括如下步骤:数据处理步骤,包括:对一定量的目标双语音频数据和目标双语文本语料执行BPE共享词典制作、数据增广和特征提取操作,为后端网络训练提供有效数据输入;Encoder‑Decoder训练步骤,包括:对所述数据处理步骤获得的有效数据采用Transformer结构训练语音识别器。本发明涉及双语混合连续语音识别技术领域。根据输入的目标语种的单语语音数据、双语混合语音数据或者双语混杂语音数据,自动转写出语音的内容信息。
-
公开(公告)号:CN113642328A
公开(公告)日:2021-11-12
申请号:CN202010343089.7
申请日:2020-04-27
Applicant: 国家计算机网络与信息安全管理中心 , 天津市国瑞数码安全系统股份有限公司
IPC: G06F40/295 , G06N3/04 , G06N3/08
Abstract: 本发明提出一种诈骗文本命名实体识别方法,包括:收集诈骗文本,对诈骗文本进行类别标记;使用诈骗文本和类别标记过的诈骗文本进行诈骗文本模型训练,生成诈骗文本命名实体判断模型;接收新通信文本,使用诈骗文本命名实体判断模型对新通信文本进行分析,获取新通信文本中的命名实体及类别。本发明针对诈骗文本手段不断变化,收集大量的历史诈骗文本,构建诈骗文本命名实体判断模型,周期性收集多条历史诈骗文本的相关数据对诈骗文本命名实体判断模型进行自回溯验证,对新通讯文本命名实体识别进行实时验证,实现系统自动化分析处理与人工校准相结合,有效识别新型诈骗文本中的命名实体,通过自动验证不断完善系统模型,实现系统自动化。
-
公开(公告)号:CN111641531B
公开(公告)日:2021-08-17
申请号:CN202010399499.3
申请日:2020-05-12
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司
Abstract: 一种基于DPDK的数据包分发和特征提取方法,包括:步骤一、设置多台Worker服务器和1台采集Proxy服务器,并对每台服务器预先进行DPDK环境部署;步骤二、采集Proxy服务器从绑定网卡中读取网络数据包并存入缓冲区中,同时,按照每个数据包的五元组信息,将缓存区中五元组信息相对应的所有数据包分发给其中1台对应的Worker服务器;步骤三、每台Worker服务器从收到的数据包中提取数据特征信息。本发明属于信息技术领域,能有效提高对网络海量数据包的处理效率和正确率。
-
公开(公告)号:CN113115363A
公开(公告)日:2021-07-13
申请号:CN202110426526.6
申请日:2021-04-20
Applicant: 国家计算机网络与信息安全管理中心
Inventor: 倪善金 , 万辛 , 黄远 , 孙晓晨 , 宁珊 , 沈亮 , 高圣翔 , 计哲 , 杨晶超 , 张震 , 李鹏 , 石瑾 , 李沁 , 侯炜 , 刁则鸣 , 刘发强 , 孙旭东 , 王立强 , 刘睿霖
IPC: H04W28/02 , H04W28/08 , H04B17/318 , H04B17/382
Abstract: 本公开提供一种异构网络中的移动通信方法、装置与电子设备。异构网络中的移动通信方法包括:确定目标用户在所述目标异构网络中的目标位置确定所述目标位置处于所述目标低功率节点的目标信号范围内,所述目标信号范围是根据所述目标低功率节点与所述宏基站之间的目标信号强度边界和所述目标信号强度边界的目标范围扩展基基确定的将所述目标用户与所述宏基站之间通信切换为所述目标用户与所述目标低功率节点进行通信。本公开实施例提供的技术方案可以通过低功率节点的覆盖边界扩展,降低宏基站的负载,提高异构网络中用户的网络信号强度,增强系统的可靠性和频谱效率。
-
公开(公告)号:CN112836043A
公开(公告)日:2021-05-25
申请号:CN202011093000.2
申请日:2020-10-13
Applicant: 讯飞智元信息科技有限公司 , 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种基于预训练语言模型的长文本聚类方法及装置,该方法包括:步骤SS1:使用文本摘要模型将长文本压缩为短文本;步骤SS2:根据步骤SS1获得的所述短文本与BERT模型的有标签文本句子对来预测是否两个文本包含相同的事件,生成文本对初始分数;步骤SS3:使用步骤SS2获得的所述文本对初始分数作为初始分数,根据文本对相较于其他文本的关系来重新计算分数;步骤SS4:根据步骤SS3获得的文本对分数,从得分最高的文本对开始计算分组。本发明运用深度学习方法的同时,采用迁移学习,将大规模预训练模型应用到文本聚类中。
-
公开(公告)号:CN111726460B
公开(公告)日:2021-04-20
申请号:CN202010542365.2
申请日:2020-06-15
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司
Abstract: 一种基于时空图的诈骗号码识别方法,包括:由全量通话记录生成电信通联网络,并构建识别诈骗号码的时空图,使用Snapshot方法按时间间隔T、从图中连续截取出多张时空子图;基于用户在每张时空子图对应时间周期下的通话记录,计算每个用户在每张时空子图对应时间周期下的通话特征指标向量,同时,为每个用户从时空子图中提取和其有相同被叫的邻居用户;构建、并训练识别诈骗号码的时空图神经网络;将待识别目标用户和其所有邻居用户在所有时空子图中的通话特征指标向量输入时空图神经网络,并根据输出判断待识别目标用户号码是否是疑似诈骗号码。本发明属于信息技术领域,能动态的捕获到号码呼叫行为的变化,从而实现诈骗号码的精准识别。
-
公开(公告)号:CN111881682A
公开(公告)日:2020-11-03
申请号:CN202010554413.X
申请日:2020-06-17
Applicant: 国家计算机网络与信息安全管理中心 , 讯飞智元信息科技有限公司
IPC: G06F40/295 , G06F40/30 , G06N3/04
Abstract: 本发明公开了一种改进的DRNN模型的意图识别方法及装置,该方法包括如下步骤:步骤SS1:将输入序列输入到DRNN循环神经网络中进行阻断信息流动,使输入序列传递固定的步长K;步骤SS2:将DRNN循环神经网络的每个隐层标识送入MLP多层感知器中,来抽取更高层的特征信息;步骤SS3:通过Max Pooling池化操作来抽取整个输入序列的文本中最重要的特征信息;步骤SS4:通过一层MLP多层感知器送入softmax逻辑回归模型中进行分类,输出文本分类结果。本发明通过改进的DRNN(Disconnected Recurrent Neural Networks)进行意图识别分类,以提高文本分类的准确性,使相关技术在实际应用场景中达到更好效果。
-
公开(公告)号:CN111737318A
公开(公告)日:2020-10-02
申请号:CN202010585668.2
申请日:2020-06-24
Applicant: 国家计算机网络与信息安全管理中心浙江分中心
IPC: G06F16/2458 , G06F16/2457
Abstract: 本发明提供一种网络诈骗易感人群筛选方法,包括:提取高危用户的社会属性数据;根据高危用户的社会属性进行分段,统计每个属性分段的访问诈骗网站人数;根据高危用户在各个属性分段的数量分布,为每个属性分段分配不同的权重,形成权重集合;计算所有高危用户的权重的加权平均值,取加权平均值最小的用户作为筛选阈值;使用权重集合与筛选阈值建立初始模型。由于容易受害的群体往往集中在部分人群,针对这些人群重点宣传,可以起到事半功倍的效果,因此通过本发明可以准确、迅速的对诈骗网站的访问数据分析筛选,挖掘出网络诈骗易受害人群,从而提高防网络诈骗宣传的效率,针对易被骗人群重点宣传,有效降低诈骗率,降低宣传成本。
-
公开(公告)号:CN111641599A
公开(公告)日:2020-09-08
申请号:CN202010394712.1
申请日:2020-05-11
Applicant: 国家计算机网络与信息安全管理中心 , 杭州东信北邮信息技术有限公司
Abstract: 一种VoIP网络流量所属平台的识别方法,包括:根据流量特征从流量数据中过滤出VoIP流量,并根据五元组信息对VoIP流量进行拆分,生成新的流量文件;识别每个流量文件中的上下行流量,提取和计算上行、下行、合并流量的特征指标,并构成每个流量文件的特征向量;使用随机森林模型进行建模,构建VoIP平台识别模型,输入是由多个流量文件的特征向量构成的特征向量矩阵,输出是多个流量文件分别对应的VoIP平台标签;将待识别的多个流量文件的特征向量构成的特征向量矩阵输入至VoIP平台识别模型,并获得每个待识别的流量文件分别对应的VoIP平台标签。本发明属于信息技术领域,能有效识别加密后的VoIP流量及其平台归属。
-
-
-
-
-
-
-
-
-