-
公开(公告)号:CN114417870B
公开(公告)日:2024-06-21
申请号:CN202111441955.7
申请日:2021-11-30
申请人: 北京天融信网络安全技术有限公司 , 北京天融信科技有限公司 , 北京天融信软件有限公司
IPC分类号: G06F40/295 , G06F18/22 , G06F16/35 , G06N5/022
摘要: 本申请实施例提供一种安全实体的检测方法、装置、电子设备及存储介质,其中,安全实体的检测方法包括:通过预先训练的第一命名实体识别模型扩充现有知识库,得到扩充知识库;根据所述扩充知识库对第二命名实体识别模型进行训练,得到训练后的第二命名实体识别模型;根据所述训练后的第二命名实体识别模型对安全实体进行检测。通过预先训练的第一命名实体识别模型对知识库进行扩充,扩充后的知识库中的实体数量增加,使得第二命名实体识别模型经过训练之后具有较高的识别率。
-
公开(公告)号:CN112364637B
公开(公告)日:2024-02-09
申请号:CN202011384381.X
申请日:2020-11-30
申请人: 北京天融信网络安全技术有限公司 , 北京天融信科技有限公司 , 北京天融信软件有限公司
IPC分类号: G06F40/279 , G06F40/247 , G06F18/23213
摘要: 本申请提供一种敏感词检测方法、装置,电子设备及存储介质。该方法包括:获取待测数据文本中的待测词语;确定所述待测词语的语种;从预设的敏感词库中筛选出与所述待测词语具有相同语种的第一敏感词;其中,所述预设的敏感词库中存储有不同语种的敏感词;计算所述待测词语与所述第一敏感词之间的相似度。通过该方式,能够根据不同语种的待测词语,实现对应的敏感词检测,与现有技术中仅能够针对文本中单一语种的词语进行检测相比,检测范围更全、灵活性,可靠性更高。
-
公开(公告)号:CN114417870A
公开(公告)日:2022-04-29
申请号:CN202111441955.7
申请日:2021-11-30
申请人: 北京天融信网络安全技术有限公司 , 北京天融信科技有限公司 , 北京天融信软件有限公司
IPC分类号: G06F40/295 , G06K9/62 , G06F16/35
摘要: 本申请实施例提供一种安全实体的检测方法、装置、电子设备及存储介质,其中,安全实体的检测方法包括:通过预先训练的第一命名实体识别模型扩充现有知识库,得到扩充知识库;根据所述扩充知识库对第二命名实体识别模型进行训练,得到训练后的第二命名实体识别模型;根据所述训练后的第二命名实体识别模型对安全实体进行检测。通过预先训练的第一命名实体识别模型对知识库进行扩充,扩充后的知识库中的实体数量增加,使得第二命名实体识别模型经过训练之后具有较高的识别率。
-
公开(公告)号:CN113794687A
公开(公告)日:2021-12-14
申请号:CN202110944248.3
申请日:2021-08-17
申请人: 北京天融信网络安全技术有限公司 , 北京天融信科技有限公司 , 北京天融信软件有限公司
摘要: 本发明提出了一种基于深度学习的恶意加密流量检测方法及装置,检测方法包括骤:收集并解析待检测的TLS数据流量,获取TLS数据流量中的ClientHello数据包、ServerHello数据包及证书中的Subject字段和Issuer字段。基于ClientHello数据包和ServerHello数据包分别生成第一整数序列和第二整数序列,并输入第一特征提取模型进行特征提取,获取相应地第一特征序列和第二特征序列。基于证书中的Subject字段和Issuer字段分别生成第一处理序列和第二处理序列,并输入第二特征提取模型进行特征提取,获取相应地第三特征序列和第四特征序列。将特征序列组合后输入预先训练好的分类器,并输出TLS数据流量检测结果。本方法无须人工提取特征,并且充分考虑了TLS协议本身的特征,提高了恶意加密流量检测的准确率。
-
公开(公告)号:CN110944052A
公开(公告)日:2020-03-31
申请号:CN201911211598.8
申请日:2019-11-29
申请人: 北京天融信网络安全技术有限公司 , 北京天融信科技有限公司 , 北京天融信软件有限公司
IPC分类号: H04L29/08
摘要: 本发明涉及一种文件传输方法、装置、系统、电子设备及存储介质,属于文件传输领域。客户端向服务器传输文件时,先获取到服务器的虚拟地址,然后查询网络数据库,构建用于传递待发送文件的属性信息的第一协商隧道。服务器根据属性信息针对待发送文件生成文件分块信息并查询网络数据库构建第二协商隧道,以将文件分块信息通过第二协商隧道发送给客户端。客户端根据文件分块信息确定用于发送待发送文件的数据发送隧道的数量并实时创建相应数量的数据发送隧道,然后将待发送数据通过数据发送隧道传输到服务器。在整个文件传输过程中,各个隧道运行于暗网环境,由于暗网节点具有不可追溯的特性,使得文件传输的安全性得到提升。
-
公开(公告)号:CN116910180A
公开(公告)日:2023-10-20
申请号:CN202310889836.0
申请日:2023-07-19
申请人: 北京天融信网络安全技术有限公司 , 北京天融信科技有限公司 , 北京天融信软件有限公司
摘要: 本申请的一些实施例提供了一种检测文本相似度的方法、装置、存储介质及电子设备,该方法包括:确定原始文本对应的待比对文本指纹;通过将所述待比对文本指纹与预设指纹库进行对比,获取与所述原始文本相匹配的相似文本。本申请的一些实施例可以实现对文本相似度的校测,成本低效率高。
-
公开(公告)号:CN115758027A
公开(公告)日:2023-03-07
申请号:CN202211473789.3
申请日:2022-11-22
申请人: 北京天融信网络安全技术有限公司 , 北京天融信科技有限公司 , 北京天融信软件有限公司
IPC分类号: G06F16/958 , G06F16/957
摘要: 本申请提供一种基于网页生成PDF的方法、装置、设备及存储介质,所述方法包括:获得网页访问路径及待访问网页的核心内容的Xpath路径;基于所述网页访问路径向网页发送访问请求,获得反馈的网页数据;确定所述网页数据的网页元素节点树;基于所述Xpath路径中的内容及网页元素节点树确定出所述网页数据中需要删除的非核心数据,所述非核心数据为所述网页数据中除核心数据及其显示相关数据以外的数据;删除所述网页中的非核心数据;基于所述网页数据中显示的核心数据生成对应的PDF文件。本申请基于网页生成PDF的方法能够直接对网页内容转换为PDF文件,且排版正常,支持文件内容不失真放大。
-
公开(公告)号:CN110765329B
公开(公告)日:2022-09-23
申请号:CN201911030402.5
申请日:2019-10-28
申请人: 北京天融信网络安全技术有限公司 , 北京天融信科技有限公司 , 北京天融信软件有限公司
IPC分类号: G06F16/906 , G06K9/62
摘要: 本申请提供了一种数据的聚类方法及电子设备,该方法包括:获取目标数据,对所述目标数据进行分类处理,生成包含多类数据的数据群;基于聚类特征对所述数据群进行第一聚类操作,生成具有不同聚类特征的多个数据集;基于所述数据集的属性特征对所述数据集进行第二聚类操作,生成具有不同属性特征的多个数据子集。本申请所提供的方法能够全面深入地获取目标数据,快速地对数据群进行初步划分,然后基于细致划分数据的目的,对数据集进行进一步的细致划分,精确地划分生成了数据子集,直观地反映出数据的分布和状况。
-
公开(公告)号:CN110765336B
公开(公告)日:2022-04-01
申请号:CN201911060028.3
申请日:2019-11-01
申请人: 北京天融信网络安全技术有限公司 , 北京天融信科技有限公司 , 北京天融信软件有限公司
发明人: 潘季明
IPC分类号: G06F16/951 , G06F16/9535
摘要: 本申请公开了一种网页信息处理方法及系统,其中,该方法包括:获取第一网址和第一网址所指向的第一网页;基于第一网址的数据结构计算其网址性质参数,并基于第一网址的网址性质参数确定第一网页的权重值;从第一网页获取链接集合和网页内容数据;基于链接数据和网页内容数据计算第二网页的第一参数;基于第二网页的第一参数和第一网页的权重值计算第二网页的权重值,以使网络爬虫基于第二网页的权重值爬取第二网页。该方法能够提高网络爬虫的爬取效率,能够有效过滤掉垃圾网页、低质量网页及被篡改网页,保障了网络爬虫爬取的第二网页的质量。
-
公开(公告)号:CN114095446A
公开(公告)日:2022-02-25
申请号:CN202111328265.0
申请日:2021-11-10
申请人: 北京天融信网络安全技术有限公司 , 北京天融信科技有限公司 , 北京天融信软件有限公司
IPC分类号: H04L47/2441 , H04L47/2483 , G06K9/62 , G06N3/04 , G06N3/08
摘要: 本发明公开了一种加密流量分类模型训练方法、检测方法及装置,包括:获取多个应用的TLS流量,并解析出各条TLS流量的TLS握手状态和TLS记录长度;基于该条TLS流量的TLS握手状态和TLS记录长度分别提取相应的序列特征;将该条TLS流量的序列特征同时作为分类模型的输入,以执行训练。本公开的方法无需人工提取序列特征,并且充分考虑TLS协议本身的特征,在对分类模型进行训练后可以提高加密流量分类的准确率。
-
-
-
-
-
-
-
-
-