一种针对竖排文本的检测方法及装置

    公开(公告)号:CN115410207B

    公开(公告)日:2023-08-29

    申请号:CN202110588830.0

    申请日:2021-05-28

    Abstract: 本发明公开一种针对竖排文本的检测方法及装置,包括扫描待检测文本,确定换行符的位置,得到一个位置列表,并基于该位置列表,计算每行文字长度;截取连续t行中每行文字长度一致的文本,保留截取文本中的有效字符,得到保留文本;对保留文本进行分词,并根据得到第一分词结果,获取截取文本的初步检测结果;若初步检测结果判断截取文本为竖排文本,则将截取文本转换为二维的字符矩阵,并删除换行符,对该字符矩阵作转置,得到转置文本;对转置文本进行分词,并根据得到第二分词结果,获取截取文本的检测结果。本发明可确定竖排文字的区域,去除竖排文本中的干扰字符,并恢复成一般的横向文本,同时处理竖排文本中普遍存在的错别字现象。

    一种虚拟化攻防对抗环境构建方法

    公开(公告)号:CN111786983B

    公开(公告)日:2023-04-25

    申请号:CN202010592496.1

    申请日:2020-06-24

    Abstract: 本发明涉及一种虚拟化攻防对抗环境构建方法,支持一键部署虚拟化对抗环境,在虚拟节点引入流量探针、主机节点主动监控服务、加固脚本检测和攻击事件判定,根据攻击流量和提交Flag信息判定攻击成功;而且构建镜像分为系统级别镜像和应用级别镜像,分别通过虚拟化组件和轻量级虚拟化构建镜像,简单易操作;在所构建虚拟化攻防对抗环境中,每位选手和对抗环境的虚拟节点建立是一对一关系,选手会分配具有Root权限的账号,保证每位选手设备与设备是隔离的;不仅如此,本发明进一步设计了应用虚拟化攻防对抗环境构建方法的系统,应用模块化之间的相互协作,高效实现虚拟化攻防对抗环境的快速构建,为虚拟化攻防对抗提供平台保障。

    基于海量科研资料的课题立项决策推荐方法及装置

    公开(公告)号:CN115269572A

    公开(公告)日:2022-11-01

    申请号:CN202210836039.1

    申请日:2022-07-15

    Abstract: 本发明公开了一种基于海量科研资料的课题立项决策推荐方法及装置,所述方法包括:收集科研资料样本,并根据课题样本的课题属性进行属性特征的抽取;基于所述课题属性的数量,对所述BP神经网络的神经元初始权值与阈值进行初始实数编码,得到若干个基因染色体;将所述属性特征输入BP神经网络进行训练,并以期望数据样本与预测数据样本相应的误差函数作为个体适应度函数,进行遗传算法计算,得到最佳个体基因染色体;基于所述到最佳个体基因染色体,初始化所述BP神经网络;利用所述属性特征对遗传算法改进后的BP神经网络进行训练,得到决策推荐模型;基于所述决策推荐模型,获取目标课题的推荐结果。本发明可以支撑和辅助科研立项决策工作。

    基于海量数据分析挖掘CDN域名的方法

    公开(公告)号:CN108090188B

    公开(公告)日:2021-05-07

    申请号:CN201711367377.0

    申请日:2017-12-18

    Abstract: 本发明公开了一种基于海量数据分析挖掘CDN域名的可靠有效的方法,属于网络信技术领域。该方法首先对初始的URL信息进行URL解码,然后对解码后的URL进行HOST域名提取和正确性验证;对获取的数据进行HOST域名提取,过滤掉脏数据和数值型HOST域名;设置CDN服务IP个数的阈值M和HOST域名对应不重复的服务IP个数的阈值N;对成功提取HOST域名的数据,基于服务IP个数、不同地理位置区域以及是否使用提供CDN服务IP三个维度进行CDN域名分析发现。本发明方法紧密结合了使用CDN服务域名的特性,在分析中利用了多种精准的、有依据的分析方法,保证了分析的可靠性和准确度,为后续的网络安全应用和分析提供坚实的基础数据支持,使得相关领域有更加广泛的应用前景。

    一种基于多文件格式自动识别的跨地域关联统计方法

    公开(公告)号:CN107168984A

    公开(公告)日:2017-09-15

    申请号:CN201710165255.7

    申请日:2017-03-20

    CPC classification number: G06F17/30194 G06F17/30424

    Abstract: 本发明涉及一种基于多文件格式自动识别的跨地域关联统计方法,属于大数据检索分析领域。该方法通过统一SQL查询入口接收SQL查询请求;然后对SQL查询请求进行解析,以识别查询的不同文件格式;然后全局节点将解析成功后的查询请求发送到对应的分节点;然后各分节点进行相应的查询操作,并将查询结果回传给全局节点;最后全局节点对各分节点回传的数据进行关联统计并输出统计结果。本发明可以应用在离线或在线数据统计场景中,能够实现多种文件格式的自动识别,突破了地域限制,能够将不同数据中心的数据进行关联统计。

Patent Agency Ranking