-
公开(公告)号:CN113132383B
公开(公告)日:2022-03-25
申请号:CN202110421317.2
申请日:2021-04-19
Applicant: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
IPC: H04L69/22 , H04L67/562 , G06N3/08
Abstract: 本发明涉及大数据技术领域。本发明公开了一种网络数据采集系统,该系统包括服务器,服务器包括:任务下发模块,用于创建用户信息获取任务,将用户信息获取任务分配至不同的任务池,计算任务池优先级,根据任务下发规则,得到并传输具有优先级参数的用户信息获取任务;数据解析模块,与任务下发模块数据连接,用于获取来自中间代理服务端的用户信息流量数据,数据解析模块构建报文解析神经网络模型,将待解析报文信息输入训练后报文解析神经网络模型,判断待解析报文信息中是否包括指定用户信息并提取。通过设置任务优先级,优先处理重要的任务,提高任务处理效率。本公开实施例还公开了一种网络数据采集方法。
-
公开(公告)号:CN112990220A
公开(公告)日:2021-06-18
申请号:CN202110417894.4
申请日:2021-04-19
Applicant: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及人工智能技术领域,特别涉及一种图像中目标文本智能识别方法。该方法步骤如下:将目标文本由像素点坐标表示,输入目标文本像素点坐标值对像素坐标识别神经网络进行训练,获得文本自编码模型和目标文本的表述特征;根据区域的高度值计算背景区域数量,提取覆盖背景区域,剩余区域为前景区域;利用训练好的文本自编码模型在前景区域中获得待识别的文本的表述特征,将文本的表述特征与期望的目标文本的表述特征进行对比判断,若两者误差达到预设阈值,则识别文字为目标文本。本发明还提供一种图像中目标文本智能识别系统。本发明通过基于文本自编码模型来识别目标文本,能够精准定位目标文本在图像中的位置,计算复杂度低,识别准确率高。
-
公开(公告)号:CN110505348B
公开(公告)日:2020-10-09
申请号:CN201910794491.4
申请日:2019-08-27
Applicant: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种APP收集用户个人敏感信息的风险评估方法,通过对APP进行静态分析以及动态分析,得出权限评分、调用函数评分、SDK评分、流量包参数评分和域名评分,再进行加权求和,得出被评估APP的最终评分,根据评估矩阵得出被评估APP的风险评级;根据风险评级反向维护SDK风险权重库和域名风险权重库,对SDK或域名进行风险权重的修正。本发明的APP收集用户个人敏感信息的风险评估方法包含用户输入的用户个人敏感信息、非用户输入的潜在用户个人敏感信息,对APP收集用户个人敏感信息的风险程度进行量化,更全面的涵盖了多种敏感信息点,细化了APP收集用户个人敏感信息的风险大小,能大批量的评估APP收集用户个人敏感信息的风险程度。
-
公开(公告)号:CN110134947B
公开(公告)日:2021-03-26
申请号:CN201910307654.1
申请日:2019-04-17
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明提出一种基于不平衡多源数据的情感分类方法,包括:获取来自多个数据源的训练数据,其中训练数据包含多条文本数据,每条文本数据具有情感类型标签和其对应的数据源;按数据源对训练数据进行分类,以集合每个数据源对应的文本数据作为第一数据集,根据每个第一数据集中各情感类型标签的数量,统计每个第一数据集中情感类型的标准差,选择标准差最小的第一数据作为预训练集,其余第一数据集作为后续训练集;以预训练集训练神经网络模型的权值直到损失函数收敛,输出神经网络模型作为预分类模型,以后续训练集继续训练预分类模型直到损失函数收敛,输出预分类模型作为最终分类模型;将待情感分类文本数据输入最终分类模型,得到其情感类型。
-
公开(公告)号:CN110061975A
公开(公告)日:2019-07-26
申请号:CN201910249260.5
申请日:2019-03-29
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: H04L29/06
Abstract: 本发明涉及一种基于离线流量包解析的仿冒网站识别方法,包括:根据已知网站信息库训练随机森林分类器,以构建对仿冒网站的判别模型;获取待检测网站的数据流并保存为离线流量包,通过该离线流量包得到该待检测网站的网站信息;根据该已知网站信息库对该网站信息进行规则匹配,对匹配为仿冒网站的待检测网站进行标识,将匹配失败的网站信息通过该判别模型进行判别,并对判别为仿冒网站的待检测网站进行标识。
-
公开(公告)号:CN110134947A
公开(公告)日:2019-08-16
申请号:CN201910307654.1
申请日:2019-04-17
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明提出一种基于不平衡多源数据的情感分类方法,包括:获取来自多个数据源的训练数据,其中训练数据包含多条文本数据,每条文本数据具有情感类型标签和其对应的数据源;按数据源对训练数据进行分类,以集合每个数据源对应的文本数据作为第一数据集,根据每个第一数据集中各情感类型标签的数量,统计每个第一数据集中情感类型的标准差,选择标准差最小的第一数据作为预训练集,其余第一数据集作为后续训练集;以预训练集训练神经网络模型的权值直到损失函数收敛,输出神经网络模型作为预分类模型,以后续训练集继续训练预分类模型直到损失函数收敛,输出预分类模型作为最终分类模型;将待情感分类文本数据输入最终分类模型,得到其情感类型。
-
公开(公告)号:CN107181730A
公开(公告)日:2017-09-19
申请号:CN201710145302.1
申请日:2017-03-13
Applicant: 烟台中科网络技术研究所 , 中国科学院计算技术研究所
IPC: H04L29/06
Abstract: 本发明公开了一种仿冒网站监测识别方法及系统,方法包括:S1、分别对被仿冒网站和待检测网站进行页面解析,得到解析后的被仿冒网页和待检测网页;S2、分别对解析后的被仿冒网页和待检测网页进行特征提取,得到被仿冒网页和待检测网页的网页特征;S3、计算被仿冒网页与待检测网页的网页特征的相似性,得到对应于网页特征中所有特征的所有计算结果;S4、对所有计算结果进行集成汇总,得到集成汇总结果;S5、将集成汇总结果与预设阈值进行比较,如果集成汇总结果大于预设阈值,则待检测网站为仿冒网站。本发明的有益效果是:同时考虑了网页URL、网页内容以及网页图像的相似性,并对三个相似性进行集成汇总,提高对仿冒网站进行识别的准确性。
-
公开(公告)号:CN109308321A
公开(公告)日:2019-02-05
申请号:CN201811428266.0
申请日:2018-11-27
Applicant: 烟台中科网络技术研究所 , 中国科学院计算技术研究所
IPC: G06F16/36 , G06F16/33 , G06F16/332
Abstract: 本发明涉及一种知识问答方法、知识问答系统及计算机可读存储介质,其方法包括以下步骤:接收问答请求,问答请求携带有源问题文本信息;根据源问题文本信息和预设问题标签模板确定查询语言;从动态更新的知识管理库中查询与查询语言匹配的推荐实体组,基于推荐实体组生成知识图谱;发送知识图谱。本发明提供的知识问答方法、知识问答系统和计算机可读存储介质,预设问题标签模板可以检验查询语言的完整性,提高了查询语言的准确性,查询语言和知识管理库共同保证了推荐实体组的准确性以及实时性,知识图谱形式统一归纳了推荐实体组,为用户提供专业化的知识答案。
-
公开(公告)号:CN106874489A
公开(公告)日:2017-06-20
申请号:CN201710092869.7
申请日:2017-02-21
Applicant: 烟台中科网络技术研究所 , 中国科学院计算技术研究所
Abstract: 本发明涉及一种基于卷积神经网络的肺结节图像块检索方法及装置,通过对获取的肺结节图像块进行切片处理,得到至少两张肺结节切片扫描图,通过构造卷积神经网络提取肺结节切片扫描图的图像特征,得到肺结节的局部特征集合,获取数据库中所有肺结节的局部特征集合,对所有肺结节的局部特征集合进行聚类构建视觉词典,基于视觉词典获取肺结节带权特征向量,通过倒排索引的方式对肺结节带权特征向量构建索引库,根据输入的查询信息对索引库执行检索,得到符合查询条件的肺结节图像块。本发明能够快速、准确的检索出与待检索肺结节最相似的肺结节图像序列。
-
公开(公告)号:CN106874489B
公开(公告)日:2020-05-12
申请号:CN201710092869.7
申请日:2017-02-21
Applicant: 烟台中科网络技术研究所 , 中国科学院计算技术研究所
Abstract: 本发明涉及一种基于卷积神经网络的肺结节图像块检索方法及装置,通过对获取的肺结节图像块进行切片处理,得到至少两张肺结节切片扫描图,通过构造卷积神经网络提取肺结节切片扫描图的图像特征,得到肺结节的局部特征集合,获取数据库中所有肺结节的局部特征集合,对所有肺结节的局部特征集合进行聚类构建视觉词典,基于视觉词典获取肺结节带权特征向量,通过倒排索引的方式对肺结节带权特征向量构建索引库,根据输入的查询信息对索引库执行检索,得到符合查询条件的肺结节图像块。本发明能够快速、准确的检索出与待检索肺结节最相似的肺结节图像序列。
-
-
-
-
-
-
-
-
-