-
公开(公告)号:CN115687798A
公开(公告)日:2023-02-03
申请号:CN202211412608.6
申请日:2022-11-11
IPC分类号: G06F16/9536 , G06F16/901 , G06Q50/00
摘要: 一种基于特定话题下的社交网络数据获取方法,涉及网络信息采集领域,本发明针对现有的社交网络获取方法采集结果不准确、效率低、获取数据不完整、考虑维度不全面的缺陷,提供了一种社交网络数据获取方法:对目标用户在特定话题下的社交关系进行关联分析,获得社交网络数据;构建并合成社交网络全信息无向图;获得目标用户发布社交信息的总次数和相邻两用户进行社交行为的总次数;预设不同社交行为的权重,计算两个用户之间的社交关联度;获得关联用户的影响力,采集关联用户针对特定话题的社交网络数据,并统计追踪热度;当采集的总数据量达到预设数量时,停止采集。用于获取特定话题下的社交网络数据。
-
公开(公告)号:CN118573916A
公开(公告)日:2024-08-30
申请号:CN202410653553.0
申请日:2024-05-24
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: H04N21/234 , H04N21/233 , H04N21/439 , H04N21/44 , G06V20/40 , G06F16/71 , G06F16/75
摘要: 本发明属于音视频识别技术领域,尤其是一种基于互联网的音视频识别系统,针对现有的音视频识别系统在使用过程中,不便于对音视频内容进行实时智能识别监管,从而导致音视频内容质量无法得到保障的问题,现提出如下方案,其包括互联网模块;采集模块,所述采集模块与互联网模块连接,所述采集模块连接有信号处理模块,信号处理模块连接有特征提取模块,所述特征提取模块连接有分类模块,所述分类模块连接有智能识别模块;获取模块,所述获取模块连接有传输模块,所述传输模块连接有数据库模块,所述数据库模块连接有管理模块,本发明能够在使用过程中,便于对音视频内容进行实时智能识别监管,从而可以有效保障音视频内容质量。
-
公开(公告)号:CN118658456A
公开(公告)日:2024-09-17
申请号:CN202411146603.2
申请日:2024-08-21
申请人: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
摘要: 本发明提供一种用于音频特定信息识别方法及系统,属于信息识别领域;解决了不良行为或不良语言的识别问题;具体如下:步骤S1:获取图像信息和语音信息;步骤S2:分别对图像信息和语音信息进行增强处理,得到待分析图像和待分析语音;步骤S3:构建行为识别模型和语音识别模型,并分析待分析图像和待分析语音,判断公共数据中是否存在恶意行为;若存在,则保存出现显性恶意行为或隐性恶意行为的公共数据;若不存在,则继续监测;本发明通过对目标地区的公共数据进行获取、分析和处理,识别公共数据中的不良行为或不良语言,降低了公共地区的管理难度。
-
公开(公告)号:CN116910754A
公开(公告)日:2023-10-20
申请号:CN202310947894.4
申请日:2023-07-31
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: G06F21/56 , G06F16/33 , G06F16/35 , G06F16/36 , G06F40/295 , G06F40/30 , G06N3/0464 , G06N3/048 , G06N3/08
摘要: 本发明属于应用程序技术领域,具体为一种基于知识图谱的高危App检测识别方法。本发明提供了基于知识图谱的高危App检测识别方法,包括数据采集:根据预设采集规则,面向境内主流的移动应用市场进行全网信息采集;采用代理自动切换和多线程并发策略,结合深度优先遍历、广度优先遍历、种子池搜索、ID索引等技术进行全量数据获取。无需人工干涉,系统自动捕获最新的应用版本,既能确保追踪应用信息的更新,又能确保捕获应用信息的新增,同时还不影响兼顾采集效率;通过借助构建的App知识图谱关联关系及纯文本语义关系,综合处理获取信息,实现对App多维度的风险检测评估,本发明以整体关联分析的方法处理,速度快且灵活性高。
-
公开(公告)号:CN117095673A
公开(公告)日:2023-11-21
申请号:CN202310830037.6
申请日:2023-07-07
申请人: 国家计算机网络与信息安全管理中心
摘要: 本发明涉及语音识别领域,尤其为一种特定场景语音内容识别优化方法,包括如下步骤:包括如下步骤:S1:使用网络爬虫技术对网络中特定场景的语音进行爬取,获得初始语音数据;S2:提取初始语音数据并对初始语音数据进行数据预处理获得预处理数据;S3:通过卷积神经网络训练实用模型,对预处理数据进行语音识别并生成初始文本;S4:使用文本规范算法对初始文本进行文本润色保证输出最终文本的正确性。本发明通过对获取的语音进行预处理起到数据增强的作用保证了数据不失真,在获取到不失真的数据后对其进行特征提取确保了工作速度,对提取出的初始文本进行文本规范算法用常见的文本代替初始文本中出现的非人类语言,保证最后出现的文本不会出现错误。
-
-
-
-