-
公开(公告)号:CN115687798A
公开(公告)日:2023-02-03
申请号:CN202211412608.6
申请日:2022-11-11
Applicant: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心 , 国家计算机网络与信息安全管理中心上海分中心
IPC: G06F16/9536 , G06F16/901 , G06Q50/00
Abstract: 一种基于特定话题下的社交网络数据获取方法,涉及网络信息采集领域,本发明针对现有的社交网络获取方法采集结果不准确、效率低、获取数据不完整、考虑维度不全面的缺陷,提供了一种社交网络数据获取方法:对目标用户在特定话题下的社交关系进行关联分析,获得社交网络数据;构建并合成社交网络全信息无向图;获得目标用户发布社交信息的总次数和相邻两用户进行社交行为的总次数;预设不同社交行为的权重,计算两个用户之间的社交关联度;获得关联用户的影响力,采集关联用户针对特定话题的社交网络数据,并统计追踪热度;当采集的总数据量达到预设数量时,停止采集。用于获取特定话题下的社交网络数据。
-
公开(公告)号:CN119940368A
公开(公告)日:2025-05-06
申请号:CN202510008588.3
申请日:2025-01-03
Applicant: 国家计算机网络与信息安全管理中心 , 烟台中科网络技术研究所
IPC: G06F40/30 , G06F40/194 , G06F40/16 , G06N3/045 , G06N3/0475 , G06N3/042 , G06N3/0464 , G06F18/22 , G06F18/23211
Abstract: 本发明涉及文本数据分析技术领域,尤其涉及一种面向生成式大模型的文本同源性分析方法,包括以下步骤:S1:对面向生成式大模型的文本数据进行预处理后,将文本数据转化为高维语义嵌入向量,引入混合距离度量进行相似度分析;S2:采用基于密度峰值的动态聚类算法进行动态聚类分析,生成初步的同源文本簇,引入多重迭代映射与动态梯度扰动机制进一步分析,得到优化的同源文本簇;S3:将优化的同源文本簇进行多模态融合,利用图结构对融合后的多模态同源文本簇进行分析,应用时间序列分析方法,得到文本的同源性分析与来源追踪结果,本方法能够有效应对生成式大模型生成文本数据语义表达的多样性和复杂性,增强了文本表示的鲁棒性和准确性。
-
公开(公告)号:CN119091861B
公开(公告)日:2025-05-13
申请号:CN202411149307.8
申请日:2024-08-21
Applicant: 国家计算机网络与信息安全管理中心
IPC: G10L15/02 , G10L15/06 , G10L15/16 , G10L15/183 , G10L15/26 , G10L21/0232 , G10L19/26
Abstract: 本发明涉及语音转写领域,尤其涉及基于人工智能的语音转写加速方法,包括以下步骤:(S1)获取原始语音数据,对获取的原始语音数据先预处理再增强处理,对增强后的语音数据进行特征提取,得到语音特征,基于语音特征进行语音识别,得到识别结果;(S2)根据识别结果生成初步转写文本,通过自适应动态文本优化算法对初步撰写文本进行优化,得到优化后的转写文本,同时在转写过程中通过优化加速算法优化转写效率。本发明公开的基于人工智能的语音转写加速方法,减少了背景噪声和其他干扰,提高了最终撰写文本的准确性和速度。
-
公开(公告)号:CN119091861A
公开(公告)日:2024-12-06
申请号:CN202411149307.8
申请日:2024-08-21
Applicant: 国家计算机网络与信息安全管理中心
IPC: G10L15/02 , G10L15/06 , G10L15/16 , G10L15/183 , G10L15/26 , G10L21/0232 , G10L19/26
Abstract: 本发明涉及语音转写领域,尤其涉及基于人工智能的语音转写加速方法,包括以下步骤:(S1)获取原始语音数据,对获取的原始语音数据先预处理再增强处理,对增强后的语音数据进行特征提取,得到语音特征,基于语音特征进行语音识别,得到识别结果;(S2)根据识别结果生成初步转写文本,通过自适应动态文本优化算法对初步撰写文本进行优化,得到优化后的转写文本,同时在转写过程中通过优化加速算法优化转写效率。本发明公开的基于人工智能的语音转写加速方法,减少了背景噪声和其他干扰,提高了最终撰写文本的准确性和速度。
-
公开(公告)号:CN118573916A
公开(公告)日:2024-08-30
申请号:CN202410653553.0
申请日:2024-05-24
Applicant: 国家计算机网络与信息安全管理中心
IPC: H04N21/234 , H04N21/233 , H04N21/439 , H04N21/44 , G06V20/40 , G06F16/71 , G06F16/75
Abstract: 本发明属于音视频识别技术领域,尤其是一种基于互联网的音视频识别系统,针对现有的音视频识别系统在使用过程中,不便于对音视频内容进行实时智能识别监管,从而导致音视频内容质量无法得到保障的问题,现提出如下方案,其包括互联网模块;采集模块,所述采集模块与互联网模块连接,所述采集模块连接有信号处理模块,信号处理模块连接有特征提取模块,所述特征提取模块连接有分类模块,所述分类模块连接有智能识别模块;获取模块,所述获取模块连接有传输模块,所述传输模块连接有数据库模块,所述数据库模块连接有管理模块,本发明能够在使用过程中,便于对音视频内容进行实时智能识别监管,从而可以有效保障音视频内容质量。
-
公开(公告)号:CN116910754A
公开(公告)日:2023-10-20
申请号:CN202310947894.4
申请日:2023-07-31
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F21/56 , G06F16/33 , G06F16/35 , G06F16/36 , G06F40/295 , G06F40/30 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明属于应用程序技术领域,具体为一种基于知识图谱的高危App检测识别方法。本发明提供了基于知识图谱的高危App检测识别方法,包括数据采集:根据预设采集规则,面向境内主流的移动应用市场进行全网信息采集;采用代理自动切换和多线程并发策略,结合深度优先遍历、广度优先遍历、种子池搜索、ID索引等技术进行全量数据获取。无需人工干涉,系统自动捕获最新的应用版本,既能确保追踪应用信息的更新,又能确保捕获应用信息的新增,同时还不影响兼顾采集效率;通过借助构建的App知识图谱关联关系及纯文本语义关系,综合处理获取信息,实现对App多维度的风险检测评估,本发明以整体关联分析的方法处理,速度快且灵活性高。
-
公开(公告)号:CN117095673A
公开(公告)日:2023-11-21
申请号:CN202310830037.6
申请日:2023-07-07
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及语音识别领域,尤其为一种特定场景语音内容识别优化方法,包括如下步骤:包括如下步骤:S1:使用网络爬虫技术对网络中特定场景的语音进行爬取,获得初始语音数据;S2:提取初始语音数据并对初始语音数据进行数据预处理获得预处理数据;S3:通过卷积神经网络训练实用模型,对预处理数据进行语音识别并生成初始文本;S4:使用文本规范算法对初始文本进行文本润色保证输出最终文本的正确性。本发明通过对获取的语音进行预处理起到数据增强的作用保证了数据不失真,在获取到不失真的数据后对其进行特征提取确保了工作速度,对提取出的初始文本进行文本规范算法用常见的文本代替初始文本中出现的非人类语言,保证最后出现的文本不会出现错误。
-
-
-
-
-
-