-
公开(公告)号:CN118585608A
公开(公告)日:2024-09-03
申请号:CN202410750428.1
申请日:2024-06-12
申请人: 国家计算机网络与信息安全管理中心 , 烟台中科网络技术研究所
IPC分类号: G06F16/33 , G06F16/35 , G06F18/2415 , G06F40/30 , G06F9/50
摘要: 本发明涉及人工智能进行自然语言处理技术领域,尤其涉及一种短文本智能分析与分类优化方法,包括以下步骤:S1:对短文本信息进行初步处理,得到初步处理后的短文本信息;S2:引入均衡负载数据分片算法将初步处理后的短文本信息进行数据分片并存储至多个节点k,利用分布式分散处理算法实现数据并行处理;S3:引入语境深度理解算法,优化短文本信息分类的准确率;S4:各节点k利用优化自然语言处理算法对分得的短文本分片数据进行智能分析,并确定其所属类别;S5:汇总并分析全部节点k上的分类结果,得到短文本信息的最终分析与分类结果,本方法提高了短文本信息处理分析与分类中的效率及准确率。
-
公开(公告)号:CN113132383A
公开(公告)日:2021-07-16
申请号:CN202110421317.2
申请日:2021-04-19
申请人: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
摘要: 本发明涉及大数据技术领域。本发明公开了一种网络数据采集系统,该系统包括服务器,服务器包括:任务下发模块,用于创建用户信息获取任务,将用户信息获取任务分配至不同的任务池,计算任务池优先级,根据任务下发规则,得到并传输具有优先级参数的用户信息获取任务;数据解析模块,与任务下发模块数据连接,用于获取来自中间代理服务端的用户信息流量数据,数据解析模块构建报文解析神经网络模型,将待解析报文信息输入训练后报文解析神经网络模型,判断待解析报文信息中是否包括指定用户信息并提取。通过设置任务优先级,优先处理重要的任务,提高任务处理效率。本公开实施例还公开了一种网络数据采集方法。
-
公开(公告)号:CN112990220B
公开(公告)日:2022-08-05
申请号:CN202110417894.4
申请日:2021-04-19
申请人: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
摘要: 本发明涉及人工智能技术领域,特别涉及一种图像中目标文本智能识别方法。该方法步骤如下:将目标文本由像素点坐标表示,输入目标文本像素点坐标值对像素坐标识别神经网络进行训练,获得文本自编码模型和目标文本的表述特征;根据区域的高度值计算背景区域数量,提取覆盖背景区域,剩余区域为前景区域;利用训练好的文本自编码模型在前景区域中获得待识别的文本的表述特征,将文本的表述特征与期望的目标文本的表述特征进行对比判断,若两者误差达到预设阈值,则识别文字为目标文本。本发明还提供一种图像中目标文本智能识别系统。本发明通过基于文本自编码模型来识别目标文本,能够精准定位目标文本在图像中的位置,计算复杂度低,识别准确率高。
-
公开(公告)号:CN113132383B
公开(公告)日:2022-03-25
申请号:CN202110421317.2
申请日:2021-04-19
申请人: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
IPC分类号: H04L69/22 , H04L67/562 , G06N3/08
摘要: 本发明涉及大数据技术领域。本发明公开了一种网络数据采集系统,该系统包括服务器,服务器包括:任务下发模块,用于创建用户信息获取任务,将用户信息获取任务分配至不同的任务池,计算任务池优先级,根据任务下发规则,得到并传输具有优先级参数的用户信息获取任务;数据解析模块,与任务下发模块数据连接,用于获取来自中间代理服务端的用户信息流量数据,数据解析模块构建报文解析神经网络模型,将待解析报文信息输入训练后报文解析神经网络模型,判断待解析报文信息中是否包括指定用户信息并提取。通过设置任务优先级,优先处理重要的任务,提高任务处理效率。本公开实施例还公开了一种网络数据采集方法。
-
公开(公告)号:CN112990220A
公开(公告)日:2021-06-18
申请号:CN202110417894.4
申请日:2021-04-19
申请人: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
摘要: 本发明涉及人工智能技术领域,特别涉及一种图像中目标文本智能识别方法。该方法步骤如下:将目标文本由像素点坐标表示,输入目标文本像素点坐标值对像素坐标识别神经网络进行训练,获得文本自编码模型和目标文本的表述特征;根据区域的高度值计算背景区域数量,提取覆盖背景区域,剩余区域为前景区域;利用训练好的文本自编码模型在前景区域中获得待识别的文本的表述特征,将文本的表述特征与期望的目标文本的表述特征进行对比判断,若两者误差达到预设阈值,则识别文字为目标文本。本发明还提供一种图像中目标文本智能识别系统。本发明通过基于文本自编码模型来识别目标文本,能够精准定位目标文本在图像中的位置,计算复杂度低,识别准确率高。
-
公开(公告)号:CN117574412B
公开(公告)日:2024-04-02
申请号:CN202410060420.2
申请日:2024-01-16
发明人: 贾云刚 , 王建礼 , 刘铭 , 许光全 , 李鹏霄 , 崔婧怡 , 刘健 , 段东圣 , 井雅琪 , 赵曦滨 , 赵志云 , 赵淳璐 , 贺欣 , 马宏远 , 张震 , 高一骄 , 武南南 , 孙捷 , 孙海亮 , 刘秀龙
摘要: 本申请实施例提供一种多方隐私求交方法、装置和电子设备,涉及数据处理技术领域,应用于目标参与方,多个参与方包括目标参与方和其他参与方,该方法包括:依次接收其他参与方发送的多个隐私信息,各隐私信息包括其他参与方的签名信息和第一哈希表数据片段;基于多个隐私信息中的签名信息,对其他参与方的身份进行验证;在其他参与方的身份验证通过的情况下,基于多个第一哈希表数据片段和目标参与方的哈希表数据,确定其他参与方和目标参与方之间的隐私求交结果。这样在计算多个参与方的隐私求交结果时,可以有效地实现隐私求交结果的计算效率和参与方之间的通信效率的平衡。
-
公开(公告)号:CN118568487A
公开(公告)日:2024-08-30
申请号:CN202410548464.X
申请日:2024-05-06
IPC分类号: G06F18/214 , G06F18/25 , G06F18/2431 , G06N3/042
摘要: 本申请实施例提供一种多模态轻量级动态知识增强方法、装置及存储介质,所述方法包括:基于图像小样本集的向量表征和文本小样本集的向量表征,以多模态视觉码书的形式构建图像小样本知识库和文本小样本知识库;基于单模态搜索的方式从所述图像小样本知识库或所述文本小样本知识库中确定待融合表征的跨模态表征,融合所述待融合表征和所述跨模态表征,得到知识增强后的融合表征。本申请实施例提供的多模态轻量级动态知识增强方法、装置及存储介质,在现有大规模预训练多模态模型的强大表征学习基础上,融合罕见且细粒度的跨模态表征信息,以此提高原始表征的质量,并显著提升对特定信息的检索效率。
-
公开(公告)号:CN116127964A
公开(公告)日:2023-05-16
申请号:CN202211600947.7
申请日:2022-12-13
IPC分类号: G06F40/284 , G06F40/30 , G06F16/35 , H04L9/40 , H04W12/12
摘要: 本发明公开了一种融合传播关系的诈骗信息的检测方法。该方法包括:获取第一信息组、诈骗账号库以及正常账号库,其中第一信息组中的每一个信息包括文本信息和发信账号;根据诈骗账号库和正常账号库从第一信息组中确定第二信息组,其中第二信息组中的每一个信息的发信账号在诈骗账号库和正常账号库中都不存在;根据第二信息组得到多个目标信息组,其中每一个目标信息组中的第一发信账号与第二发信账号的相似文本信息的数量大于第一阈值;计算每一个目标信息组的诈骗权重值;在目标信息组的诈骗权重值大于第二阈值的情况下,将目标信息组中的每一个文本信息确定为诈骗信息。本发明解决了对大量诈骗信息进行检测时,处理效率低的技术问题。
-
公开(公告)号:CN117632041A
公开(公告)日:2024-03-01
申请号:CN202410102237.4
申请日:2024-01-25
申请人: 国家计算机网络与信息安全管理中心天津分中心 , 国家计算机网络与信息安全管理中心 , 南开大学
发明人: 贾云刚 , 刘健 , 刘铭 , 许光全 , 闫莉莉 , 李鹏霄 , 光炫 , 贺欣 , 朱佳伟 , 李晓华 , 赵志云 , 井雅琪 , 吕东 , 马宏远 , 张震 , 段东圣 , 高一骄 , 刘秀龙 , 孙捷 , 孙海亮
IPC分类号: G06F3/06 , G06F11/10 , H04L67/1097
摘要: 本发明提供一种基于再生码的分布式存储方法、装置和电子设备,属于分布式存储技术领域。该方法包括:获取待存储的原始数据,确定原始数据对应的原始数据向量;确定分布式存储系统中各系统节点的编码矩阵以及分布式存储系统中各校验节点的编码矩阵;基于各系统节点的编码矩阵和原始数据向量分别确定各系统节点存储的第一再生码数据向量;基于各校验节点的编码矩阵和原始数据向量分别确定各校验节点存储的第二再生码数据向量。将第一再生码数据向量发送至对应的系统节点进行存储,将第二再生码数据向量发送至对应的校验节点进行存储。本方案通过以向量为单位进行存储,通信过程中是对每个单位向量整体进行编解码,节约了计算资源。
-
公开(公告)号:CN116962996A
公开(公告)日:2023-10-27
申请号:CN202311222480.1
申请日:2023-09-21
申请人: 国家计算机网络与信息安全管理中心
IPC分类号: H04W4/12 , H04W4/08 , H04L51/063 , H04L51/214 , H04L51/52 , H04L51/56 , G06N3/006
摘要: 本发明提供一种基于粒子群算法的信息传播预测方法、装置和设备,属于信息处理技术领域,该方法包括:确定在第一时刻目标信息对应的各个类型的用户的数量;其中,各个类型的用户对目标信息的信任程度和/或传播方式不同;根据第一时刻目标信息对应的各个类型的用户的数量和信息传播模型,确定目标信息的传播预测结果;目标信息的传播预测结果中包括在第二时刻目标信息对应的各个类型的用户的数量;信息传播模型用于对信息在传播过程中各个类型用户数量的变化情况进行预测。本发明的方法实现了对目标信息传播过程中各类型用户数量变化情况的准确预测,提升了信息传播预测结果的准确性。
-
-
-
-
-
-
-
-
-