-
公开(公告)号:CN112990220B
公开(公告)日:2022-08-05
申请号:CN202110417894.4
申请日:2021-04-19
Applicant: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心
Abstract: 本发明涉及人工智能技术领域,特别涉及一种图像中目标文本智能识别方法。该方法步骤如下:将目标文本由像素点坐标表示,输入目标文本像素点坐标值对像素坐标识别神经网络进行训练,获得文本自编码模型和目标文本的表述特征;根据区域的高度值计算背景区域数量,提取覆盖背景区域,剩余区域为前景区域;利用训练好的文本自编码模型在前景区域中获得待识别的文本的表述特征,将文本的表述特征与期望的目标文本的表述特征进行对比判断,若两者误差达到预设阈值,则识别文字为目标文本。本发明还提供一种图像中目标文本智能识别系统。本发明通过基于文本自编码模型来识别目标文本,能够精准定位目标文本在图像中的位置,计算复杂度低,识别准确率高。
-
公开(公告)号:CN109241438B
公开(公告)日:2022-06-24
申请号:CN201811128658.5
申请日:2018-09-27
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535 , G06F40/30 , G06F40/284
Abstract: 本发明公开了一种基于要素的跨通道热点事件发现方法、装置及存储介质,本发明融合某一领域的新闻报道数据与微博数据,通过联合两个通道提取的要素与文本语义相似度分析,有利于发现该领域热点事件,并且更全面细致的了解热点事件。
-
公开(公告)号:CN114626425A
公开(公告)日:2022-06-14
申请号:CN202011456860.8
申请日:2020-12-10
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06K9/62 , G06F40/289 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种面向噪声文本的多视角交互匹配方法及电子装置,包括对两段待匹配噪声文本分别编码,得到两段编码向量序列,并向两段编码向量序列的每个编码向量中加入位置信息;对加入位置信息的两段编码向量序列进行内部交互,分别得到两段内部交互结果;对两段内部交互结果进行外部交互,分别构建两个双向的噪声文本交互矩阵;拼接两个噪声文本交互矩阵,判断两个待匹配噪声文本是否匹配。本发明采用注意力机制捕获噪声文本之间的双向匹配模式,受噪声文本中句子的逻辑顺序影响较小,增加文本有效语义单词影响,提高模型时间效率及噪声文本匹配效果,避免传递匹配问题。
-
公开(公告)号:CN114625978A
公开(公告)日:2022-06-14
申请号:CN202011454130.4
申请日:2020-12-10
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F16/9536 , G06K9/62 , G06N3/04 , G06N3/08 , G06Q50/00
Abstract: 本发明提供一种基于类型感知的异质网络用户锚链接预测方法及电子装置,包括收集待检测网络和目标网络的网络信息,构建待检测异质网络和目标异质网络;获取每一节点各维度的初始特征向量,得到每个节点的初始特征向量表示;将初始特征向量表示输入基于自注意力图神经网络进行学习,计算各节点的类型感知向量和类型融合向量;通过待检测异质网络和目标异质网络中各节点对之间属于同一类型的类型感知向量及类型融合向量的相似度,判断待检测网络和目标网络是否为锚链接。本发明采用注意力机制捕获节点与类型信息之间影响,利用图注意力网络学习类型感知向量和类型融合向量,解决异质网络中对多种类型信息建模的问题,取得较好的锚链接预测效果。
-
公开(公告)号:CN114461931A
公开(公告)日:2022-05-10
申请号:CN202111573021.9
申请日:2021-12-21
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F16/9537 , G06K9/62 , G06N3/04 , G06Q10/04
Abstract: 本发明涉及一种基于多关系融合分析的用户轨迹预测方法和系统。该方法根据用户的历史轨迹相似关系和位置邻近关系,构建轨迹关系图,然后基于轨迹关系图中用户间的关系,利用融入注意力机制的轨迹预测模型对目标用户的未来轨迹进行预测。本发明充分考虑了用户出行具有的时间规律性特征,并充分挖掘了人群中的社会行为信息,预测精度具有明显的提高;本发明使用融入注意力机制的轨迹关系图来计算影响力大小,融入了不同用户对轨迹影响的差异,更加符合实际情况;本发明不仅利用了位置相邻的行人的轨迹行为信息,也考虑了历史轨迹相似用户的轨迹情况,将两种影响人群结合在一起构建轨迹关系图,解决了怎样对多种类型信息进行建模的问题。
-
公开(公告)号:CN113672963A
公开(公告)日:2021-11-19
申请号:CN202111002320.7
申请日:2021-08-30
Applicant: 国家计算机网络与信息安全管理中心 , 恒安嘉新(北京)科技股份公司
Inventor: 佟玲玲 , 时磊 , 段东圣 , 井雅琪 , 段运强 , 任博雅 , 周强 , 赵天夫 , 傅强 , 蔡琳 , 阿曼太 , 梁彧 , 马寒军 , 田野 , 王杰 , 杨满智 , 金红 , 陈晓光
IPC: G06F21/60
Abstract: 本申请实施例公开了一种基于彩虹表的匹配方法、装置、存储介质及电子设备。该方法包括:获取移动应用的目标数据;其中,所述目标数据用于表征加密后的移动应用数据;所述目标数据包括文本数据、图片数据、语音数据以及视频数据中的至少一种;所述移动应用用于表征采用端对端通讯方式的应用;利用预先配置的彩虹表,对所述目标数据进行匹配,获得目标关键词;其中,所述彩虹表中包括关键词链表的初始关键词和结束关键词,用于破解加密关键词。本技术方案,能够支持移动应用关键词匹配,并且不需要解密移动应用通信信息内容,保护了用户隐私。且对移动应用匹配具备快速部署的优势。
-
公开(公告)号:CN110879856A
公开(公告)日:2020-03-13
申请号:CN201911180128.X
申请日:2019-11-27
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F16/901 , G06F16/906 , G06F16/909 , G06K9/62 , G06Q50/00
Abstract: 本发明公开了一种基于多特征融合的社交群体分类方法及系统。本方法为:1)对一目标社交群体的数据集,对该数据集中各用户的轨迹数据进行预处理,去除噪声并对缺失位置信息进行插值;2)使用频繁序列挖掘算法从各用户轨迹数据中挖掘对应用户的轨迹模式,再将用户的轨迹模式看作时序序列,采用LSTM对该时间序列进行编码,得到用户的轨迹编码;3)根据所述社交关系生成一图网络,将所述社交关系投影到低维空间,学习得到各用户的嵌入表示;4)将每一用户的轨迹编码和对应用户的嵌入表示结合输入softmax层,确定各用户的类别,实现对该目标社交群体的分类。本发明大大提升了群体分类的精度。
-
公开(公告)号:CN110610230A
公开(公告)日:2019-12-24
申请号:CN201910698120.6
申请日:2019-07-31
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种台标检测方法、装置及可读存储介质,该方法包括如下步骤:获取台标数据集,并对所述台标数据集进行分组获得台标训练集;构建多损失融合的孪生神经网络,并基于所述台标训练集对所构建的多损失融合的孪生神经网络进行训练获得训练后的多损失融合的孪生神经网络;通过所述训练后的多损失融合的孪生神经网络对待测台标进行检测。本发明方法通过构建孪生神经网络框架,很好地消除了样本数量不足对训练网络带来的影响,可以更好地检测未知的新的种类的敏感台标。
-
公开(公告)号:CN109471932A
公开(公告)日:2019-03-15
申请号:CN201811415780.0
申请日:2018-11-26
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/332 , G06F16/35 , G06F17/27 , G06N3/08
Abstract: 本发明公开了一种基于学习模型的谣言检测方法、系统及存储介质,其中检测方法包括:构建新闻语料库;构建博文语料库;对新闻语料库中的数据进行模型训练,获得第一分类器模型;对博文语料库中的数据进行特征提取,获得训练特征,利用训练特征进行模型训练获得第二分类器模型;利用第一分类器模型和第二分类器模型对社交平台中的博文数据进行谣言检测。本发明通过对新闻数据中的谣言和非谣言数据进行采集构建新闻语料库,再进行模型训练获得第一训练模型;再对社交平台中的谣言和非谣言数据进行采集构建博文语料库,再进行模型训练获得第二训练模型,最后利用两个训练模型对社交平台中的数据进行谣言检测,使最终的检测结果更加准确可靠。
-
公开(公告)号:CN104361037B
公开(公告)日:2017-12-19
申请号:CN201410591807.7
申请日:2014-10-29
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种微博分类方法及装置。该方法包括:步骤1,对训练语料集合进行预处理,对预处理后的训练语料进行分词,获取候选特征,并对候选特征进行权重计算,根据权重计算结果进行特征选择,获取最终的分类特征;步骤2,根据最终的分类特征,采用贝叶斯分类器进行模型训练,获取分类模型;步骤3,采用贝叶斯分类器根据分类模型对微博文档进行分类。借助于本发明的技术方案,提高了分类的召回率与准确率。
-
-
-
-
-
-
-
-
-