-
公开(公告)号:CN112905827A
公开(公告)日:2021-06-04
申请号:CN202110183075.8
申请日:2021-02-08
Applicant: 中国科学技术大学
IPC: G06F16/583 , G06F16/33 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种跨模态图文匹配的方法、装置及计算机可读存储介质,方法包括:获取图像特征向量和句子特征向量;利用注意力机制聚合图像内的图像特征向量的上下文信息获得视觉短语和句子内的句子特征向量的上下文信息获得文本短语;计算视觉短语和文本短语的模态内相似度;通过交叉注意力层获取视觉短语在文本语义空间的特征表示和文本短语在视觉语义空间的特征表示,计算获得图像到句子的跨模态相似度和句子到图像的跨模态相似度;根据预设权重、模态内相似度和跨模态相似度计算获得图像到句子的综合相似度和句子到图像的综合相似度;根据综合相似度获得图像与句子的关联结果,本发明提供的方法具有匹配速度快、匹配准确性高的特点。
-
公开(公告)号:CN112818829A
公开(公告)日:2021-05-18
申请号:CN202110122080.8
申请日:2021-01-27
Applicant: 中国科学技术大学
Abstract: 本公开提供一种基于结构网络的弱监督时域动作定位方法,包括:对输入的视频进行特征提取,得到目标任务的适应性特征;构建视频片段关系全局网络模型并训练;构建动作局部结构网络模型并训练;以及在所述更具判断性的视频特征上进行每个视频片段的类别预测,形成多支结构感知类别激活序列并融合得到最终的类别激活序列,将最终的类别激活序列阈值化后得到每个类别的动作检测结果,从而实现基于结构网络的弱监督时域动作定位。
-
公开(公告)号:CN110753064B
公开(公告)日:2021-05-07
申请号:CN201911031332.5
申请日:2019-10-28
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种机器学习和规则匹配融合的安全检测系统,包括:离线部分与在线部分;其中:离线部分,利用带有标签的合法流量和恶意流量建立机器学习模型,并进行模型训练;在线部分,通过采集网络流量并进行预处理,然后,进行两部分处理:第一部分为,采用传统规则匹配的方式从预处理结果中检测恶意流量;第二部分为,对预处理结果进行特征提取,再利用离线部分训练得到的机器学习模型识别出恶意流量;最后,融合两部分处理的结果,实现恶意流量的拦截。该系统既能检测已知恶意流量又能检测未知恶意流量,最大程度的减少入侵检测系统的误报率和漏报率,从而保证计算机网络的安全。
-
公开(公告)号:CN112541501A
公开(公告)日:2021-03-23
申请号:CN202011502420.1
申请日:2020-12-18
Abstract: 本发明公开了一种基于视觉语言建模网络的场景文字识别方法,训练过程中,通过使视觉模型直接在被遮挡的文字图像特征中识别完整的词级结果,引导视觉模型根据视觉上下文信息推理出被遮挡的文字内容,从而赋予视觉模型语言能力;因此,在不需要引入额外语言模型结构的情况下,视觉模型自适应地在视觉上下文中捕捉语言信息来增强视觉特征,从而提升识别能力。并且,整个字符级掩码的生成过程只需要原有的词级标注,不需要引入额外的标注信息;测试过程中只使用了主干网络和视觉语义推理模块进行识别,因此位置感知的掩码生成模块只在训练过程中使用,不引入额外的计算开销。
-
公开(公告)号:CN112437016A
公开(公告)日:2021-03-02
申请号:CN202011264636.9
申请日:2020-11-11
Applicant: 中国科学技术大学先进技术研究院
IPC: H04L12/801 , H04L12/851 , G06N3/02 , G06N3/08
Abstract: 本发明公开了一种网络流量识别方法、装置、设备及计算机存储介质,该方法包括以下步骤:针对不同图模式的网络流量进行采集,并进行标注;预处理采集到的所述网络流量,提取每一个网络会话的特征信息;基于所述特征信息,生成数据流图;利用所述数据流图的数据对图神经网络进行训练,生成网络流量识别模型;将未知流量转换为数据流图的数据输入所述网络流量识别模型,所述网络流量识别模型将未知流量的数据流图和自身学习到的图模式进行匹配;当匹配程度大于预设阈值时,则判定所述未知流量对应的图模式,从而确定未知流量对应的网络应用。本发明解决网络流量识别正确率低的问题,实现利用图神经网络判定网络流量的图模式以及对应的网络应用。
-
公开(公告)号:CN110175655B
公开(公告)日:2020-12-25
申请号:CN201910476981.X
申请日:2019-06-03
Applicant: 中国科学技术大学
Abstract: 本发明提供了一种数据识别方法,包括:获取待识别特征数据,应用预先训练得到的识别模型对待识别特征数据进行识别;其中,所述待识别特征数据的识别过程,包括:将所述待识别特征数据输入至所述识别模型中,得到所述识别模型的隐含层输出的与所述待识别特征数据对应的输出向量;确定所述输出向量分别与预先设置的各个已知分类类型的中心向量的特征距离;将各个特征距离及与各个特征距离对应的威布尔分布参数输入至威布尔函数中,得到待识别特征数据分别与每个已知分类类型对应的概率值;依据各个概率值调整各个预先设置分类类型的分类权重;基于已调整的分类权重确定识别结果,能有效的确定待识别特征数据的分类类型,提高识别准确率。
-
公开(公告)号:CN112006654A
公开(公告)日:2020-12-01
申请号:CN202010685114.X
申请日:2020-07-16
Applicant: 中国科学技术大学 , 安徽省儿童医院(安徽省新华医院、安徽省儿科医学研究所)
Abstract: 本发明公开了一种基于卷积神经网络和多重注意力机制的骨骼年龄评估方法,包括:训练阶段,主干网络输入为掌骨影像,通过特征提取器获得特征图F,进而得到骨龄回归值;多重注意力模块输入为特征图F,经通过压缩操作与注意力图拆分操作得到M个子注意力图,每个子注意力图再与特征图F点乘,进而得到对应的骨龄回归值;结合主干网络与多重注意力模块得到的骨龄回归值,采用多任务学习策略训练神经网络;测试阶段,将待测掌骨影像输入至训练后的神经网络中,通过其中主干网络得到骨龄评估值。上述模型可被端到端训练;同时能自动生成注意力分布图,具有更好的泛化性;此外,基于2D卷积神经网络,速度快,精度高,平均评估误差在4.1个月内。
-
公开(公告)号:CN111986179A
公开(公告)日:2020-11-24
申请号:CN202010851717.2
申请日:2020-08-21
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种脸部篡改图像检测器,包括:特征提取器,提取输入人脸图像的特征图;篡改区域定位模块,对特征图中每一个特征进行像素级别的分类,得到特征图分类后的掩膜,从而定位篡改区域并计算出篡改区域的特征;将人脸图像中除去篡改区域以外的区域作为原始区域,并计算原始区域的特征;不一致性度量模块,基于篡改区域的特征与原始区域的特征,计算篡改区域与原始区域的不一致性得分,根据不一致性得分来判断输入的人脸图像是否被篡改。上述方法利用图像内部篡改区域和未篡改区域间的不一致性进行脸部篡改图像检测,可取的较好的效果,并且检测是自动完成的,可以适用于大规模的视频平台、社交平台。
-
公开(公告)号:CN111817710A
公开(公告)日:2020-10-23
申请号:CN202010724264.7
申请日:2020-07-24
IPC: H03K19/20
Abstract: 本发明公开了一种基于忆阻器的混合逻辑同或电路以及同或计算阵列,混合逻辑同或电路中,利用忆阻器存储数据,并和输入完成与逻辑计算,然后将该结果通过CMOS电路(CMOS或非门)完成更复杂的或非逻辑计算;将该电路扩展为阵列形式,从而得到多bit同或计算结果。该混合逻辑同或电路与传统同或门相比减少了4个晶体管,以及1个存储单元(如SRAM),实现了存算一体化,减少了数据的传输时间,整体功耗降低。
-
公开(公告)号:CN111144314B
公开(公告)日:2020-09-18
申请号:CN201911376257.6
申请日:2019-12-27
Abstract: 本发明公开了一种篡改人脸视频检测方法,包括:将人脸视频数据解码为一组连续的帧图像,并截取每一帧图像的人脸区域,按照帧序号对应保存为人脸图片;通过特征提取器提取每一人脸图片的,获得对应的特征图;将连续两帧的特征图,同时输入至至帧间相关性分类器,由帧间相关性分类器采用注意力机制将两帧的特征图融合在一起后进行分类,分类结果为输入的两帧被篡改的概率。该方法同时利用了帧图片自身的信息和与其相邻帧的帧间关系,可取的较好的效果。同时检测是自动完成的,可以适用于大规模的视频平台、社交平台。
-
-
-
-
-
-
-
-
-