-
公开(公告)号:CN114677580A
公开(公告)日:2022-06-28
申请号:CN202210586762.9
申请日:2022-05-27
Applicant: 中国科学技术大学
Abstract: 本发明涉及图像描述技术领域,公开了一种基于自适应增强自注意力网络的图像描述方法,可以在几何层面和语义层面上对关系共同进行建模,当图像中两个物体之间存在明确的几何或者语义关系时,该方法可以自适应的增强给定图像中的视觉关系,实现高精度可信的图像描述生成。
-
公开(公告)号:CN114510653A
公开(公告)日:2022-05-17
申请号:CN202210419319.2
申请日:2022-04-21
Applicant: 中国科学技术大学
IPC: G06F16/9536 , G06Q50/00
Abstract: 本发明公开了一种社交群体推荐方法、系统、设备及存储介质,能够直接从用户社交网络中自动计算用户的社交影响力,并使用用户社交影响力增强群体推荐的准确性和传播能力;并且使用用户影响力扩散方法可以获得用户更深层次的特征表示,同时,在对群体的偏好建模时使用注意力机制学习决策过程中每个用户的影响力,从而更为有效的获得群体特征表示;最后通过联合学习的方式同时优化单用户推荐和群体用户推荐任务,提升社交群体推荐模型的性能,提高群体推荐的准确性,并提高群体推荐的传播能力。
-
公开(公告)号:CN114462559A
公开(公告)日:2022-05-10
申请号:CN202210387877.5
申请日:2022-04-14
Applicant: 中国科学技术大学
IPC: G06K9/62 , G06V10/764 , G06V10/774 , G06V10/74
Abstract: 本发明提供了一种目标定位模型训练方法、目标定位方法及装置,可以应用于人工智能技术领域。该目标定位模型训练方法包括:获取样本数据集;将每个图像样本输入初始模型的像素特征提取层,输出图像数据中每一个像素点的像素特征;将第一特征数据和第二特征数据输入初始模型的激活图生成层,输出前景激活图和背景激活图;将第三特征数据和第四特征数据分别输入初始模型的感知特征提取层,输出前景感知特征和背景感知特征;将第五特征数据和第六特征数据分别输入初始模型的分类层,输出分类结果;以及根据分类结果和图像类别标签调整初始模型的模型参数,得到训练完成的目标定位模型。
-
公开(公告)号:CN114332472A
公开(公告)日:2022-04-12
申请号:CN202111075962.X
申请日:2021-09-14
Applicant: 腾讯科技(深圳)有限公司 , 中国科学技术大学
IPC: G06V10/40 , G06V10/80 , G06V10/774 , G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本公开提供一种基于图神经网络的数据处理方法及装置,该基于图神经网络的数据处理方法包括:对第一对象的各个类别特征数据进行分组交互,并对分组交互结果进行特征融合以获得第一对象的局部交互特征;对第一对象的类别特征数据进行全局特征交互以获得第一对象的全局交互特征;将第一对象的局部交互特征与第一对象的全局交互特征进行特征融合处理以获得第一节点的第一进阶节点特征;第一图神经网络根据第一进阶节点特征对第一初阶图数据进行邻域聚合处理以获得第一进阶图数据。本公开提供的技术方案可以通过第一进阶图数据中的第一节点的节点特征充分表达第一对象的对象特征。
-
公开(公告)号:CN113128206A
公开(公告)日:2021-07-16
申请号:CN202110454046.0
申请日:2021-04-26
Applicant: 中国科学技术大学
IPC: G06F40/216 , G06F40/284 , G06F16/33
Abstract: 本发明公开了一种基于单词重要性加权的问题生成方法,对文本段落中的每个词进行词频分析,以获取每个词的重要程度,并对输入文本段落中的每个词构建与答案词之间的相对关系,以获取每个词对答案而言的重要性,最后利用词频分析特征与相对关系特征来训练问题生成模型,该方案能更有效地抓取段落中的关键信息生成问题文本,具有良好的应用前景。
-
公开(公告)号:CN109376767B
公开(公告)日:2021-07-13
申请号:CN201811103949.9
申请日:2018-09-20
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种基于深度学习的视网膜OCT图像分类方法,包括:构建卷积神经网络,其包含多个Inception段,每一个Inception段内包含若干Inception模块,且特定序号的Inception段外还插入了残差注意力模型,最后一个Inception段后端还依次设有全局平均池化层与softmax层;利用包含正常视网膜OCT图像与非正常视网膜OCT图像的训练集对所述卷积神经网络进行训练;利用训练好的卷积神经网络对新输入的视网膜OCT图像进行分类,获得分类结果。该方法可以自动实现视网膜OCT图像的准确分类。
-
公开(公告)号:CN111986179B
公开(公告)日:2021-07-06
申请号:CN202010851717.2
申请日:2020-08-21
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种脸部篡改图像检测器,包括:特征提取器,提取输入人脸图像的特征图;篡改区域定位模块,对特征图中每一个特征进行像素级别的分类,得到特征图分类后的掩膜,从而定位篡改区域并计算出篡改区域的特征;将人脸图像中除去篡改区域以外的区域作为原始区域,并计算原始区域的特征;不一致性度量模块,基于篡改区域的特征与原始区域的特征,计算篡改区域与原始区域的不一致性得分,根据不一致性得分来判断输入的人脸图像是否被篡改。上述方法利用图像内部篡改区域和未篡改区域间的不一致性进行脸部篡改图像检测,可取的较好的效果,并且检测是自动完成的,可以适用于大规模的视频平台、社交平台。
-
公开(公告)号:CN110378356B
公开(公告)日:2021-07-02
申请号:CN201910644312.9
申请日:2019-07-16
Abstract: 本发明公开了一种基于多目标拉格朗日正则的细粒度图像识别方法,包括:通过神经网络提取输入图像的图像特征X,得到相应的双线性图像A;从双线性图像A中获取规则化特征Y,构建包含矩阵平方根,低秩以及稀疏约束项的目标函数;引入两个辅助的变量来弱化三个约束项之间的关联性,并将目标函数转化为一个增广拉格朗日形式,再通过交替地优化每一个矩阵约束项来得到一个全局近似最优解;利用该全局近似最优解进行图像的识别分类。该方法仅仅包含矩阵乘法,因此能够很好地被GPU兼容,达到更快的识别速度,且该方法能够有效地对双线性图像表达同时进行平方根,低秩,和稀疏的正则约束,极大的提高了识别准确率。
-
公开(公告)号:CN113011312A
公开(公告)日:2021-06-22
申请号:CN202110278711.5
申请日:2021-03-15
Applicant: 中国科学技术大学
IPC: G06K9/00 , G06K9/62 , G06F16/78 , G06F16/783
Abstract: 本发明公开了一种基于弱监督文本引导的动作定位模型的训练方法,包括:分别对样本视频和样本文本进行特征提取,输出第一初始视频特征和第一初始文本特征;根据第一初始视频特征和第一初始文本特征计算得到第一对应性矩阵;利用第一处理方式对第一初始视频特征、第一初始文本特征和第一对应性矩阵进行处理,得到第一融合特征;利用第二处理方式对第一初始视频特征、第一初始文本特征和第一对应性矩阵进行处理,得到局部对应性矩阵;根据第一融合特征、局部对应性矩阵和第一初始文本特征训练初始动作定位模型,得到训练后的动作定位模型。
-
公开(公告)号:CN112927266A
公开(公告)日:2021-06-08
申请号:CN202110227890.X
申请日:2021-03-01
Applicant: 中国科学技术大学
Abstract: 本公开提供一种基于不确定性引导训练的弱监督时域动作定位方法,包括:对输入的视频进行特征提取,得到视频特征;对所述视频特征进行处理,得到目标任务适应的RGB特征和光流特征;对所述与目标任务适应的RGB特征和光流特征进行处理,得到对应的注意力权重后加权所述视频特征获得聚合的视频级特征;以及将所述聚合的视频级特征进行处理后得到视频级分类结果,完成动作定位。同时本公开还提供一种基于不确定性引导训练的弱监督时域动作定位系统。
-
-
-
-
-
-
-
-
-