-
公开(公告)号:CN111340661B
公开(公告)日:2020-12-01
申请号:CN202010107940.6
申请日:2020-02-21
Applicant: 电子科技大学 , 宜宾电子科技大学研究院
Abstract: 本发明公开了一种基于图神经网络的应用题自动解题方法,本发明首先使用循环神经网络编码输入的应用题文本,并同时构造数值单元图和数值比较图,循环神经网络的输出(词级表示)用作节点特征。节点特征与两个构造的图一起输入到基于图神经网络的编码器中,以学习题目的图表示特征,使最终的图特征能够包含数值的文本关系和大小信息。并将一个池化项用于将不同组的图特征聚合为一个,得到图转换器的输出。最后,将输出的图特征用作基于树结构的解码器的输入,以生成最终的求解表达式树。本发明通过丰富问题中的数值表征来提高任务性能,可以取得更好的解题效果。
-
公开(公告)号:CN111275694B
公开(公告)日:2020-10-23
申请号:CN202010081219.4
申请日:2020-02-06
Applicant: 电子科技大学 , 宜宾电子科技大学研究院
Abstract: 本发明公开了一种注意力机制引导的递进式划分人体解析系统及方法,提出的系统着重探索了显著性检测对于人体解析的增强作用,以及注意力机制对于人体解析的有效性。在网络结构上,构建了一个特征提取模块,有效提取特征信息,并融合多维度特征,增强了人体解析的效果;设计了适应性注意力模块,为特征进行位置注意力加权,并提供了融合不同水平特征的有效融合思路;最后以由底至上的方式整合了显著性检测和人体解析到一个端到端的网络结构中,并在各分支应用上述模块,获得了统一化的有效结构。性能超越了目前已知的方法,展现了最优人体解析效果。
-
公开(公告)号:CN111340661A
公开(公告)日:2020-06-26
申请号:CN202010107940.6
申请日:2020-02-21
Applicant: 电子科技大学 , 宜宾电子科技大学研究院
Abstract: 本发明公开了一种基于图神经网络的应用题自动解题方法,本发明首先使用循环神经网络编码输入的应用题文本,并同时构造数值单元图和数值比较图,循环神经网络的输出(词级表示)用作节点特征。节点特征与两个构造的图一起输入到基于图神经网络的编码器中,以学习题目的图表示特征,使最终的图特征能够包含数值的文本关系和大小信息。并将一个池化项用于将不同组的图特征聚合为一个,得到图转换器的输出。最后,将输出的图特征用作基于树结构的解码器的输入,以生成最终的求解表达式树。本发明通过丰富问题中的数值表征来提高任务性能,可以取得更好的解题效果。
-
公开(公告)号:CN111274493A
公开(公告)日:2020-06-12
申请号:CN202010051421.2
申请日:2020-01-17
Applicant: 电子科技大学 , 宜宾电子科技大学研究院
IPC: G06F16/9536 , G06K9/62 , G06F17/16
Abstract: 本发明提供了一种基于多源用户评论的评分预测方法,属于推荐系统领域。对用户历史消费记录进行数据预处理;根据用户-物品评分矩阵和相似度公式计算得到不同用户之间的相似度,使用相似度最高的相似用户撰写的相关评论对用户评论进行补充;接着提取评论特征;最后进行评论特征融合处理。本发明可以基于用户历史消费记录筛选出相似用户撰写的相关评论,对用户评论进行补充,为每位用户都构建一个用户评论补充文档,可以缓解用户评论的数据稀疏问题,丰富用户画像,提升评分预测的准确性,进而提高用户对推荐系统的满意度。此外,用户评论补充文档是由相似用户撰写的相关评论构成的,与用户自己撰写的评论存在一定的差异性,可以提高推荐的多样性。
-
公开(公告)号:CN117194710A
公开(公告)日:2023-12-08
申请号:CN202311228436.1
申请日:2023-09-21
Applicant: 电子科技大学 , 电子科技大学广东电子信息工程研究院
IPC: G06F16/735 , G06F16/783 , G06F16/9535 , G06N3/0455 , G06N3/0895
Abstract: 本申请实施例提出一种多粒度视频检索方法及装置,属于跨模态内容检索领域,通过该检索算法,基于待查询文本的句子级文本特征、视频库中每个视频数据的粗粒度视频特征和细粒度视频特征,进行多中心和多尺度的双分支协同特征处理,得到待查询文本与每个视频数据间的相似度数据,以此得到视频级检索对应的整体级视频和片段级检索对应的片段级视频的检索结果。检索算法采用双分支协同策略,设计粗粒度浏览分支和细粒度凝视分支,采用基于焦点引导的协同检索策略浏览分支和凝视分支,并引入混合协同对比学习策略,显著提高了弱监督条件下对完整视频的检索召回率以及对视频中的目标片段的定位精度。
-
公开(公告)号:CN111275694A
公开(公告)日:2020-06-12
申请号:CN202010081219.4
申请日:2020-02-06
Applicant: 电子科技大学 , 宜宾电子科技大学研究院
Abstract: 本发明公开了一种注意力机制引导的递进式划分人体解析模型及方法,提出的模型着重探索了显著性检测对于人体解析的增强作用,以及注意力机制对于人体解析的有效性。在网络结构上,构建了一个特征提取模块,有效提取特征信息,并融合多维度特征,增强了人体解析的效果;设计了适应性注意力模块,为特征进行位置注意力加权,并提供了融合不同水平特征的有效融合思路;最后以由底至上的方式整合了显著性检测和人体解析到一个端到端的网络结构中,并在各分支应用上述模块,获得了统一化的有效结构。性能超越了目前已知的方法,展现了最优人体解析效果。
-
公开(公告)号:CN117274866A
公开(公告)日:2023-12-22
申请号:CN202311228160.7
申请日:2023-09-21
Applicant: 电子科技大学 , 电子科技大学广东电子信息工程研究院
IPC: G06V20/40 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/0499 , G06N3/084 , G06N3/0895
Abstract: 本发明实施例提出一种音视频内容解析方法及装置,属于深度学习领域,对待解析音视频进行拆分、特征提取和特征融合,得到综合视觉特征和听觉特征,将听觉特征和综合视觉特征输入采用弱监督学习进行优化训练得到的解析算法,通过该解析算法,对听觉特征和综合视觉特征进行关于模态的建模和感知预测,得到待解析音视频中含有的动作事件以及每个动作事件所属的类别和模态。本申请的解析算法提出模态感知模块和时序感知模块,以能协同模态和时序进行证据挖掘,从而极大地减少模型对模态分类时产生的伪标签噪声的敏感性,提升模态依赖判定的鲁棒性和时序标注的准确性,并克服弱监督设置下时序标注缺失带来的不确定性问题。
-
公开(公告)号:CN115563327A
公开(公告)日:2023-01-03
申请号:CN202211050478.6
申请日:2022-08-30
Applicant: 电子科技大学 , 电子科技大学广东电子信息工程研究院
IPC: G06F16/532 , G06F16/55 , G06V10/82 , G06V10/74 , G06V10/774 , G06N3/04 , G06N3/08
Abstract: 本发明公开了基于Transformer网络选择性蒸馏的零样本跨模态检索方法,涉及计算机视觉中的零样本跨模态检索分支领域,解决现有过分专注于类别信息的学习会使得模型忽略实例级的差异,造成泛化能力的下降的技术问题,包括使用监督训练的方式对教师模型进行微调提高了预测的准确性,同时利用原型集构建的语义相似度矩阵对所述多模态分类模型进行选择性知识蒸馏提高模型的泛化能力,采用Transformer为基础结构的模型具有更全面的感受野以及更好的特征提取能力。同时基于实例级信息的原型集适应性调整也保证了模型实例级信息的学习。
-
公开(公告)号:CN111274493B
公开(公告)日:2020-09-08
申请号:CN202010051421.2
申请日:2020-01-17
Applicant: 电子科技大学 , 宜宾电子科技大学研究院
IPC: G06F16/9536 , G06K9/62 , G06F17/16
Abstract: 本发明提供了一种基于多源用户评论的评分预测方法,属于推荐系统领域。对用户历史消费记录进行数据预处理;根据用户‑物品评分矩阵和相似度公式计算得到不同用户之间的相似度,使用相似度最高的相似用户撰写的相关评论对用户评论进行补充;接着提取评论特征;最后进行评论特征融合处理。本发明可以基于用户历史消费记录筛选出相似用户撰写的相关评论,对用户评论进行补充,为每位用户都构建一个用户评论补充文档,可以缓解用户评论的数据稀疏问题,丰富用户画像,提升评分预测的准确性,进而提高用户对推荐系统的满意度。此外,用户评论补充文档是由相似用户撰写的相关评论构成的,与用户自己撰写的评论存在一定的差异性,可以提高推荐的多样性。
-
公开(公告)号:CN115099358B
公开(公告)日:2025-02-11
申请号:CN202210811954.5
申请日:2022-07-11
Applicant: 电子科技大学
IPC: G06V10/25 , G06V10/75 , G06V10/82 , G06V10/764 , G06N3/0464 , G06N3/0455
Abstract: 本发明公开的是基于字典创建与领域自适应的开放世界目标检测训练方法,涉及通信软件技术领域,解决了现有的开放世界目标检测局限于单一场景的问题,先引入图片描述数据集和多模态特征提取网络,对齐二者所输出的文本模态与视觉模态特征,同时引入多模态Transformer网络进行图像文本的文本匹配学习和文本掩码学习;将预训练阶段学习到的区域视觉特征提取模型和视觉映射文本层的参数迁移至目标检测模型中,输入来自两个领域数据集的图片,其中源域图片参与目标检测训练,目标域图片只参与全局领域自适应训练,在训练过程中将检测头的分类器权重替换为固定的已知类别的词向量,进行目标检测训练。
-
-
-
-
-
-
-
-
-