-
公开(公告)号:CN119851264A
公开(公告)日:2025-04-18
申请号:CN202411921967.3
申请日:2024-12-25
Applicant: 安徽农业大学
IPC: G06V20/68 , G06V10/26 , G06V10/143 , G06V10/764 , G06V10/82 , G06N3/0455 , G06F18/25 , G06V10/25 , G06N5/04
Abstract: 本发明公开了一种基于多模态融合技术的复杂场景下苹果果实检测方法,包括:1、构建数据集;2、可见光图像与红外光图像特征融合;3、对融合得到的可见光图像特征进行掩码并与视觉特征进行融合;4、将融合后的视觉特征与文本特征融合;5、对可见光图像特征进行过滤;6、将可见光图像特征与文本特征输入到词‑区域相似度计算中;7、结合Soft‑NMS和Focal‑EIOU选取最优目标框。本发明将红外光图像、可见光图像、文本三种模态进行特征融合,综合考虑了不同模态的互补优势。并且利用软非极大值抑制(Soft‑NMS)和Focal‑EIOU来选取最优目标框,有效提高了复杂条件下苹果果实的检测精度。
-
公开(公告)号:CN119129611A
公开(公告)日:2024-12-13
申请号:CN202411264320.8
申请日:2024-09-10
Applicant: 安徽农业大学
Abstract: 本发明公开了一种基于全向注意力机制的翻译方法,涉及自然语言处理的技术领域,包括,收集和处理平行语料数据,通过知识蒸馏生成蒸馏数据集,利用蒸馏数据集训练自回归翻译模型并解决多模式问题,将自回归模型转换为非自回归模型并进行训练直至收敛,本发明通过引入全向注意力机制和课程学习策略,有效的解决了非自回归翻译模型中出现的多模式问题,显著提升了翻译质量和训练效率,从而实现了更准确的翻译输出效果。
-
公开(公告)号:CN117152736A
公开(公告)日:2023-12-01
申请号:CN202311139529.7
申请日:2023-09-05
Applicant: 安徽农业大学
IPC: G06V20/68 , G06V10/20 , G06V10/26 , G06V10/82 , G06V10/762 , G06N3/006 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及人工智能采摘技术领域,且公开了一种深度学习和群智能算法的水果采摘优化模型的方法,包括以下步骤:S1、收集自然环境下的水果果实图片作为训练数据,并对数据进行预处理;S2、设计一种改进U‑Net模型的CA U‑Net语义分割网络,将U‑Net模型的主干网络VGG16更换为轻量化的MobileNet‑V3结构;S3、将MoblieNet‑v3主干特征网络中的SE注意力机制模块替换为Coordinate Attention注意力机制。该深度学习和群智能算法的水果采摘优化模型的方法,通过利用计算机视觉技术实现图像分割的果实采摘顺序算法,提高了果实采摘效率和果实定位精度,解决了现有技术中采摘过程中的浪费和伤害,同时还能够避免果实的腐烂和损坏,无法提高果实的保质期和市场价值的问题。
-
公开(公告)号:CN115860875A
公开(公告)日:2023-03-28
申请号:CN202211671672.6
申请日:2022-12-26
Applicant: 安徽农业大学
IPC: G06Q30/0601 , G06F18/25 , G06F18/241
Abstract: 本发明涉及人工智能技术领域,且公开了一种基于双线性池化的多模态知识融合的商品推荐方法,包括提取用户在电商平台的行为数据,对收集的用户行为数据进行预处理,以及分析评估,用深度学习的图像特征采集器、文本特征采集器、时间序列特征采集器、音频特征采集器和视频特征采集器对收集的数据抽取特征,根据各种单模态特征采集器的特征利用双线性池化的多模态知识融合抽取模态交互的深层特征,通过对抽取的多模态融合的深层特征信息。该基于双线性池化的多模态知识融合的商品推荐方法,可以通过深度利用海量的多模态的用户数据,利用分层次双线性池化融合多模态特征,精准判断消费者的喜好准确推送意向商品。
-
公开(公告)号:CN115860875B
公开(公告)日:2025-05-09
申请号:CN202211671672.6
申请日:2022-12-26
Applicant: 安徽农业大学
IPC: G06Q30/0601 , G06F18/25 , G06F18/241
Abstract: 本发明涉及人工智能技术领域,且公开了一种基于双线性池化的多模态知识融合的商品推荐方法,包括提取用户在电商平台的行为数据,对收集的用户行为数据进行预处理,以及分析评估,用深度学习的图像特征采集器、文本特征采集器、时间序列特征采集器、音频特征采集器和视频特征采集器对收集的数据抽取特征,根据各种单模态特征采集器的特征利用双线性池化的多模态知识融合抽取模态交互的深层特征,通过对抽取的多模态融合的深层特征信息。该基于双线性池化的多模态知识融合的商品推荐方法,可以通过深度利用海量的多模态的用户数据,利用分层次双线性池化融合多模态特征,精准判断消费者的喜好准确推送意向商品。
-
公开(公告)号:CN118674997A
公开(公告)日:2024-09-20
申请号:CN202410948614.6
申请日:2024-07-16
Applicant: 安徽农业大学
IPC: G06V10/764 , G06V20/10 , G06V10/44 , G06V10/58 , G06V10/82 , G06N3/0464 , G06T7/13
Abstract: 本发明公开了一种基于多方向动态路由的高光谱图像分类方法,包括:1、获取高光谱图像公共数据集;2、对数据集进行降维处理及初步特征提取,并利用Cell模块构建多方向动态路由网络,取初始化层输出的特征作为网络输入,经由网络处理得到具有判别性的特征,将其输入分类器中得到地物类别预测概率;3、构建多类别交叉熵损失函数,利用梯度下降法对网络进行训练,同时计算损失函数以更新网络参数,直至损失函数收敛时停止训练,从而得到最优模型,完成高光谱图像精确分类。本发明能提高高光谱图像分类的精度,减少边界误分现象,从而能获得优越的分类结果。
-
公开(公告)号:CN119360123A
公开(公告)日:2025-01-24
申请号:CN202411650652.X
申请日:2024-11-19
Applicant: 安徽农业大学
IPC: G06V10/764 , G06V10/774 , G06V10/776 , G06V10/70 , G06V10/82 , G06N3/049 , G06N3/084 , G06N5/04
Abstract: 本发明公开了一种基于测试时间自适应的图像分类方法,涉及计算机视觉技术领域,具体包括:步骤1:对测试图像数据集合进行破坏性转换;步骤2:通过预训练的分类器f得到伪标签概率分布,构建伪标签概率差异损失;步骤3:计算伪标签概率差异分数,根据伪标签概率差异分数筛选测试图像集合,步骤4:将筛选后的图像输入能量模型,从而得到能量分数和概率密度;步骤5:构建能量优化目标;步骤6:通过伪标签概率差异损失和能量优化目标构建联合优化目标,用于训练测试时间自适应模型,以实现图像分类。本发明将伪标签概率差异引入能量模型,分别从能量和形状信息两个角度对测试数据进行感知,提高了模型在测试图像集合上的分类准确度。
-
公开(公告)号:CN117953374A
公开(公告)日:2024-04-30
申请号:CN202410098762.3
申请日:2024-01-24
Applicant: 安徽农业大学
IPC: G06V20/10 , G06V20/40 , G06V10/764 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N3/045 , G06T7/277
Abstract: 本发明公开了一种灌木型农作物生长质量智能监测方法及系统,属于农作物生长监测技术领域。本发明包括如下步骤:S1、构建茶叶图像数据集;S2、设计算法及灌木型农作物目标检测;S3、构建灌木型农作物叶芽跟踪数据集:基于S1中所采集的茶树视频资料,对视频帧内每一叶芽目标进行逐帧标注,构建灌木型农作物叶芽跟踪数据集;S4、设计灌木型农作物叶芽跟踪方法;S5、设计灌木型农作物叶芽计数方法。本发明还进一步提出了与方法相匹配的智能监测系统。本发明应用了深度学习对灌木型农作物的生长状况进行监控,解决了大多依赖于农业从业者的经验判断,避免了人工检测劳动强度大,结果易受个人主观判断的影响,确保了评估的准确性和时效性。
-
公开(公告)号:CN116778391A
公开(公告)日:2023-09-19
申请号:CN202310828903.8
申请日:2023-07-07
Applicant: 安徽农业大学
IPC: G06V20/40 , G06V10/82 , G06Q50/02 , G06N3/0464 , G06N3/08 , G06N3/0442
Abstract: 本发明公开了一种多模态作物病害表型协同分析模型、装置及模型构建系统,方法包括:构建基于改进CNN和LSTM的作物病害表型文本生成模型,通过组建的多模态训练数据集,对其进行训练;基于改进CNN和LSTM的作物病害表型文本生成模型通过组建的多模态训练数据集,对其进行训练;构建基于查询文本引导和多阶段推理的视觉语言定位模型(MQVL)通过组建的多模态训练数据集,对其进行训练;构建基于CNN‑Transformer双流多模态少样本识别模型(CTMF)通过组建的多模态训练数据集,对其进行训练。
-
公开(公告)号:CN117456279A
公开(公告)日:2024-01-26
申请号:CN202311623115.1
申请日:2023-11-30
Applicant: 安徽农业大学
IPC: G06V10/764 , G06V20/00 , G06N5/022 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种融合知识图谱与图像识别的垃圾分类方法,包括:1、构建知识图谱,捕捉垃圾实体与种类之间的关系2、利用Ac自动机树,提取问题中的垃圾实体名;3、利用TransR模型提取垃圾实体的文本向量;4、设定疑问词列表,提取问题中的疑问词,根据疑问词是否在疑问词列表中和问题中是否有垃圾实体名来对问题进行分类;5、针对不同类型的问题,返回不同的答案模板;6、构建图像识别模型,获取垃圾图片的向量;7、将垃圾实体的文本向量和图片向量,结合注意力机制将相互对应的向量进行拼接,得到垃圾实体的融合向量后,最终返回垃圾的类别。本发明融合了知识图谱和图像识别,能更稳定、更便捷、更高效的实现垃圾分类。
-
-
-
-
-
-
-
-
-