-
公开(公告)号:CN119961385A
公开(公告)日:2025-05-09
申请号:CN202311452517.X
申请日:2023-11-03
Applicant: 电子科技大学长三角研究院(湖州)
IPC: G06F16/3329 , G06F16/334 , G06F16/353 , G06F40/205 , G06F18/2415 , G06N3/045 , G06N3/08
Abstract: 对话系统中按照建模方式可以分为两种:基于流水线的方法和基于端到端的方法。然而在基于流水线的方法中,各个模块只能分别优化,存在误差叠加问题,基于端到端的方法利用历史对话来直接生成系统回复。但由于基于端到端方法的对话系统没有全面考虑知识库中的信息,限制了任务型对话系统的效果。本文提出一种基于预训练自回归语言模型的任务型问答系统,将传统的基于流水线的对话系统中的各个模块集成到了单一的自回归语言模型中,并采用自回归语言模型的解析方式依次生成各个模块的结果,直到生成最终的系统回复。
-
公开(公告)号:CN119025634A
公开(公告)日:2024-11-26
申请号:CN202410907713.X
申请日:2024-07-08
Applicant: 电子科技大学
IPC: G06F16/332 , G06N3/045 , G06F40/289 , G06F40/30 , G06N3/0985 , G06N3/0442 , G06F16/35 , G06N3/047 , G06F16/36
Abstract: 本发明旨在解决现有方法在处理多轮对话场景中存在的问题和挑战。为了实现更好的多轮对话的场景,本发明对RCGT进行了轻量化改进,提出了RCGT‑MT(Multi‑Turn)的模型方案,具体技术方案包括:为了缓解下游的对话管理模块的差错累积问题,以及针对历史对话上下文信息没有得到充分利用的问题,本发明对历史对话上下文信息进行编码,并引入历史对话上下文注意力机制,对历史对话和对话行为进行编码,并通过上下文注意力机制聚合历史对话中的信息,为自然语言理解任务引入更丰富的信息,以缓解多轮对话中的差错累积和歧义问题。针对用户输入在不同领域的语境中存在歧义和缺少背景知识的问题,本发明采用了外部知识库用于引入专业的领域知识,特别是在用户提出的问题需要特定的背景信息才能正确理解时,能够帮助模型更好地理解用户的意图,并缓解歧义问题。为了解决随着对话轮次增加导致的历史上下文信息利用不充分的问题,本发明引入了全局注意力机制,用于计算每一轮历史对话信息的权重,更充分高效地实现历史对话信息的利用。
-
公开(公告)号:CN118862962A
公开(公告)日:2024-10-29
申请号:CN202410911685.9
申请日:2024-07-09
Applicant: 电子科技大学
IPC: G06N3/0455 , G06N3/0464 , G06N3/084 , G06V10/52 , G06V20/70 , G06V40/10 , G06V10/80 , G06V40/20 , G06V10/764
Abstract: 本发明致力于解决复杂背景下的人与物体交互检测难题。本发明对基于多尺度上下文聚合的多重关系复用网络进行了改进,具体技术方案包括:空间感知合并模块、人体姿态融合模块以及细粒度锚点解码。针对空间感知合并模块,它充分利用了编码后多尺度特征中包含的空间结构和层级信息,通过与内容嵌入的深度融合与对齐,确保模型能够精确捕捉不同空间层级间的关联及交互细节。针对人体姿态融合模块,本发明引入人体姿态信息作为交互意图的补充表示,使模型自适应学习并关注关键的人体关节特征而无需额外标注。针对细粒度锚点解码,细粒度锚点作为位置先验,引导解码器关注特定的兴趣区域,并直接将语义信息融入内容嵌入中,后者用于预测HOI实例。
-
公开(公告)号:CN118840783A
公开(公告)日:2024-10-25
申请号:CN202410876243.5
申请日:2024-07-02
Applicant: 电子科技大学
IPC: G06V40/20 , G06V20/64 , G06V10/80 , G06V10/82 , G06V10/764 , G06V10/766 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于交互式时空Transformer的三维姿态估计方法。本发明以PoseFormer模型从二维升维到三维时存在的局部性不足问题为说明案例,针对其对序列关节点局部信息的关注不足的问题,提出了基于交互式时空Transformer的三维姿态估计方法。在空间Transformer模块中增加交叉关节点交互单元,在时间Transformer模块中增加交叉帧交互单元,提高了二维姿态到三维姿态估计的准确率。
-
公开(公告)号:CN118821852A
公开(公告)日:2024-10-22
申请号:CN202410911680.6
申请日:2024-07-09
Applicant: 电子科技大学
IPC: G06N3/0455 , G06N3/0464 , G06N5/04 , G06V10/52 , G06V10/42 , G06V10/44 , G06V10/82 , G06V40/20 , G06V10/25 , G06V10/764 , G06V20/70
Abstract: 本发明涉及计算机视觉与深度学习技术的前沿领域,提出了一种基于多尺度上下文聚合与多重关系复用的创新网络架构。该网络通过精心设计,能够高效地整合图像中不同尺度的上下文信息,从全局背景到局部细节进行全面捕捉,进而提升对复杂场景的理解能力。同时,网络内部实现了多重关系的复用,增强了跨层级特征之间的交互与融合,有效提升了图像识别、分割及增强等任务的精度与效率。特别地,在人体‑物体交互(HOI)检测等高级视觉任务中,本发明的网络展现出卓越的性能,为相关领域的研究与应用提供了强有力的技术支撑。
-
公开(公告)号:CN118821847A
公开(公告)日:2024-10-22
申请号:CN202410911683.X
申请日:2024-07-09
Applicant: 电子科技大学
IPC: G06N3/045 , G06N3/0464 , G06N3/08 , G06V10/764 , G06V10/52 , G06V10/80 , G06V20/70 , G06V10/82 , G06V10/25
Abstract: 本发明针对小样本任务提出了一种创新性方法,集成了多尺度特征关系的度量学习、特征金字塔机制与多尺度特征关系度量网络,以增强分类性能。具体地,该方法通过提取具有高度区分性的特征并学习样本间的多尺度关系得分,利用“转换模块”在所构建的模型中融合不同尺度的特征,有效对接高层次抽象语义与低层次详细视觉特征,确保全局上下文与局部细节的均衡考虑。此外,设计的多尺度特征关系度量网络利用这些多尺度特征计算样本间精细关系得分,指导查询集目标的类别划分,从而在小样本条件下显著提升分类精度与泛化能力,为计算机视觉及模式识别领域的挑战提供了综合优化的解决方案。
-
公开(公告)号:CN116698073A
公开(公告)日:2023-09-05
申请号:CN202310910025.4
申请日:2023-07-24
Applicant: 电子科技大学
IPC: G01C21/34
Abstract: 本发明属于导航技术领域,具体提供一种基于改进蚁群算法的车辆路径规划方法,用以克服传统蚁群算法在车辆路径规划任务中的诸多不足。本发明首先采用栅格法对车辆行驶环境进行三维地形建模;然后,充分考虑车辆在三维地形环境中行驶所面临的坡度及海拔高度因素带来的代价,构建包含行驶距离代价项、坡度代价项与高度代价项的车辆行程总代价函数,并将其引入信息素更新规则中对蚁群算法进行改进,使改进蚁群算法在车辆路径规划的应用中更为合理有效;同时设计行程方向引导函数,并将其引入状态概率转移公式中对蚁群算法进行改进,有效缓解了传统蚁群算法在初期搜索盲目性强的问题;最后,基于改进蚁群算法在三维地形模型中完成车辆路径规划。
-
公开(公告)号:CN115801489A
公开(公告)日:2023-03-14
申请号:CN202211368437.1
申请日:2022-11-03
Applicant: 电子科技大学长三角研究院(湖州)
IPC: H04L12/28 , H04L67/025
Abstract: 本发明公开了一种基于单片机的智能家居控制器设计方法,搭建了系统的总体框架,研究系统的总体功能,并且提供了与其相配套的手机APP,用手机就可以实现对简单家具的智能化控制。该设计主要以STM32单片机为核心处理器,用传感器设备来采集家居环境中的各种环境数据,数据通过无线网络上传至网络服务器。利用手机APP向网络服务器发送获取数据或者相应控制指令的访问请求,网络服务器收到访问请求后,就执行将环境数据传输给手机APP的操作,或者将来自手机APP的控制指令传至STM32下位机,STM32下位机向各个功能模块发出具体控制指令。
-
公开(公告)号:CN115711603A
公开(公告)日:2023-02-24
申请号:CN202211387475.1
申请日:2022-11-07
Applicant: 电子科技大学长三角研究院(湖州)
Abstract: 本发明公开了一种多智能体系统中无坐标分布式控制算法。涉及多智能体系统控制中的分布式控制领域,针对纯方位环绕包围控制算法。本发明针对车辆集群提出了一种无坐标分布式定位和环绕包围控制算法。设计了多目标中心估计器算法进行中心估计,又根据估计出的目标中心设计控制器算法控制多辆小车进行环绕包围运动。本发明提出的分布式定位和环绕包围算法是无坐标形式的,无需任何位置信息的,因此不再需要统一全球坐标系,且不同车辆的局部坐标没有对齐。本发明仅考虑部分车辆来测量相对于目标的相对方位。尽管如此,本发明提出的分布式定位算法仍然保证了所有车辆通过协作精确定位目标。
-
公开(公告)号:CN115564888A
公开(公告)日:2023-01-03
申请号:CN202210845580.9
申请日:2022-07-18
Applicant: 电子科技大学长三角研究院(湖州)
Abstract: 本发明基于MVSNet网络进行改进,提出一种基于深度学习的可见光多视图像三维重建方法。将网络中的批归一化层和非线性激活函数层替换为融合的Inplace‑ABN层,降低了显存的占用量。设计基于分组相似性的加权均值度量法对代价体的特征维度进行降维,获得了更加轻量级的代价体,压缩了网络参数,降低了计算量与显存消耗。针对MVSNet网络使用低尺度特征图导致深度图分辨率低于输入图像的问题,利用特征金字塔模块提取多尺度的特征图,并设计了分阶段、多尺度的迭代优化深度估计。在保证精度的前提下,通过多轮深度迭代,降低了代价体深度平面的平均数量,使代价体获得更高的空间分辨率,提高了深度图估计的准确度。最后对输出深度图进行过滤与融合完成场景三维重建任务。
-
-
-
-
-
-
-
-
-