-
公开(公告)号:CN115240008B
公开(公告)日:2025-05-09
申请号:CN202210931306.3
申请日:2022-08-04
Applicant: 重庆邮电大学
IPC: G06V10/25 , G06V10/764 , G06V10/766 , G06V10/774 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/0895
Abstract: 本发明属于人工智能技术领域,具体涉及一种采样无关的全度量小样本目标检测方法,包括:构建全度量样本检测模型,并微调全度量样本检测模型;采样小样本数据,对小样本数据集进行组织划分,得到类支持集和查询集,并对类支持集中的类支持样本进行预处理;将小样本数据输入到微调后的全度量样本检测模型,进行目标检测并获得检测结果。本发明通过使用跨尺度语义匹配减少由于和尺度差异而导致匹配次优结果;通过构造一组正常和损坏图片对,采用自监督学习策略约束网络使编码器可利用上下文构建出更为鲁棒原型;为原型向量增设了空间位置信息来引导模型更为准确捕获到目标。
-
公开(公告)号:CN119557479A
公开(公告)日:2025-03-04
申请号:CN202411600269.3
申请日:2024-11-11
Applicant: 重庆邮电大学
IPC: G06F16/783 , G06F16/732 , G06V20/40 , G06V10/774 , G06V10/82 , G06F40/258 , G06N3/0455 , G06N3/0475 , G06N3/0895
Abstract: 本发明属于文本‑视频检索领域,具体涉及一种基于生成字幕的多粒度语义对齐文本‑视频检索方法,包括:建立SAEC模型,并对其进行训练,通过训练后的SAEC模型进行文本‑视频匹配检索。本发明提出了一个新的模型SAEC,该模型通过匹配视频中的局部细节并理解视频的全局语义,显著提高了文本到视频的检索准确性,同时,本发明通过联合生成的字幕和视频,使模型不仅能理解视频的直接内容,还能把握更复杂的情境。
-
公开(公告)号:CN115440330B
公开(公告)日:2025-02-11
申请号:CN202211100112.5
申请日:2022-09-09
Applicant: 重庆邮电大学
IPC: G16H10/60 , G06F40/295 , G06F18/21 , G06N3/045 , G06N3/0442 , G06N3/084
Abstract: 本发明属于文本标注领域,具体涉及一种基于主动学习的中文电子病历命名实体识别方法,包括:获取已标记实体的初始训练集和未标记实体的待打标数据;以该训练集,训练基于深度学习的命名实体识别模型,得到中间命名实体识别模型,该中间命名实体识别模型评估该未标记数据中每个实例的价值,将该未标记数据中价值最高的实例进行命名实体标注后加入该训练集;重复训练直到满足预设条件,将待命名实体识别的文本数据输入该最终命名实体识别模型,得到命名实体识别结果。本发明通过让模型预测自己的损失,从而找到能让自己改变最大的样本,满足了中文电子病历这一场景下对于句子级的命名实体识别准确率的高要求,提高了识别的准确率。
-
公开(公告)号:CN115495566B
公开(公告)日:2024-11-12
申请号:CN202211238085.8
申请日:2022-10-11
Applicant: 重庆邮电大学
IPC: G06F16/332 , G06F40/30 , G06N5/04 , G06N3/0442 , G06N3/0455 , G06N3/084
Abstract: 本发明涉及人机对话领域,具体涉及一种增强文本特征的对话生成方法和系统;该方法包括获取问题文本和回复文本,通过TextRank算法提取问题文本中的关键词,得到关键词序列;引入关键词编码器,关键词编码器通过注意力机制对每一个关键词进行编码得到对应的关键词向量;将关键词向量与语义向量拼接后输入第一多层感知机,得到包含丰富语义的关键词语义向量;将关键词语义向量与问题文本向量拼接后通过第二多层感知机,得到输入向量;根据输入向量训练对话生成模型,采用损失函数计算损失值并反向传播,调整对话生成模型的参数;本发明加强关键词的权重,增强对文本的特征表达,达到生成更高质量的对话文本的目的。
-
公开(公告)号:CN118820844A
公开(公告)日:2024-10-22
申请号:CN202410807272.6
申请日:2024-06-21
Applicant: 重庆邮电大学
IPC: G06F18/24 , G06F18/213 , G06N3/0442 , G06N3/0455 , G06F18/25
Abstract: 本发明属于多模态情感识别和对话系统领域,涉及一种基于关系子图交互的多模态对话动态情感识别方法,包括:获取多模态对话数据集;将多模态对话数据集的数据输入模态特征提取器提取每个模态的特征,得到文本模态特征、听觉模态特征以及视觉模态特征;将听觉模态特征和视觉模态特征分别输入视听模态编码器,得到最终的听觉模态特征和视觉模态视觉特征;将文本模态特征输入关系子图交互模块,得到最终的文本模态特征;将最终的文本模态特征、听觉模态特征以及视觉模态特征均输入情感分类器,得到情感识别结果;本发明根据情感依赖关系将对话建模为说话者间情感依赖子图和说话者自身情感依赖子图,从而更好地捕捉和理解多元对话场景中的情感动态。
-
公开(公告)号:CN114398904B
公开(公告)日:2024-08-23
申请号:CN202111386005.9
申请日:2021-11-22
Applicant: 重庆邮电大学
IPC: G06F40/35 , G06F16/35 , G06F40/216 , G06F18/214 , G06F18/241 , G06N3/084
Abstract: 本发明公开了一种基于多粒度特征解耦的开放领域对话生成方法,包括:获取数据集和对话类别;随机选取数据集中的若干个第一训练对输入条件变分自编码器CVAE模型,得到与对话类别对应的先验高斯分布;将数据集中的第二训练对输入高级条件变分自编码器A‑CVAE模型中,得到重构期望损失和KL散度;根据重构期望损失、KL散度、第一训练对对应的先验高斯分布,得到总损失;根据总损失对A‑CVAE模型进行反向梯度优化,得到训练A‑CVAE模型;获取待回复对话问题;将待回复对话问题输入训练A‑CVAE模型,生成对话回复。本发明能够解决现有模型不能很好的捕捉对话的类别语义,生成的对话可解释性不高的技术问题。
-
公开(公告)号:CN118035394A
公开(公告)日:2024-05-14
申请号:CN202311676298.3
申请日:2023-12-08
Applicant: 重庆邮电大学
IPC: G06F16/332 , G06F16/33 , G06F16/36 , G06N5/022 , G06N5/04
Abstract: 本发明涉及一种基于多源数据集成的医学问答方法及系统,包括:建立多种数据类型的本地知识库,并根据不同数据类型的本地知识库建立对应的搜索策略;获取用户的问诊语句,利用多种数据类型的搜索策略在本地知识库中对用户的问诊语句进行查询,得到用户问诊语句对应的医学知识;根据用户问诊语句对应的医学知识生成prompt模板,将生成的prompt模板输入训练好的医学大模型生成用户问诊语句对应的医学回复,通过搜索策略使prompt学习到外部专属知识指导大语言模型生成知识回复,避免大模型出现的"幻觉"问题,本发明具有广泛的应用前景,将有望提供更准确、高效的医学信息交流与解答服务。
-
公开(公告)号:CN116863256A
公开(公告)日:2023-10-10
申请号:CN202310949635.5
申请日:2023-07-31
Applicant: 重庆邮电大学
IPC: G06V10/77 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0499 , G06N3/0895
Abstract: 本发明属于图像数据处理领域,具体涉及一种基于自监督模态优化的图像描述生成方法;该方法包括:采用图像编码器提取图像的全局特征和网格特征,采用文本编码器提取文本描述的文本特征;采用视觉精炼模块对网格特征进行处理,得到精炼图像网格特征;将图像全局特征和文本特征输入到跨模态特征优化器中进行处理,得到优化图像全局特征;采用解码器对优化图像全局特征和精炼图像网格特征进行处理,生成文本描述;计算模型总损失并根据模型总损失调整模型参数,得到训练好的自监督模态优化图像描述模型;将待描述的图像输入到训练好的自监督模态优化图像描述模型,生成图像的文字描述;本发明可生成更自然、更准确的描述。
-
公开(公告)号:CN116775857A
公开(公告)日:2023-09-19
申请号:CN202310596856.9
申请日:2023-05-24
Applicant: 重庆邮电大学
IPC: G06F16/34 , G06F40/253 , G06F40/284 , G06F18/25 , G06N3/045 , G06N3/0464 , G06N3/0475 , G06N3/084 , G06N3/092 , G06N3/094
Abstract: 本发明涉及深度学习与自然语言处理领域,具体涉及一种基于生成对抗网络的多风格文章摘要生成方法;包括获取原始文本数据及其对应的风格标签数据;构建并训练多风格文章摘要生成模型,将待处理文章和要求风格输入训练好的多风格摘要生成模型,输出对应的风格摘要;所述多风格文章摘要生成模型包括词嵌入模块、风格嵌入模块、融合模块、transformer生成模块和对抗判别模块;本发明能够输出用户所需风格的摘要,模型参数少、训练成本低。
-
公开(公告)号:CN118928471A
公开(公告)日:2024-11-12
申请号:CN202411174701.7
申请日:2024-08-26
Applicant: 重庆邮电大学
Abstract: 本发明属于自动驾驶领域,具体涉及一种无信号交叉路口自动驾驶决策方法;所述方法包括将车辆控制解耦为横向控制和纵向控制;采用基于追踪算法的横向驾驶决策模型,适用于横向驾驶决策场景,有助于减少偏离车道的风险,并提高整体行驶的安全性。采用了基于碰撞概率预测的纵向驾驶决策模型,通过预测周围车辆未来行驶路径与自主车辆未来行驶路径是否有冲突,来评估相关车辆的风向级别,并定义了不同的风险级别,从而确定出自主车辆的风险评估结果,利用风险评估结果与全局风险阈值的关系,来选择利用基于碰撞概率预测的纵向驾驶决策模型还是利用基于深度强化学习的纵向驾驶决策模型来得到自主车辆的纵向控制决策;本发明实现了更可靠的驾驶决策。
-
-
-
-
-
-
-
-
-