-
公开(公告)号:CN114612835B
公开(公告)日:2025-04-01
申请号:CN202210253316.6
申请日:2022-03-15
Applicant: 中国科学院计算技术研究所
IPC: G06V20/40 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明实施例提供了一种基于YOLOv5网络的无人机目标检测模型,该模型包括:主干模块,用于对输入图像进行多次下采样,得到多个不同尺度的特征图;颈部模块,用于基于主干模块得到的不同尺度的特征图进行多次上采样和特征融合,输出多个不同尺度的检测特征图,其中,相比原始的YOLOv5网络,颈部模块的输出增加一个相比于原始的YOLOv5网络中最大尺度的检测特征图更大的新检测特征图,并减少一个最小尺度的检测特征图;预测模块,用于根据颈部模块输出的多个检测特征图进行无人机目标预测,得到目标的预测位置信息和分类结果,其中,分类的类别包括无人机类和非无人机类。
-
公开(公告)号:CN114885170B
公开(公告)日:2025-02-07
申请号:CN202210498178.8
申请日:2022-05-09
Applicant: 中国科学院计算技术研究所
IPC: H04N19/167 , H04N19/136 , G06V40/10 , G06V10/40 , G06N3/094 , G06N3/0475 , G06N3/045 , G06N3/0464 , G06V10/82
Abstract: 本发明提供一种视频传输装置,所述装置包括:预处理模块,其配置在发送端,用于对待传输的视频中的原始目标图像进行分解以将其分解为前景因子、背景因子以及姿态因子;编码系统,其配置在发送端,用于基于前景因子、背景因子以及姿态因子分别对原始图像进行编码获得前景信息嵌入特征、背景信息嵌入特征以及姿态信息嵌入特征并传输给解码系统;解码系统,其配置在接收端,用于对接收到的嵌入特征进行解码以生成重构图像。本发明在发送端将图像数据解构为多个因子并基于每个分解因子将输入图像编码成嵌入特征,然后再基于嵌入特征重构成图像后,利用深度卷积对抗生成网络生成更真实的图像。在降低了传输带宽与存储资源的前提下,提升了生成图像的质量,保证了传输质量。
-
公开(公告)号:CN119380311A
公开(公告)日:2025-01-28
申请号:CN202310926610.3
申请日:2023-07-26
Applicant: 中国科学院计算技术研究所
IPC: G06V20/58 , G06V10/80 , G06V10/762 , G06V10/764 , G06V10/62
Abstract: 本发明提供一种交通路牌目标检测识别方法和系统,所述方法包括:S1、利用检测网络模型对t时刻的预处理图像进行检测得到t时刻的路牌图像块;S2利用路牌字符检测模型提取t时刻的路牌图像块中的字符信息;S3、对t时刻的字符信息进行聚类并基于聚类结果对字符信息按语义进行排序得到t时刻的字符语义信息;S4、利用特征映射方式在t+1时刻的图像中找到与t时刻字符语义信息相同的交通标志;S5、对t+1时刻的预处理图像进行检测;S6、采用如S2‑S4所述的方法在t+2时刻的图像中找到与t+1时刻字符语义信息相同的交通标志;S7、计算交通标志边界框的位置和尺寸得到两个时刻的交通标志图像;S8、提取交通标志图像的特征向量并融合,对融合特征向量进行分类识别。
-
公开(公告)号:CN118820708A
公开(公告)日:2024-10-22
申请号:CN202410801124.3
申请日:2024-06-20
Applicant: 中国科学院计算技术研究所
IPC: G06F18/20 , G06F18/211 , G06F18/213 , G06F18/2433 , G06F18/25 , G06N3/0442 , G06N3/045 , G06Q10/04 , G06Q50/26 , G06F123/02
Abstract: 本发明提供了一种犯罪态势研判模型训练方法,所述方法包括:步骤S1、获取已有的历史犯罪时间序列数据并对其进行预处理得到目标序列数据集;步骤S2、构建初始模型;步骤S3、采用目标序列数据集对所述初始模型进行多轮迭代训练得到犯罪态势研判模型。本发明的通过LSTM模型的基本结构来构建犯罪态势研判模型,以捕获犯罪时间序列数据中的长期依赖关系,提高犯罪态势研判模型的时效性和准确性;同时在犯罪态势研判模型中引入注意力模块来自动学习犯罪时间序列数据中的重要特征,使犯罪态势研判模型更加关注对犯罪预测有影响的信息,提高对特征的表达能力,进而提高犯罪态势研判模型的准确性和可靠性。
-
公开(公告)号:CN117407709A
公开(公告)日:2024-01-16
申请号:CN202311250976.X
申请日:2023-09-26
Applicant: 中国科学院计算技术研究所
IPC: G06F18/214 , G06F18/21 , G06F18/2415 , G06N3/09
Abstract: 本发明提供一种犯罪研判模型训练方法,包括:S1、获取已有犯罪数据并对其进行样本均衡处理;S2、对样本均衡处理后的数据进行数据编码;S3、按照预设的数据处理规则对数据编码后的数据进行处理以得到目标数据;S4、构建初始模型,所述初始模型包括多个残差处理模块和多个注意力模块;S5、采用所述目标数据对所述初始模型进行多轮迭代训练以得到犯罪研判模型,并在迭代训练过程中采用交叉熵损失更新模型参数。本发明引入注意力机制和深度残差神经网络构建犯罪研判模型,其中,通过引入注意力机制可以自动关注犯罪数据中的关键犯罪特征以减少人工干预犯罪特征选择的过程,通过引入深度残差神经网络可以应对大规模数据场景下的犯罪研判要求。
-
公开(公告)号:CN117151185A
公开(公告)日:2023-12-01
申请号:CN202310943969.1
申请日:2023-07-28
Applicant: 中国科学院计算技术研究所
IPC: G06N3/08 , G06N3/084 , G06N3/0464 , G06V10/764 , G06V10/82
Abstract: 本发明提出一种基于联合优化的深度神经网络自适应量化方法和系统,包括:将划分参数与神经网络参数联合优化,以使深度神经网络的数据划分和神经网络参数训练共同进行。保存训练完成后的划分参数,使用划分参数对执行模型的激活或权重进行量化,得到最终模型,以该最终模型执行相应任务。本发明可以更好地拟合深度神经网络激活和权重的数据分布,将深度神经网络中所有线性层的激活值和权重量化为低比特,从而减少量化误差,且本发明在模型的使用阶段,可以减少模型使用的计算量,加快图像分类的预测速度,减少分类产生的能耗,并减少模型存储所使用的空间大小。
-
公开(公告)号:CN116090037A
公开(公告)日:2023-05-09
申请号:CN202211345503.3
申请日:2022-10-31
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种建筑工程图文本框自动排版方法,包括:步骤1,获取需要自动排版的所有文本框及其坐标信息;步骤2,根据所述文本框的坐标信息计算所有文本框的重叠区域的总面积;步骤3,在所有文本框的重叠区域的总面积不为0时,确定与其他文本框重叠区域面积最大的一个文本框;步骤4,操作所述文本框分别向上下左右移动预设的距离,选择移动后其与其他文本框重叠区域面积最小的移动动作,并且执行所述动作;步骤5,重复步骤2至4,直到达到预定的重复次数。
-
公开(公告)号:CN114885170A
公开(公告)日:2022-08-09
申请号:CN202210498178.8
申请日:2022-05-09
Applicant: 中国科学院计算技术研究所
IPC: H04N19/167 , H04N19/136 , G06V40/10 , G06V10/40 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种视频传输装置,所述装置包括:预处理模块,其配置在发送端,用于对待传输的视频中的原始目标图像进行分解以将其分解为前景因子、背景因子以及姿态因子;编码系统,其配置在发送端,用于基于前景因子、背景因子以及姿态因子分别对原始图像进行编码获得前景信息嵌入特征、背景信息嵌入特征以及姿态信息嵌入特征并传输给解码系统;解码系统,其配置在接收端,用于对接收到的嵌入特征进行解码以生成重构图像。本发明在发送端将图像数据解构为多个因子并基于每个分解因子将输入图像编码成嵌入特征,然后再基于嵌入特征重构成图像后,利用深度卷积对抗生成网络生成更真实的图像。在降低了传输带宽与存储资源的前提下,提升了生成图像的质量,保证了传输质量。
-
-
-
-
-
-
-