-
公开(公告)号:CN114612835B
公开(公告)日:2025-04-01
申请号:CN202210253316.6
申请日:2022-03-15
Applicant: 中国科学院计算技术研究所
IPC: G06V20/40 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明实施例提供了一种基于YOLOv5网络的无人机目标检测模型,该模型包括:主干模块,用于对输入图像进行多次下采样,得到多个不同尺度的特征图;颈部模块,用于基于主干模块得到的不同尺度的特征图进行多次上采样和特征融合,输出多个不同尺度的检测特征图,其中,相比原始的YOLOv5网络,颈部模块的输出增加一个相比于原始的YOLOv5网络中最大尺度的检测特征图更大的新检测特征图,并减少一个最小尺度的检测特征图;预测模块,用于根据颈部模块输出的多个检测特征图进行无人机目标预测,得到目标的预测位置信息和分类结果,其中,分类的类别包括无人机类和非无人机类。
-
公开(公告)号:CN119274227A
公开(公告)日:2025-01-07
申请号:CN202310816354.2
申请日:2023-07-05
Applicant: 中国科学院计算技术研究所
IPC: G06V40/20 , G06V40/10 , G06V10/25 , G06V10/774 , G06V10/82
Abstract: 本发明提供一种行人检测模型,用于检测图像中的行人,所述模型包括:特征提取模块,用于对图像进行特征提取得到原始特征图;区域生成模块,用于采用锚框对所述原始特征图进行候选目标框选以获取带锚框的特征图;空间注意力模块,用于对所述带锚框的特征图中被锚框框选部分进行掩码处理以获取掩码特征图;校准模块,用于基于所述带锚框的特征图对所述掩码特征图进行像素校准,并用于对像素校准后的特征图进行池化处理,以及基于池化处理后的特征图对所述原始特征图进行候选校准得到校准特征图;行人识别模块,用于对所述校准特征图进行分类以识别行人所在位置。本发明所提出的模型能够有效地学习被遮挡的行人特征来提高对被遮挡行人的检测准确率。
-
公开(公告)号:CN113298046A
公开(公告)日:2021-08-24
申请号:CN202110726377.5
申请日:2021-06-29
Applicant: 中国科学院计算技术研究所数字经济产业研究院
Abstract: 本发明涉及一种基于监控视频的高空抛物检测方法。本发明提供一种基于监控视频的高空抛物检测方法。本发明的技术方案为:一种基于监控视频的高空抛物检测方法,其特征在于:获取打有抛物检测标签的监控视频;将监控视频分割成多个小视频;获取用于抛物检测的检测服务器资源情况,将小视频分发给不同的检测服务器;获取检测服务器在检测到抛物后生成的抛物信息。本发明适用于高空抛物检测领域。
-
公开(公告)号:CN114612835A
公开(公告)日:2022-06-10
申请号:CN202210253316.6
申请日:2022-03-15
Applicant: 中国科学院计算技术研究所
Abstract: 本发明实施例提供了一种基于YOLOv5网络的无人机目标检测模型,该模型包括:主干模块,用于对输入图像进行多次下采样,得到多个不同尺度的特征图;颈部模块,用于基于主干模块得到的不同尺度的特征图进行多次上采样和特征融合,输出多个不同尺度的检测特征图,其中,相比原始的YOLOv5网络,颈部模块的输出增加一个相比于原始的YOLOv5网络中最大尺度的检测特征图更大的新检测特征图,并减少一个最小尺度的检测特征图;预测模块,用于根据颈部模块输出的多个检测特征图进行无人机目标预测,得到目标的预测位置信息和分类结果,其中,分类的类别包括无人机类和非无人机类。
-
公开(公告)号:CN112465850A
公开(公告)日:2021-03-09
申请号:CN202011425827.9
申请日:2020-12-08
Applicant: 中国科学院计算技术研究所数字经济产业研究院
Abstract: 本发明涉及一种外围边界建模方法、智能监控方法及装置。本发明的技术方案是:该建模方法:对图像做边缘检测,得到二值化的边缘检测结果;对边缘检测结果的二值化图像进行膨胀操作;遍历经膨胀的二值化图像中的点,以P(x,y)表示图像中的点(x,y)的像素值,若在同一x下满足以下条件P(x,y)=255则记录当前坐标(x,y),作为边界点,结束当前循环,同时继续判断下一个点x+1对应的y值是否符合上述条件;若相邻x位置存在边界点,而当前x位置不存在边界点,则当前x位置获取前一位置得到的边缘信息;将记录的的数据(x,y)对应写入map映射表中,其中x为key值,y为对应的value值,完成对外围边界建模。本发明适用于楼宇智能监控领域。
-
公开(公告)号:CN114885170B
公开(公告)日:2025-02-07
申请号:CN202210498178.8
申请日:2022-05-09
Applicant: 中国科学院计算技术研究所
IPC: H04N19/167 , H04N19/136 , G06V40/10 , G06V10/40 , G06N3/094 , G06N3/0475 , G06N3/045 , G06N3/0464 , G06V10/82
Abstract: 本发明提供一种视频传输装置,所述装置包括:预处理模块,其配置在发送端,用于对待传输的视频中的原始目标图像进行分解以将其分解为前景因子、背景因子以及姿态因子;编码系统,其配置在发送端,用于基于前景因子、背景因子以及姿态因子分别对原始图像进行编码获得前景信息嵌入特征、背景信息嵌入特征以及姿态信息嵌入特征并传输给解码系统;解码系统,其配置在接收端,用于对接收到的嵌入特征进行解码以生成重构图像。本发明在发送端将图像数据解构为多个因子并基于每个分解因子将输入图像编码成嵌入特征,然后再基于嵌入特征重构成图像后,利用深度卷积对抗生成网络生成更真实的图像。在降低了传输带宽与存储资源的前提下,提升了生成图像的质量,保证了传输质量。
-
公开(公告)号:CN119380311A
公开(公告)日:2025-01-28
申请号:CN202310926610.3
申请日:2023-07-26
Applicant: 中国科学院计算技术研究所
IPC: G06V20/58 , G06V10/80 , G06V10/762 , G06V10/764 , G06V10/62
Abstract: 本发明提供一种交通路牌目标检测识别方法和系统,所述方法包括:S1、利用检测网络模型对t时刻的预处理图像进行检测得到t时刻的路牌图像块;S2利用路牌字符检测模型提取t时刻的路牌图像块中的字符信息;S3、对t时刻的字符信息进行聚类并基于聚类结果对字符信息按语义进行排序得到t时刻的字符语义信息;S4、利用特征映射方式在t+1时刻的图像中找到与t时刻字符语义信息相同的交通标志;S5、对t+1时刻的预处理图像进行检测;S6、采用如S2‑S4所述的方法在t+2时刻的图像中找到与t+1时刻字符语义信息相同的交通标志;S7、计算交通标志边界框的位置和尺寸得到两个时刻的交通标志图像;S8、提取交通标志图像的特征向量并融合,对融合特征向量进行分类识别。
-
公开(公告)号:CN118820708A
公开(公告)日:2024-10-22
申请号:CN202410801124.3
申请日:2024-06-20
Applicant: 中国科学院计算技术研究所
IPC: G06F18/20 , G06F18/211 , G06F18/213 , G06F18/2433 , G06F18/25 , G06N3/0442 , G06N3/045 , G06Q10/04 , G06Q50/26 , G06F123/02
Abstract: 本发明提供了一种犯罪态势研判模型训练方法,所述方法包括:步骤S1、获取已有的历史犯罪时间序列数据并对其进行预处理得到目标序列数据集;步骤S2、构建初始模型;步骤S3、采用目标序列数据集对所述初始模型进行多轮迭代训练得到犯罪态势研判模型。本发明的通过LSTM模型的基本结构来构建犯罪态势研判模型,以捕获犯罪时间序列数据中的长期依赖关系,提高犯罪态势研判模型的时效性和准确性;同时在犯罪态势研判模型中引入注意力模块来自动学习犯罪时间序列数据中的重要特征,使犯罪态势研判模型更加关注对犯罪预测有影响的信息,提高对特征的表达能力,进而提高犯罪态势研判模型的准确性和可靠性。
-
公开(公告)号:CN117407709A
公开(公告)日:2024-01-16
申请号:CN202311250976.X
申请日:2023-09-26
Applicant: 中国科学院计算技术研究所
IPC: G06F18/214 , G06F18/21 , G06F18/2415 , G06N3/09
Abstract: 本发明提供一种犯罪研判模型训练方法,包括:S1、获取已有犯罪数据并对其进行样本均衡处理;S2、对样本均衡处理后的数据进行数据编码;S3、按照预设的数据处理规则对数据编码后的数据进行处理以得到目标数据;S4、构建初始模型,所述初始模型包括多个残差处理模块和多个注意力模块;S5、采用所述目标数据对所述初始模型进行多轮迭代训练以得到犯罪研判模型,并在迭代训练过程中采用交叉熵损失更新模型参数。本发明引入注意力机制和深度残差神经网络构建犯罪研判模型,其中,通过引入注意力机制可以自动关注犯罪数据中的关键犯罪特征以减少人工干预犯罪特征选择的过程,通过引入深度残差神经网络可以应对大规模数据场景下的犯罪研判要求。
-
公开(公告)号:CN116090037A
公开(公告)日:2023-05-09
申请号:CN202211345503.3
申请日:2022-10-31
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种建筑工程图文本框自动排版方法,包括:步骤1,获取需要自动排版的所有文本框及其坐标信息;步骤2,根据所述文本框的坐标信息计算所有文本框的重叠区域的总面积;步骤3,在所有文本框的重叠区域的总面积不为0时,确定与其他文本框重叠区域面积最大的一个文本框;步骤4,操作所述文本框分别向上下左右移动预设的距离,选择移动后其与其他文本框重叠区域面积最小的移动动作,并且执行所述动作;步骤5,重复步骤2至4,直到达到预定的重复次数。
-
-
-
-
-
-
-
-
-