-
公开(公告)号:CN119693680A
公开(公告)日:2025-03-25
申请号:CN202411620925.6
申请日:2024-11-14
Applicant: 北京计算机技术及应用研究所
IPC: G06V10/764 , G06F18/24 , G06N3/0464 , G06N3/045 , G06F18/213 , G06F18/25 , G06N5/04 , G06V10/40 , G06V10/82
Abstract: 本发明涉及一种基于多模态模型的数据自动标注方法,属于数据标注与人工智能领域。本发明待标注图像数据与潜在标签输入数据自动标注系统;数据自动标注系统通过文本‑图像多模态模型为潜在标签进行打分排序,返回潜在标签概率排序结果;标注者人工对自动标注标签进行审核,确认标注结果并完成标注。本发明能提高数据标注时间效率;减少人工成本开销;扩大标注数据量,高效驱动更多下游人工智能模型。
-
公开(公告)号:CN119692411A
公开(公告)日:2025-03-25
申请号:CN202411679953.5
申请日:2024-11-22
Applicant: 北京计算机技术及应用研究所
IPC: G06N3/08 , G06F18/214 , G06N3/045 , G06V10/82 , G06V10/764 , G06V10/74 , G06N5/04
Abstract: 本发明涉及一种提升多模态模型细颗粒度判别能力的微调优化方法,属于人工智能领域。本发明通过对微调阶段的图像编码器通道引入ArcFace的角度边界辅助损失来优化图像和文本的联合表示学习。该方法包括预训练和微调两个阶段,预训练阶段使用在大规模图像‑文本对数据集上进行训练,微调阶段则基于特定领域数据集通过固定文本分支的全部参数和图像分支的多数参数,并在图像分支结合辅助损失函数调整模型参数,从而实现多模态模型对特定细颗粒场景判别能力的优化提升。
-
公开(公告)号:CN119672037A
公开(公告)日:2025-03-21
申请号:CN202411621275.7
申请日:2024-11-14
Applicant: 北京计算机技术及应用研究所
IPC: G06T7/10 , G06F3/0484 , G06N3/08
Abstract: 本发明涉及一种支持连续点击交互式的图像分割自动标注方法和电子设备,属于数据标注与人工智能领域。本发明将待标注图像数据输入自动标注系统;用户判断是否开始新的图像标注任务;若开始新的图像标注任务,系统获取用户连续鼠标点击交互信息;若待标注图像未在系统中出现过,系统调用后端支持连续点击交互式的图像分割模型计算得到图像特征向量,自动标注系统通过图像特征向量之间关联度计算得到待标注图像分割结果,之后系统返回自动标注结果;为保证标注质量,标注者通过对自动标注标系统所得到的结果进行审核,确认标注结果并完成标注。本发明能提高数据标注时间效率;减少人工成本开销;扩大标注数据量,高效驱动更多下游人工智能模型。
-
公开(公告)号:CN119441989A
公开(公告)日:2025-02-14
申请号:CN202411679330.8
申请日:2024-11-22
Applicant: 北京计算机技术及应用研究所
IPC: G06F18/241 , A61B5/00 , A61B5/369 , G06F18/25 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及一种基于乘员脑电信号的融合风险分类方法,属于自动驾驶、人工智能和脑电信号处理领域。本发明针对预警信号利用在线学习算法训练一个预警信号提取特征网络;结合预警信号提取特征网络提取的特征和P300信号提取的特征实现基于脑电信号的风险分类器的训练;基于脑电信号实现风险的精准预测。本发明相比于之前研究单纯依靠P300信号,增加了预警信号数据特征,并且可以实现预警信号在线学习,结合车载计算机可以实现风险的快速精准识别。
-
公开(公告)号:CN119226631A
公开(公告)日:2024-12-31
申请号:CN202411296848.3
申请日:2024-09-18
Applicant: 北京计算机技术及应用研究所
IPC: G06F16/9536 , G06N20/20 , G06F18/2135 , G06F18/2431
Abstract: 本发明涉及一种基于协同过滤的分布式自动机器学习方法,属于自动机器学习领域。本发明为元知识库中的每个数据集搜索前N个模型并将它们存储在哈希字典中,并计算元知识库中的数据集的元特征子集的权重;基于协同过滤的分布式AutoML框架CF‑DAML,首先通过模型推荐模块计算新数据集的元特征并为其推荐合适的模型,然后,CF‑DAML在指定的时间限制内使用分布式模型训练系统DSTM在新数据集的训练集上训练推荐出的模型,并在其验证集上评估训练的模型,最后,CF‑DAML采用选择性堆叠集成系统MSSE集成几个高性能模型为新数据集的测试集预测标签。本发明在保证分类准确率提升的基础上大大降低了时间复杂度。
-
公开(公告)号:CN118953102B
公开(公告)日:2024-12-27
申请号:CN202411430293.7
申请日:2024-10-14
Applicant: 北京计算机技术及应用研究所
Abstract: 本发明涉及一种智能无人车自动充电装置,属于智能装备、无人车、自动充电领域。本发明为解决单面接触易出现接触不良、充电电极刚接触时打火等问题,设计自动充电装置包括:第一外壳(3)、第二外壳(4)、外置自动灭火喷头(5)、视觉传感设备(6)、防护挡板(7)、升降换向器(9)、升降丝杠(10)、第一同步带轮(11)、丝杠螺母(12)、轴承座(14)、同步带(15)、第二同步带轮(16)、自动灭火装置(18)、内置自动灭火喷头(20)、烟雾检测装置(21)、设备端充电组件(26)等。本发明可靠性高,能承受更大的充电电流,避免电极直接接触时发生打火烧蚀,能进行内部、外部设备灭火,有效防尘防雨,能进行高度调节。
-
公开(公告)号:CN119783846A
公开(公告)日:2025-04-08
申请号:CN202411611427.5
申请日:2024-11-12
Applicant: 北京计算机技术及应用研究所
IPC: G06N20/00 , G06N5/01 , G06V10/22 , G06V10/764 , G06V10/774
Abstract: 本发明涉及一种基于机器学习的阵列编码深度估计方法,属于机器学习和计算机视觉领域。本发明基于阵列编码基本原理,设计阵列编码图案,并制定精确表示基元图案位置的亚像素值坐标表示方法;基于决策树对基元图案进行分类预测,通过机器学习的方式使用白平衡板对决策树进行训练,得到满足要求的决策树;使用决策树获取实际采集的图像中的基元图案的分类,进而获得基元图案的亚像素定位坐标;基于三角测量原理求解深度信息,最后将获得的深度信息转化成三维点云信息图。本发明实现简单,精度较高,满足了动态目标的深度估计要求。
-
公开(公告)号:CN119780942A
公开(公告)日:2025-04-08
申请号:CN202510041891.3
申请日:2025-01-10
Applicant: 北京计算机技术及应用研究所
Abstract: 本发明涉及一种基于lidar和imu的即时定位方法,属于智能机器人和自动驾驶领域。本发明通过数据采集模块获得lidar数据和imu数据,并输入到即时定位程序中;在数据优化模块中利用imu数据对lidar扫描数据中的点云进行运动畸变矫正;使用自适应数据关联模块矫正lidar数据;将lidar数据的预测状态和imu数据的预测状态输入到扩展卡尔曼滤波优化模型中进行优化处理,获得优化后的结果;将优化后的结果进行位姿估计,获得位姿结果信息。本发明提高了程序的可维护性和灵活性;减少了程序中数据误差的传播;减少了程序在不同类型环境中进行参数调整的工作量。
-
公开(公告)号:CN119729048A
公开(公告)日:2025-03-28
申请号:CN202411679821.2
申请日:2024-11-22
Applicant: 北京计算机技术及应用研究所
IPC: H04N21/2343 , H04N21/6437 , H04N7/18 , H04L67/02
Abstract: 本发明涉及一种面向智能巡查机器人的视频流媒体处理装置,属于视频流媒体处理领域。本发明提出的装置包括视频采集端和流媒体服务端。视频采集端可以通过可见光相机输出RTSP协议视频流,也可以通过FFmpeg拉取视频流并解码,并对目标检测、目标跟踪、全景拼接等智能算法处理后的视频流编码,然后再输出RTSP协议视频流。流媒体服务端通过FFmpeg拉取RTSP协议视频流,并转换为RTMP协议视频流后传输到SRS框架,SRS框架以webRTC协议的方式传输到监控端,在监控大厅播放视频流,并实时监测智能巡查机器人周围环境状态,进而达到对指定目标、区域的安防保护的目的。
-
公开(公告)号:CN119692413A
公开(公告)日:2025-03-25
申请号:CN202411621410.8
申请日:2024-11-14
Applicant: 北京计算机技术及应用研究所
IPC: G06N3/082 , G06F9/455 , G06N3/0985
Abstract: 本发明涉及一种智能感知算法训练框架统一支撑方法,属于深度学习领域。本发明包括主流国产框架转换兼容技术;统一训练系统;训练框架多硬件兼容技术;多类型计算资源虚拟化技术。本发明集成国产主流训练框架PaddlePaddle,通过X2Paddle工具实现对PyTorch训练框架在训练代码层和模型层的统一转换兼容能力;并以计算资源虚拟化技术进行训练环境管理,以镜像的方式实现对不同训练框架的兼容支持,实现主流国产硬件计算设备的接入;通过模型资源管理和构建场景开发套件,实现算法资源集成,以实现对不同任务常场景的快速开发能力;通过分布式训练技术,支持对单机多卡和多机多卡资源的调度使用。通过超参数调优和模型压缩技术,实现对训练模型效果和训练效率寻优。
-
-
-
-
-
-
-
-
-