-
公开(公告)号:CN118038396A
公开(公告)日:2024-05-14
申请号:CN202410272146.5
申请日:2024-03-11
Applicant: 北京大学
IPC: G06V20/56 , G06V10/44 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开一种基于毫米波雷达和相机鸟瞰图融合的三维感知方法,属于计算机视觉技术领域。本发明针对毫米波雷达的特性,利用毫米波雷达主干网络,进行点云鸟瞰图特征提取,使用两种特征表征方式对毫米波雷达点云进行特征表示,并使用基于雷达反射截面(RCS)的离散方法得到鸟瞰图特征,基于可形变的跨注意力机制对毫米波雷达特征和相机鸟瞰图特征进行鲁棒和高效的融合,从而提高自动驾驶的感知任务的性能和多模态鲁棒性。采用本发明能够提高自动驾驶的三维感知(如三维目标检测、语义分割等)性能,可广泛应用于自动驾驶中实际应用的计算机视觉任务(如三维物体检测、语义分割等)。
-
公开(公告)号:CN117710917A
公开(公告)日:2024-03-15
申请号:CN202311456289.3
申请日:2023-11-03
Applicant: 北京大学
Abstract: 本发明涉及一种基于长短时序混合编码的端到端多模态多任务自动驾驶感知方法和装置。该方法的步骤包括:针对车载传感器的多帧输入,使用多个编码网络进行长短时序的特征提取;然后对提取的特征进行基于注意力机制的时序融合,并进行跨模态融合,并对每个任务生成BEV特征图,然后采用不同任务的解码器获得每个任务的预测结果。本发明能够动态调整网络推理速度与精度,能够提高在同样计算量下的网络性能,能够针对不同编码网络得到的多帧BEV特征图进行时序融合,对于动态物体能够更好地进行跨帧对齐。本发明能够生成多尺度的BEV特征,进行时序和跨模态融合后,保留多尺度特征,经过特征选择,能够分别给予各任务解码器不同尺度的特征图。
-
公开(公告)号:CN112364305B
公开(公告)日:2024-03-15
申请号:CN202011252901.1
申请日:2020-11-11
Applicant: 北京大学
Abstract: 本发明公布了一种基于区块链的数字内容版权保护方法和装置,包括:数字内容加密封装工具加密数字内容生成受保护的数字内容作品文件;区块链平台登记数字内容,将数字内容的版权信息和内容解密密钥信息写入区块链;数字内容使用工具获得受保护的数字内容作品文件,向区块链平台请求数字内容的数字许可证书;区块链平台创建数字许可证书;数字内容使用工具获得数字许可证书并使用数字内容。基于超级分发原理方法,本发明采用区块链对版权信息和内容解密密钥进行管理,克服了传统版权保护系统对中心服务器的依赖,实现了对数字内容版权和数字许可证书的可信管理。
-
公开(公告)号:CN116681107A
公开(公告)日:2023-09-01
申请号:CN202310708348.5
申请日:2023-06-15
Applicant: 北京大学
IPC: G06N3/0455 , G06N3/0895 , G06N3/084 , G06F18/25
Abstract: 本发明公开一种基于大规模语言‑图像模型引导的3D自监督预训练方法,属于计算机视觉技术领域。本发明将大规模语言‑图像模型的语义理解能力和多模态处理能力作为指导目标,将3D网络特征与大规模语言‑图像模型的特征空间用对比学习进行对齐。此外,利用图像掩码的方式,采用3D特征和语言描述,对掩码后的图像进行重建,从而使得3D网络能够学习到与大规模语言‑图像模型相同的通用的LiDAR点云表征。在实际应用中,训练得到的具有强表征能力的网络能够被应用在多种自动驾驶的下游任务中,包括但不限于3D目标检测、3D实例分割、语义分割等任务,可以加速模型在下游任务训练时的收敛速度,同时提高网络性能。
-
公开(公告)号:CN111143333B
公开(公告)日:2023-06-09
申请号:CN201811313048.2
申请日:2018-11-06
Applicant: 北大方正集团有限公司 , 北大方正信息产业集团有限公司 , 北京大学
IPC: G06F16/215 , G06F16/22
Abstract: 本发明实施例提供一种标注数据处理方法、装置、设备及计算机可读存储介质。本发明实施例的方法,通过获取标注区域的相似度大于预设阈值的至少一组标注数据,每组标注数据为一组待清洗数据;确定每组待清洗数据的新标注区域和新标注类别;根据每组待清洗数据的新标注区域和新标注类别,对每组待清洗数据进行清洗处理,可以自动识别出标注数据中的重复数据和差异数据,并自动完成对重复数据和差异数据的清洗,提高了标注数据的有效性。
-
公开(公告)号:CN110970099B
公开(公告)日:2023-04-28
申请号:CN201911255006.2
申请日:2019-12-10
Applicant: 北京大学
Abstract: 本发明公布了一种基于正则化变分自动编码器的药物分子生成方法,将药物分子表示为图数据,利用变分自动编码器框架,建立包括编码器和解码器的药物分子生成模型;编码器利用图神经网络直接对输入的药物分子图进行编码;解码器采用多层感知机,优化目标包括重建损失、KL损失及性质正则化损失,其中性质正则化损失利用蒙特卡洛采样进行估计。采用本发明技术生成的候选药物分子有效性更高,分子的性质更优异。
-
公开(公告)号:CN115240039A
公开(公告)日:2022-10-25
申请号:CN202210845988.6
申请日:2022-07-19
Applicant: 北京大学
IPC: G06V10/776 , G06V10/25
Abstract: 本发明公开了一种针对目标检测器的对抗稳定性测试方法、系统,属于人工智能安全领域。本发明在攻击前生成一个随机的扰动作为初始的对抗补丁Xadv,并在后续的迭代中对该对抗补丁进行更新,最终利用训练好的对抗补丁对目标检测器进行对抗稳定性测试,并计算mAP作为量化指标。本发明通过使用已封装的模块、修改必要的外部接口,可以快速、灵活地针对目标模型实现对抗补丁式的攻击,能够满足对给定的检测器进行自定义攻击及对抗测试的要求。
-
公开(公告)号:CN112990196A
公开(公告)日:2021-06-18
申请号:CN202110279301.2
申请日:2021-03-16
Applicant: 北京大学
Abstract: 本发明公布了一种基于超参数搜索和二阶段训练的场景文字识别方法及系统,包括最佳训练超参数搜索、二阶段训练和场景文字识别;基于对场景文字识别训练涉及的因素和超参数进行分析,建立搜索空间;基于该搜索空间,使用进化算法和代理任务建立最佳训练超参数搜索算法,搜索得到最优训练参数;再采用二阶段训练方式:通过使用辅助解码器指导编码器的学习过程增强编码器的图像特征提取能力,在模型训练过程中先后经过两种监督,提高场景文字的识别精度。本发明方法简单方便,且场景文字识别精度高。
-
公开(公告)号:CN109918473B
公开(公告)日:2020-12-29
申请号:CN201711342621.8
申请日:2017-12-14
Applicant: 北大方正集团有限公司 , 北大方正信息产业集团有限公司 , 北京大学
IPC: G06F16/33
Abstract: 本发明提出了一种数学公式相似度的测量方法及其测量系统,其中数学公式相似度的测量方法包括:将待测量数学公式和基准数学公式分别表示为待测量链表树和基准链表树;计算待测量链表树及基准链表树的相似度,得到第一数值;判断第一数值是否小于1;当第一数值小于1时,计算待测量链表树的子结构与基准链表树的子结构的相似度,得到第二数值;比较第一数值及第二数值的大小,将第一数值与第二数值中较大的一个作为待测量数学公式和基准数学公式的相似度测量结果。本发明提供的数学公式相似度的测量方法相比较于以往基于文本相似的测量方式,具有更好的可信度。
-
公开(公告)号:CN111143333A
公开(公告)日:2020-05-12
申请号:CN201811313048.2
申请日:2018-11-06
Applicant: 北大方正集团有限公司 , 北大方正信息产业集团有限公司 , 北京大学
IPC: G06F16/215 , G06F16/22
Abstract: 本发明实施例提供一种标注数据处理方法、装置、设备及计算机可读存储介质。本发明实施例的方法,通过获取标注区域的相似度大于预设阈值的至少一组标注数据,每组标注数据为一组待清洗数据;确定每组待清洗数据的新标注区域和新标注类别;根据每组待清洗数据的新标注区域和新标注类别,对每组待清洗数据进行清洗处理,可以自动识别出标注数据中的重复数据和差异数据,并自动完成对重复数据和差异数据的清洗,提高了标注数据的有效性。
-
-
-
-
-
-
-
-
-