-
公开(公告)号:CN119537305A
公开(公告)日:2025-02-28
申请号:CN202510100494.9
申请日:2025-01-22
Applicant: 北京科技大学
IPC: G06F15/78
Abstract: 本发明涉及芯片编译映射技术领域,特别涉及一种基于预先调度的粗粒度可重构芯片映射方法及装置。方法包括:根据输入程序,通过编译器前端编译出中间表示;根据中间表示,构建数据流图结构;根据数据流图和可重构芯片结构信息进行预先调度,得到操作的时间周期;根据预先分配的时间周期,对映射结果进行搜索,确定最终映射方案;生成在粗粒度可重构芯片上执行的配置信息。本发明能够有效降低映射算法复杂度,提高任务在粗粒度可重构芯片上的执行性能,在映射过程中充分考虑粗粒度可重构芯片上的异构资源,适用于复杂任务中多节点、结构复杂的数据流图映射,显著提升了映射效率。
-
公开(公告)号:CN118865940A
公开(公告)日:2024-10-29
申请号:CN202410848619.1
申请日:2024-06-27
Applicant: 北京科技大学
IPC: G10L13/027 , G10L13/08
Abstract: 本发明提供一种说话人提取方法及系统,涉及语音识别技术领域,方法包括:获取文本信息和待识别混合音频,所述待识别混合音频中包括目标说话人的目标语音;将所述文本信息和所述待识别音频输入至语音识别模型,确定所述目标说话人,所述语音识别模型包括提示文本提取说话人(PTE)网络和文本语音识别(TSR)网络中的至少一者。本发明通过获取文本信息和待识别混合音频,并将所述文本信息和所述待识别音频输入至语音识别模型,能够同时关注声音的频谱特征和文本信息,又因为所述语音识别模型包括提示文本提取说话人(PTE)网络和文本语音识别(TSR)网络中的至少一者,能够利用混合音频场景下的视觉特性。
-
公开(公告)号:CN112446308B
公开(公告)日:2024-09-13
申请号:CN202011281029.3
申请日:2020-11-16
Applicant: 北京科技大学
IPC: G06V40/20 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/084
Abstract: 本发明提供了一种基于语义增强的多尺度特征金字塔融合的行人检测方法,涉及计算机视觉技术领域,能够有效地提取和整合多尺度特征图以进行多尺度行人检测,明显提升多尺度行人检测的性能;该方法先采用梯形路径增强模型提取图片的多尺度特征,再通过多尺度特征融合模型进行特征融合;所述梯形路径增强模型为在现有特征金字塔的基础上加入更高层次的特征层来提取更高层次的语义特征信息;所述多尺度特征融合模型具体为通过相邻特征层的特征数据相加再级联的方式进行特征融合,以增强不同尺度下的特征信息,同时减少通道数。本发明提供的技术方案适用于行人检测的过程中。
-
公开(公告)号:CN118334247A
公开(公告)日:2024-07-12
申请号:CN202410477682.9
申请日:2024-04-19
Applicant: 北京科技大学
IPC: G06T17/00 , G06N3/0475 , G06N3/094 , G06N3/0455 , G06N3/0442
Abstract: 本发明公开了一种基于双路径Transformer的生成对抗网络协同手势合成方法及装置,涉及人机交互技术领域。包括:获取文本数据、音频数据以及说话者身份数据,输入到构建好的基于Transformer的跨模态融合网络模型,得到手势合成结果;其中,基于Transformer的跨模态融合网络模型包括:前端单模态编码器模块、跨模态融合模块以及手势翻译模块。本发明引入了一种创新性的多模态融合机制,实现端到端的协同语音手势生成。融合机制通过并行定向跨模态Transformer和交互式级联二维注意力模块的协同作用进行,填补了单个模态的不足,有助于模型将焦点集中在与手势相关的上下文和语音信息上。实现了无需预定义的三维手势生成,而非仅限于简单地预测手势类别,并在实现上取得了最优效果。
-
公开(公告)号:CN117288294B
公开(公告)日:2024-06-04
申请号:CN202311459279.5
申请日:2023-11-03
Applicant: 北京科技大学
IPC: G01F23/22 , G01F23/80 , G06V20/40 , G06N3/0442 , G06N3/08 , G06V10/774 , G06V10/82 , G10L25/30 , G10L25/51
Abstract: 本发明公开了一种基于听觉与触觉的水杯水位检测方法及装置,涉及检测水位技术领域。包括:将听觉数据输入到构建好的听觉特征提取模型进行特征提取得到听觉信息;将触觉数据输入到构建好的触觉特征提取模型进行特征提取得到触觉信息;对听觉信息以及触觉信息进行拼接得到多模态特征;根据多模态特征以及长短期记忆递归神经网络LSTM进行水位回归预测,得到水杯的水位检测结果。本发明引入触觉传感器,通过容器所含液体的增加使触觉传感器变形程度增加判断液体所含多少,结合倒水时的音频,采用神经网络预测液体含量具体的百分比,通过多模态的数据更细致地确定液体含量,提高预测的准确性及在各个环境中的普适性。
-
公开(公告)号:CN117828094A
公开(公告)日:2024-04-05
申请号:CN202311715380.2
申请日:2023-12-13
Applicant: 北京科技大学
IPC: G06F16/36 , G06N3/0455 , G06N5/02
Abstract: 本公开涉及知识图谱技术领域,涉及一种用于钢铁领域的知识图谱补全方法、模型、设备及介质。所述方法包括:获取钢铁领域的待补全知识图谱中第一元素的特征向量和第二元素的特征向量,所述第一元素和所述第二元素为所述待补全知识图谱的三元组中已存在的元素;将所述第一元素的特征向量和所述第二元素的特征向量进行变换,确定第三元素的初始特征向量,所述第三元素为所述待补全知识图谱的三元组中缺失的元素;将所述第三元素的初始特征向量输入至收敛的变分自编码器网络中,确定第三元素的重构特征向量;根据所述第三元素的重构特征向量,补全所述待补全知识图谱。不仅可以增强知识图谱推理的准确性,还可以适应逻辑关系复杂的知识图谱的推理。
-
公开(公告)号:CN116740790B
公开(公告)日:2024-02-09
申请号:CN202310746034.4
申请日:2023-06-21
Applicant: 北京科技大学
Abstract: 本发明公开了一种基于Transformer的人脸检测方法及装置,涉及计算机视觉技术领域。包括:获取待检测的图像数据;将图像数据输入到训练好的基于Transformer的人脸检测模型;其中,基于Transformer的人脸检测模型包括特征提取模块、多尺度特征构造模块、人脸检测模块以及人脸关键点检测模块;根据图像数据以及基于Transformer的人脸检测模型,得到图像数据的人脸检测结果。本发明使用Transformer作为骨干网络,通过双阶段目标检测结构实现基于Transformer的人脸检测。这样既能有效利用Transformer能更好地获得全局信息的特点,又能保证在使用相对较小的数据集时模型能够快速收敛。
-
公开(公告)号:CN117495679A
公开(公告)日:2024-02-02
申请号:CN202311460075.3
申请日:2023-11-03
Applicant: 北京科技大学
IPC: G06T3/4053 , G06T5/50 , G06N3/0442 , G06N3/0464 , G06N3/0499 , G06N3/08
Abstract: 本公开涉及一种基于非局部稀疏注意力的图像超分辨率方法和装置,属于图像处理的技术领域,该方法包括:获取被压缩的低分辨率图像;提取所述低分辨率图像的浅层特征,得到低分辨率图像的浅层特征图;对所述浅层特征图进行至少一次的通道稀疏处理和至少一次的空间稀疏处理,得到双维度稀疏特征图;将所述双维度稀疏特征图与所述浅层特征图进行融合,得到所述低分辨率图像的特征融合图;对所述特征融合图进行卷积和上采样处理,得到超分辨率图像。
-
公开(公告)号:CN117392437A
公开(公告)日:2024-01-12
申请号:CN202311220211.1
申请日:2023-09-20
Applicant: 北京科技大学
IPC: G06V10/764 , G06T7/73 , G06V10/25 , G06V10/766 , G06V10/82 , G06N3/0455 , G06N3/09 , G06F16/55
Abstract: 本公开实施例涉及计算机视觉领域,更具体地,涉及一种基于查询和任务对齐的目标检测方法及电子设备。所述基于查询和任务对齐的目标检测方法,包括:将目标图像输入目标检测网络,获得所述目标图像在分类任务的查询集合、在回归任务的查询集合和边界框的位置信息集合;将所述分类任务的查询集合、所述回归任务的查询集合和所述边界框的位置信息集合输入稀疏解码器,获得分类任务的预测和回归任务的预测;根据所述分类任务的预测和所述回归任务的预测获得目标检测结果。
-
公开(公告)号:CN117372691A
公开(公告)日:2024-01-09
申请号:CN202311220049.3
申请日:2023-09-20
Applicant: 北京科技大学
IPC: G06V10/26 , G06V10/764 , G06T7/66 , G06T7/136 , G06T7/73 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/08
Abstract: 本申请涉及计算机视觉领域,更具体地,涉及一种实例分割方法、装置、设备及介质。所述实例分割方法,包括:获取待分割图像;基于所述待分割图像的实例的中心点,确定所述待分割图像的实例的查询向量;基于所述实例的查询向量,确定所述实例的分类结果、定位结果以及分割结果。
-
-
-
-
-
-
-
-
-