-
公开(公告)号:CN112329689A
公开(公告)日:2021-02-05
申请号:CN202011280953.X
申请日:2020-11-16
Applicant: 北京科技大学
Abstract: 本发明提供了一种车载环境下基于图卷积神经网络的异常驾驶行为识别方法,涉及计算机视觉技术领域,能够对人体细微行为和相似性行为做出有效识别,提高异常驾驶行为的识别能力;该方法采用改进型时空卷积网络和新型循环神经网络相结合的方式识别人体行为;改进型时空卷积网络在原有时空卷积网络的基础上进一步增加关节数量来改进空间拓扑图,提取多帧骨架序列片段的时空特征信息,再使用引入了长短期记忆的神经网络提取不同骨架序列片段的时间语义信息,以提取出的所有信息为依据进行驾驶行为的识别。本发明提供的技术方案适用于人体行为识别的过程中。
-
公开(公告)号:CN111126243A
公开(公告)日:2020-05-08
申请号:CN201911320665.X
申请日:2019-12-19
Applicant: 北京科技大学 , 腾讯科技(深圳)有限公司
Abstract: 本申请公开了一种图像数据检测方法、装置以及计算机可读存储介质,该方法包括:获取检测图像,从检测图像中获取包含目标对象的情景图像;获取情景图像中的像素点对应的位置特征矩阵;位置特征矩阵中包括像素点针对目标对象的位置特征元素;根据情景图像中的目标对象的对象排版特征,生成用于调整位置特征矩阵中的位置特征元素的注意力机制矩阵;根据位置特征矩阵中的位置特征元素和注意力机制矩阵,确定像素点对应的预测区域,将像素点对应的预测区域添加至预测区域集合;在预测区域集合中,选择与目标对象在检测图像中的对象位置和对象尺寸相匹配的预测区域,作为目标区域。采用本申请,可提高针对目标对象的检测准确性。
-
公开(公告)号:CN109829042A
公开(公告)日:2019-05-31
申请号:CN201811623339.1
申请日:2018-12-28
Applicant: 北京科技大学
IPC: G06F16/332 , G06F16/33
Abstract: 本发明提供了一种基于生物医学文献的知识问答系统及方法,所述系统包括问题分析模块、文档检索模块和片段检索模块,所述问题分析模块通过所述文档检索模块与所述片段检索模块连接,所述方法首先进行问题分析,组合查询精炼和查询扩展技术,通过问题分析获取问题信息并生成查询条件,然后进行文档检索,利用检索方法查找相关医学文档,通过特定规则将N个排名靠前的文档的标题和摘要分割成句子合集,形成候选片段合集,最后进行片段检索,查找可以用来回答医学问题的相关句子并返回给用户,本发明融合了SDM,FSDM和PDFR检索方法,不仅对全局进行检索,还对不同文本域分配不同的权重进行检索,有效地提高了文档检索效果。
-
公开(公告)号:CN120069034A
公开(公告)日:2025-05-30
申请号:CN202510156068.7
申请日:2025-02-12
Applicant: 北京科技大学
IPC: G06N5/022 , G06F16/334 , G06F16/36 , G06F40/194 , G06F40/216 , G06F40/284
Abstract: 本公开涉及智能调度领域,更具体地,本公开涉及一种知识库的自动更新系统、方法、电子设备及存储介质。方法包括:从所述知识库对应的关键词库中获取第一关键词,所述关键词库中预先存储有多个与所述知识库相关的关键词;从预设信息源中提取包括所述至少一个关键词的第一文本信息;将所述第一文本信息存储到知识库中。
-
公开(公告)号:CN120067295A
公开(公告)日:2025-05-30
申请号:CN202510157046.2
申请日:2025-02-12
Applicant: 北京科技大学
IPC: G06F16/334 , G06F16/335 , G06F16/36 , G06F40/16
Abstract: 本公开涉及自然语言处理领域,更具体地,本公开涉及一种调研报告的生成方法、装置、电子设备及存储介质。方法包括:响应于用户输入的关键词,从预设数据源中获取与所述关键词相关的数据信息;基于预设筛选损失函数筛选所述数据信息中与所述关键词关联的内容;基于所述关键词关联的内容生成与所述关键词相关的调研报告。
-
公开(公告)号:CN119963483A
公开(公告)日:2025-05-09
申请号:CN202411908740.5
申请日:2024-12-23
Applicant: 北京科技大学
Abstract: 本公开涉及安全监测领域,更具体地,本公开涉及一种人窗相对距离的确定方法、装置、电子设备及存储介质。方法包括:通过预训练的目标检测模型识别目标图像,获得第一检测框和第二检测框的检测框信息,其中所述第一检测框用于标记人体在所述目标图像中对应的区域,所述第二检测框用于标记窗户在所述目标图像中对应的区域;分别确定人体和窗户在所述目标图像中的深度信息;根据所述检测框信息和深度信息确定人体和窗户的相对距离。
-
公开(公告)号:CN115115913B
公开(公告)日:2025-04-15
申请号:CN202210624687.0
申请日:2022-06-02
Applicant: 北京科技大学 , 深圳市腾讯计算机系统有限公司
IPC: G06V10/80 , G06V10/424 , G06V10/75 , G06V10/774 , G06V10/82 , G06V20/62 , G06V20/70 , G06N3/0455 , G06N3/0442 , G06N3/0499 , G06N3/047 , G06N3/084 , G06N3/0895
Abstract: 本发明公开了一种数据处理方法、装置、电子设备及存储介质,该方法包括:获取待处理文本的文本特征以及待处理图像的图像特征;所述待处理文本为所述待处理图像对应的描述文本;基于所述文本特征确定所述图像特征中的关键图像特征;所述关键图像特征为在所述文本特征中存在对应语义信息的图像特征;基于所述文本特征和所述关键图像特征进行融合处理得到多模态特征,将所述多模态特征编码到预设语义空间,得到多模态特征编码向量;基于所述多模态特征编码向量进行序列标注处理,得到目标对象标签序列;所述目标对象标签序列用于对所述待处理文本进行结构化处理以得到目标结构化数据。本发明提高了文本结构化处理结果的准确性。
-
公开(公告)号:CN119539155A
公开(公告)日:2025-02-28
申请号:CN202411552647.5
申请日:2024-11-01
Applicant: 北京科技大学
IPC: G06Q10/04 , G06Q10/10 , G06Q50/04 , G06F18/241 , G06F18/2415 , G06F18/15 , G06F18/243 , G06F18/211 , G06F18/2135 , G06N20/20
Abstract: 本发明提供一种基于自适应损失的多任务铸坯质量缺陷预测方法及装置,涉及人工智能技术领域。该方法包括:获取连铸生产样本数据集;对连铸生产样本数据集进行预处理,获得预处理后的样本数据集;构建初始的基于TabNet的多任务学习模型;根据预处理后的样本数据集对初始的基于TabNet的多任务学习模型进行训练,获得训练好的基于TabNet的多任务学习模型;获取待预测连铸生产数据;将待预测连铸生产数据进行预处理,获得预处理后的待预测连铸生产数据;将预处理后的待预测连铸生产数据输入训练好的基于TabNet的多任务学习模型中,获得连铸坯内部质量预测结果。采用发明可提高连铸坯内部质量缺陷预测的性能。
-
公开(公告)号:CN119514379A
公开(公告)日:2025-02-25
申请号:CN202411695219.8
申请日:2024-11-25
Applicant: 北京科技大学
IPC: G06F30/27 , G06N20/20 , G06N5/01 , G06F18/214 , G06F18/2413 , G06F17/10 , G06F18/243 , G06F119/08
Abstract: 本发明提供一种基于自适应数据增强的转炉炼钢终点碳温预测方法及装置,涉及转炉炼钢技术领域。该方法包括:对转炉炼钢过程的历史生产数据集中的数据进行预处理;通过自适应SMOTE数据增强技术对预处理后的数据集进行处理;基于随机森林搭建炼钢终点碳温预测模型;根据处理后的数据集对炼钢终点碳温预测模型进行训练,根据训练好的自适应数据增强的炼钢终点碳温预测模型得到转炉炼钢终点碳温预测结果。本发明旨在利用数据预处理方法和自适应SMOTE数据增强算法提高转炉炼钢过程数据集的样本量和多样性,去除冗余信息,减少手工整理和处理数据的劳动成本并根据数据分布密度和不同工况条件引入自适应机制,提升模型的泛化能力和预测精度。
-
公开(公告)号:CN118334247B
公开(公告)日:2024-12-13
申请号:CN202410477682.9
申请日:2024-04-19
Applicant: 北京科技大学
IPC: G06T17/00 , G06N3/0475 , G06N3/094 , G06N3/0455 , G06N3/0442
Abstract: 本发明公开了一种基于双路径Transformer的生成对抗网络协同手势合成方法及装置,涉及人机交互技术领域。包括:获取文本数据、音频数据以及说话者身份数据,输入到构建好的基于Transformer的跨模态融合网络模型,得到手势合成结果;其中,基于Transformer的跨模态融合网络模型包括:前端单模态编码器模块、跨模态融合模块以及手势翻译模块。本发明引入了一种创新性的多模态融合机制,实现端到端的协同语音手势生成。融合机制通过并行定向跨模态Transformer和交互式级联二维注意力模块的协同作用进行,填补了单个模态的不足,有助于模型将焦点集中在与手势相关的上下文和语音信息上。实现了无需预定义的三维手势生成,而非仅限于简单地预测手势类别,并在实现上取得了最优效果。
-
-
-
-
-
-
-
-
-