Patent search ap:("北京科技大学") AND inv:"孙梦磊" Page 2

11.

发明公开
基于自适应数据增强的转炉炼钢终点碳温预测方法及装置审中-实审

公开(公告)号：CN119514379A

公开(公告)日：2025-02-25

申请号：CN202411695219.8

申请日：2024-11-25

Applicant: 北京科技大学

Inventor： 李擎 , 杨思琪 , 刘艳 , 林金辉 , 孙梦磊 , 魏泽基 , 张晓峰 , 殷绪成 , 黄晨 , 谭朝 , 王圣然 , 唐梦兆

IPC: G06F30/27 , G06N20/20 , G06N5/01 , G06F18/214 , G06F18/2413 , G06F17/10 , G06F18/243 , G06F119/08

Abstract: 本发明提供一种基于自适应数据增强的转炉炼钢终点碳温预测方法及装置，涉及转炉炼钢技术领域。该方法包括：对转炉炼钢过程的历史生产数据集中的数据进行预处理；通过自适应SMOTE数据增强技术对预处理后的数据集进行处理；基于随机森林搭建炼钢终点碳温预测模型；根据处理后的数据集对炼钢终点碳温预测模型进行训练，根据训练好的自适应数据增强的炼钢终点碳温预测模型得到转炉炼钢终点碳温预测结果。本发明旨在利用数据预处理方法和自适应SMOTE数据增强算法提高转炉炼钢过程数据集的样本量和多样性，去除冗余信息，减少手工整理和处理数据的劳动成本并根据数据分布密度和不同工况条件引入自适应机制，提升模型的泛化能力和预测精度。

12.

发明公开
家装场景的智能调度系统、方法、电子设备及存储介质审中-实审

公开(公告)号：CN119902496A

公开(公告)日：2025-04-29

申请号：CN202411907962.5

申请日：2024-12-23

Applicant: 北京科技大学

Inventor： 祝晓斌 , 沈嘉浩 , 林金辉 , 杨春 , 冯伊洋 , 孙梦磊 , 杨思琪

IPC: G05B19/418

Abstract: 本公开涉及智能调度领域，更具体地，本公开涉及一种家装场景的智能调度系统、方法、电子设备及存储介质。系统包括：解析模块，所述解析模块基于大语言模型解析用户输入的信息，获得输入特征；模型选择模块，所述模型选择模块基于所述解析模块获得的所述输入特征，从预存储的多个模型中确定与所述用户输入的信息相关的目标模型；处理模块，所述处理模块通过所述目标模型对所述用户输入的信息进行处理，获得对应的处理结果。

13.

发明公开
保护壁纸类型的识别方法、装置、电子设备及存储介质审中-实审

公开(公告)号：CN119810806A

公开(公告)日：2025-04-11

申请号：CN202411756387.3

申请日：2024-12-02

Applicant: 北京科技大学

Inventor： 殷绪成 , 林金辉 , 祝晓斌 , 代松康 , 孙梦磊 , 杨思琪 , 杨春

IPC: G06V20/60 , G06V10/25

Abstract: 本公开涉及壁纸检测领域，更具体地，本公开涉及一种保护壁纸类型的识别方法、装置、电子设备及存储介质。方法包括：通过预训练的目标检测模型检测识别目标图像，获得第一检测框、第二检测框和第三检测框，其中，第一检测框用于标记门在目标图像中对应的区域，第二检测框用于标记窗户在目标图像中对应的区域，第三检测框用于标记保护壁纸在目标图像中的对应的区域；基于第一检测框、第二检测框和第三检测框的相对位置关系，确定每个第三检测框对应的保护壁纸的类型，保护壁纸的类型包括门的保护壁纸、窗户的标准壁纸或其他类型的保护壁纸。

14.

发明公开
一种基于局部注意力机制的人脸活体检测方法及装置有权

公开(公告)号：CN117133059A

公开(公告)日：2023-11-28

申请号：CN202311045752.5

申请日：2023-08-18

Applicant: 北京科技大学

Inventor： 刘艳 , 张梁凤 , 陈磊 , 李凯 , 孙梦磊 , 杨思琪 , 邢煜梓 , 胡梅钰 , 陈松路 , 殷绪成

IPC: G06V40/40 , G06V40/16 , G06V20/40 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/084

Abstract: 本发明提供一种基于局部注意力机制的人脸活体检测方法和装置，方法包括：S1、将人脸活体检测数据集中的视频进行预处理，得到预处理后的图片数据；S2、在图像分类数据集ImageNet上预训练的视觉Transformer模型Vi T中，插入局部注意力Patch Attent i on模块和新的MLP分类头，再使用所述预处理后的图片数据对新的视觉Transformer模型进行微调，得到训练完成的Vi T*模型；S3、使用所述Vi T*模型作为教师网络，指导插入局部注意力Patch Attent i on模块的轻量级Vi T‑T i ny模型学习，训练得到最终的Vi T‑T i ny*模型；S4、使用最终的Vi T‑T i ny*模型进行推理，判断待检测图片是否为真实人脸。本发明对演示攻击具有良好的分辨能力，从而提升模型检测精度。

15.

发明授权
一种基于堆栈记忆网络的多模态语音合成方法及系统有权

公开(公告)号：CN116543749B

公开(公告)日：2023-09-15

申请号：CN202310814315.9

申请日：2023-07-05

Applicant: 北京科技大学

Inventor： 刘艳 , 魏丽芳 , 钱馨园 , 杨思琪 , 孙梦磊 , 刘琦 , 张天昊 , 陈松路 , 殷绪成

IPC: G10L13/08 , G10L13/10 , G10L25/30 , H04N21/43

Abstract: 本发明提供一种基于堆栈记忆网络的多模态语音合成方法及系统，涉及视频和语音处理技术领域，包括：用视频信息辅助从文本中合成具有视听同步性的语音。从人脸中提取说话人特性，即利用人脸控制合成语音的音色。在训练和推理时，通过引入的视频‑语音堆栈记忆网络，显式的利用视频检索对应语音，并从检索得到的语音中提取风格特征，解决多模态TTS模块训练‑推理风格不匹配的问题并增强合成音频的表现性，定制个性化语音。本发明引入视频‑语音堆栈记忆网络显式的连接视频和语音两个模态，而非利用距离损失去最小化不同模态信息提取的特征之间的距离。

Patent Agency Ranking