Patent search ap:("北京科技大学" OR "中冶京诚数字科技(北京)有限公司") AND inv:"殷绪成" Page 8

71.

发明公开
基于多目标跟踪的轮椅实时障碍物预测与躲避系统与方法审中-实审

公开(公告)号：CN119991738A

公开(公告)日：2025-05-13

申请号：CN202510197113.3

申请日：2025-02-21

Applicant: 北京科技大学

Inventor： 崔雨祺 , 殷绪成 , 赵鑫

IPC: G06T7/246 , G06V20/58 , G06V10/74 , G06T17/00 , G06F17/18 , G06Q10/0639

Abstract: 本发明属于智能轮椅技术领域，具体涉及了一种基于多目标跟踪的轮椅实时障碍物预测与躲避系统，旨在解决现有技术限制了轮椅在复杂动态环境中的表现和应用的问题。本发明包括：数据采集处理模块，用于计算障碍物距离基准点的距离；障碍物检测跟踪模块，用于基于多维特征生成障碍物的疑似区域；筛选出确定区域，然后计算确定区域的疑似动态障碍物的相似度，并基于相似度筛选出动态障碍物，基于可信度评分筛选出确定障碍物；决策控制模块，用于基于路径评价函数确定出可选路径；然后使用轨迹评价择优函数对路径规划对应的轨迹进行评分，选择稳定性最高的轨迹。本发明能够在较低计算量的前提下实现高效的障碍物检测与规避。

72.

发明公开
一种基于改进混合专家模型的转炉耗氧量预测方法及系统审中-实审

公开(公告)号：CN119943210A

公开(公告)日：2025-05-06

申请号：CN202411841867.X

申请日：2024-12-13

Applicant: 北京科技大学 , 宝山钢铁股份有限公司

Inventor： 殷绪成 , 朱超 , 孙博韬 , 刘孟寅 , 李青 , 贾树晋 , 谢树元

IPC: G16C20/70 , G16C20/10 , G06N20/20 , G06N3/042 , G06N3/045 , G06N3/0442 , G06N3/0499 , G06N3/084 , G06F18/2411 , G06F18/243 , G06F18/27

Abstract: 本发明提供一种基于改进混合专家模型的转炉耗氧量预测方法及系统，涉及数据处理技术领域，方法包括：构建混合专家模型，混合专家模型包括专家部分和门控部分，专家部分包括多个转炉耗氧量预测模型；向专家部分输入预测参数；根据预测参数，通过专家部分中的各个转炉耗氧量预测模型，输出转炉耗氧量初步预测值；向门控部分输入预测参数以及各个转炉耗氧量预测模型输出的转炉耗氧量初步预测值；根据预测参数以及各个转炉耗氧量预测模型输出的转炉耗氧量初步预测值，通过门控部分，选取预设数量的转炉耗氧量预测模型作为目标转炉耗氧量预测模型；根据各个目标转炉耗氧量预测模型的转炉耗氧量初步预测值，计算转炉耗氧量最终预测值。

73.

发明公开
面向钢铁工业的基于大模型的智能统筹分配方法审中-实审

公开(公告)号：CN119558597A

公开(公告)日：2025-03-04

申请号：CN202411665536.5

申请日：2024-11-20

Applicant: 北京科技大学

Inventor： 刘艳 , 孙梦磊 , 薛颖健 , 林金辉 , 白晨成 , 钟承华 , 冯伊洋 , 殷绪成

IPC: G06Q10/0631 , G06Q50/04

Abstract: 本发明提供一种面向钢铁工业的基于大模型的智能统筹分配方法，涉及人工智能技术领域。所述一种面向钢铁工业的基于大模型的智能统筹分配方法由用户端、任务需求输入模块、大模型语义理解模块、子模型调度模块、执行与结果分析模块实现，该方法包括：用户端输入钢铁工业生产的任务需求；任务需求输入模块通过对任务需求进行标准化处理，获得标准化的文本数据；大模型语义理解模块对文本数据进行处理，获得任务目标、任务模型需求以及任务模型的参数；通过子模型调度模块进行动态调度，确定子模型；子模型执行任务，获得子模型的执行结果；执行与结果分析模块对执行结果进行处理，输出符合任务需求的综合分析结果。采用本发明可提升任务处理效率。

74.

发明公开
一种多摄像机视频帧自动对齐方法审中-实审

公开(公告)号：CN119484997A

公开(公告)日：2025-02-18

申请号：CN202411584188.9

申请日：2024-11-07

Applicant: 北京科技大学

Inventor： 殷绪成 , 魏振洋 , 刘艳 , 林金辉

IPC: H04N23/60 , H04N5/06 , H04N7/18 , H04N21/218

Abstract: 本发明公开了一种多摄像机视频帧自动对齐方法，属于计算机视觉技术领域，该方法包括：获取各个摄像机拍摄的视频帧，并基于预设的评分函数，衡量不同摄像机所捕获的视频帧之间的相似度，以在视频帧中找到一个标准帧作为对齐参考帧；构建时间流模型，以建模视频帧随时间的变化；利用时间流模型，基于时间偏移定理，估计每个摄像机的时间偏移量；根据时间偏移量，调整每个摄像机的视频帧，使其与标准帧对齐。本发明显著提高了视频三维重建的准确性和效率。可适应不同视角、动态场景以及光照条件的变化，实现快速、准确的视频帧对齐。

75.

发明授权
车载环境下基于图卷积神经网络的异常驾驶行为识别方法有权

公开(公告)号：CN112329689B

公开(公告)日：2024-06-18

申请号：CN202011280953.X

申请日：2020-11-16

Applicant: 北京科技大学

Inventor： 殷绪成 , 王顺 , 陈松路 , 杨春

IPC: G06V20/59 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0442 , G06N3/09

Abstract: 本发明提供了一种车载环境下基于图卷积神经网络的异常驾驶行为识别方法，涉及计算机视觉技术领域，能够对人体细微行为和相似性行为做出有效识别，提高异常驾驶行为的识别能力；该方法采用改进型时空卷积网络和新型循环神经网络相结合的方式识别人体行为；改进型时空卷积网络在原有时空卷积网络的基础上进一步增加关节数量来改进空间拓扑图，提取多帧骨架序列片段的时空特征信息，再使用引入了长短期记忆的神经网络提取不同骨架序列片段的时间语义信息，以提取出的所有信息为依据进行驾驶行为的识别。本发明提供的技术方案适用于人体行为识别的过程中。

76.

发明公开
一种无碰撞的无人水下航行器的轨迹生成方法及系统审中-实审

公开(公告)号：CN118092439A

公开(公告)日：2024-05-28

申请号：CN202410198447.8

申请日：2024-02-22

Applicant: 北京科技大学

Inventor： 段凯蓉 , 殷绪成

IPC: G05D1/43

Abstract: 本发明提供了一种无碰撞的无人水下航行器的轨迹生成方法及系统，所述轨迹生成方法包括以下步骤：S1：获取无人水下航行器集群的参数数据；S2：根据参数数据建立轨迹粒子模型；S3：获取每个无人水下航行器的运动状态数据并对轨迹粒子模型进行求解，获得轨迹粒子模型的控制算法；S4：将轨迹粒子模型的控制算法输入每个无人水下航行器的控制器中；S5：通过轨迹粒子模型输出期望运动轨迹；S6：每个无人水下航行器根据期望运动轨迹生成无碰撞轨迹，本发明基于平滑阶跃函数设计集群防碰撞策略，实现了水下航行器集群的无碰撞轨迹规划，提高了无人水下航行器在实际环境中的路径安全性。

77.

发明公开
一种具有选择性听觉的目标说话人追踪方法及系统无效

公开(公告)号：CN118053443A

公开(公告)日：2024-05-17

申请号：CN202410043472.9

申请日：2024-01-11

Applicant: 北京科技大学

Inventor： 钱馨园 , 高嘉然 , 毛裕川 , 李皖林 , 殷绪成

IPC: G10L21/0308 , G10L19/02 , G10L19/022 , G10L19/26 , G10L25/18 , G10L25/24 , G10L25/30

Abstract: 本发明提供一种具有选择性听觉的目标说话人追踪方法及系统，涉及语音识别技术领域。所述方法包括：利用一对麦克风捕获包含目标说话人和干扰说话人的混合音频，并给定目标说话人预注册的参考音频；对混合音频和参考音频分别进行短时傅里叶变换，得到混合频谱图和参考频谱图；将混合频谱图和参考频谱图输入预训练的声音滤波器中，生成针对目标说话人的掩码；将掩码与混合频谱图相乘，生成被掩码的频谱图；将被掩码的频谱图输入至预设计的LSTM网络模块进行方位角估算，得到估算的目标说话人的方位角。本发明能够只关注目标说话人的语音内容，忽视其他背景干扰声，从而实现更精确和可靠的目标说话人追踪。

78.

发明授权
一种基于局部注意力机制的人脸活体检测方法及装置有权

公开(公告)号：CN117133059B

公开(公告)日：2024-03-01

申请号：CN202311045752.5

申请日：2023-08-18

Applicant: 北京科技大学

Inventor： 刘艳 , 张梁凤 , 陈磊 , 李凯 , 孙梦磊 , 杨思琪 , 邢煜梓 , 胡梅钰 , 陈松路 , 殷绪成

IPC: G06V40/40 , G06V40/16 , G06V20/40 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/084

Abstract: 本发明提供一种基于局部注意力机制的人脸活体检测方法和装置，方法包括：S1、将人脸活体检测数据集中的视频进行预处理，得到预处理后的图片数据；S2、在图像分类数据集ImageNet上预训练的视觉Transformer模型Vi T中，插入局部注意力Patch Attent i on模块和新的MLP分类头，再使用所述预处理后的图片数据对新的视觉Transformer模型进行微调，得到训练完成的Vi T*模型；S3、使用所述Vi T*模型作为教师网络，指导插入局部注意力Patch Attent i on模块的轻量级Vi T‑T i ny模型学习，训练得到最终的Vi T‑T i ny*模型；S4、使用最终的Vi T‑

79.

发明授权
一种基于空间线索的语音-图像跨模态检索方法及装置有权

公开(公告)号：CN116821381B

公开(公告)日：2023-12-01

申请号：CN202311104574.9

申请日：2023-08-30

Applicant: 北京科技大学

Inventor： 钱馨园 , 高天浩 , 王雨桐 , 魏丽芳 , 刘艳 , 殷绪成

IPC: G06F16/432 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06F16/435

Abstract: 本发明公开了一种基于空间线索的语音‑图像跨模态检索方法及装置，涉及计算机视觉和语音处理技术领域。包括：将语音信号输入到音频编码器，得到空间相关的声学特征；将图像信息输入到图像编码器，得到场景图像特征；对特征进行CSIR，得到跨模态检索结果。本发明通过使用深度学习和相关算法，能够对图像和语音之间的空间关联性进行分析与建模，从而实现图像和语音之间的跨模态检索。与以往的跨模态检索方法只针对语音‑图像的共同语义信息建模不同，本发明重点关注不同模态之间的空间语义一致性，通过深入研究图像和语音之间的空间属性联系，本发明可以帮助用户更高效地检索相关的图像和语音内容，提供更好的交互体验和信息管理

80.

发明授权
图像识别方法、装置、计算机设备以及存储介质有权

公开(公告)号：CN111126396B

公开(公告)日：2023-08-22

申请号：CN201911360763.6

申请日：2019-12-25

Applicant: 北京科技大学 , 腾讯科技(深圳)有限公司

Inventor： 杨春 , 殷绪成 , 王红法 , 郭春超

IPC: G06V20/62 , G06V10/774 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08

Abstract: 本申请实施例提供了一种图像识别方法、装置、计算机设备以及存储介质，本申请属于人工智能领域，该方法包括：根据分类器集合获取与图像相关联的对象识别结果集合；分类器集合包括至少两个分类器，至少两个分类器为处于不同的参数训练阶段的模型，至少两个分类器均用于识别图像中所包含的目标对象，每个分类器均对应一个识别结果；获取至少两个分类器分别对应的识别置信度；根据识别置信度与对象识别结果集合中所包含的识别结果，确定图像对应的目标识别结果。采用本申请实施例，可以提高图像识别的准确率。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification