Patent search ap:("华中师范大学") AND inv:"廖盛斌" Page 1

1.

发明公开
一种听力检测的音频数据处理方法、设备及存储介质审中-实审

公开(公告)号：CN115938396A

公开(公告)日：2023-04-07

申请号：CN202211481083.1

申请日：2022-11-24

Applicant: 华中师范大学

Inventor： 廖盛斌 , 韩雪晴

IPC: G10L25/66 , G10L15/06 , G10L15/02 , G10L19/02 , G10L25/18 , G10L25/21 , G10L25/24 , G06F18/214 , G06N20/00 , G06F17/18 , A61B5/12

Abstract: 本发明提出的一种听力检测的音频数据处理方法，该方法包括：将采集的听障儿童的音频数据输入至一听力检测模型，获得处理后的数据。听力检测模型的生成为采集包括指定音频的音频源，处理后得到声学数据集；从声学数据集中提取音频声学特征；以音频声学特征建立样本集并训练声学模型；以音频声学特征迭代优化声学模型获取听力检测模型，充分利用了机器学习算法，不仅不需要配备诸多的昂贵设备。本发明还公开了一种听力检测的音频数据处理设备及存储介质，可为移动终端，方便随身携带、随时测试，能使听障儿童和训练师随时随地使用，能够快速高效的对听障儿童听力检测的音频数据进行处理，同时也减少了对专业人士的依赖。

2.

发明公开
一种听障儿童发音水平测试方法、设备及存储介质审中-实审

公开(公告)号：CN115713935A

公开(公告)日：2023-02-24

申请号：CN202211475922.9

申请日：2022-11-23

Applicant: 华中师范大学

Inventor： 廖盛斌 , 方安妮

IPC: G10L15/16 , G10L17/04 , G10L25/30 , G10L25/60 , G06F18/23 , G06N3/042 , G10L15/06

Abstract: 本发明提出的一种听障儿童发音水平测试方法，该方法包括：采集听障儿童的训练过程中一段时间内的发音数据集，并按训练时间顺序进行排序，然后将发音数据集按顺序依次进行预处理；将预处理后的发音数据集按顺序依次全部输入到聚类模型中进行聚类得到多组聚类簇,再将多组聚类簇分别输入到图神经网络知识追踪模型中进行单独训练后得到多组知识追踪模型；多组知识追踪模型接收新采集的听障儿童的发音数据依次进行预处理和聚类后，输出测试结果。此外，本发明还公开了相应的设备及存储介质。本发明通过对听障儿童学习过程中的学习数据进行个性化建模实现对听障儿童现有发音水平进行预测，同时也提高了知识追踪模型的个性化能力和时间动态特性。

3.

发明授权
一种课堂实时人体动作识别方法、计算机设备及可读介质有权

公开(公告)号：CN114140876B

公开(公告)日：2025-01-28

申请号：CN202111407773.8

申请日：2021-11-24

Applicant: 华中师范大学

Inventor： 廖盛斌 , 杨宗凯

IPC: G06V40/20 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/084

Abstract: 本申请公开了一种课堂实时人体动作识别方法、计算机设备及可读介质，该方法包括：从待分析的课堂视频中实时提取RGB图像和光流图；将RGB图像或RGB图像和光流图输入训练好的混合卷积神经网络中，获取课堂视频中的人体动作分类结果；混合卷积神经网络具有宽残差网络结构，包括二维卷积网络以及与所述二维卷积网络并联的三维卷积网络，分别从RGB图像及光流图中提取二维特征向量和三维特征向量；基于将二维特征向量和三维特征向量进行融合后得到的特征图识别人体动作；本发明结合了深度卷积神经网络、RGB图像和光流图，并使用高效的数据提取算法，不仅使人体动作识别的精度得到进一步提升，而且，实时的视频人体动作识别过程中不存在掉帧和卡顿现象。

4.

发明授权
一种基于改进TopicRank算法的文本关键词抽取方法有权

公开(公告)号：CN111859961B

公开(公告)日：2024-02-23

申请号：CN202010743694.3

申请日：2020-07-29

Applicant: 华中师范大学

Inventor： 廖盛斌 , 郑章雄

IPC: G06F40/289 , G06F40/30 , G06F16/35

Abstract: 本发明公开了一种基于改进TopicRank算法的文本关键词抽取方法，包括步骤：对文本进行预处理，从预处理后的文本中抽取候选关键词，并对候选关键词进行向量化，然后对向量化后的候选关键词进行聚类生成主题；构建图模型，利用图模型获取每个主题的分值。其中，图模型的顶点代表主题，图模型的边代表构成边的两个顶点所表示主题间的语义关系，边对应的分值权重由主题包含的候选关键词的相对位置、绝对位置和长度确定；从高到低选取分值最高的n个主题，n为预先定义的正整数，从选取的n个主题包含的候选关键词中选取最终文本关键词。本发明能够有效改进TopicRank算法抽取关键词的效果，提高抽取关键词的准确率。

5.

发明公开
一种融合多模态数据的3D卷积神经网络手语识别方法有权

公开(公告)号：CN107679491A

公开(公告)日：2018-02-09

申请号：CN201710909671.3

申请日：2017-09-29

Applicant: 华中师范大学

Inventor： 廖盛斌 , 梁智杰 , 杨宗凯 , 刘三女牙 , 左明章 , 刘攀 , 吴琼 , 郭丰

IPC: G06K9/00 , G06K9/32 , G06K9/34 , G06K9/46 , G06K9/62

Abstract: 本发明公开了一种基于多模态数据的3D卷积神经网络动态手语识别方法，具体为：构建深度神经网络，分别针对手势红外图像和轮廓图像从视频的空间维度和时间维度进行特征提取，融合两个基于不同数据格式的网络输出进行最终的手语分类。本发明对两种不同数据格式中的肢体运动轨迹信息进行准确的提取，有效降低了模型的计算复杂度，并采用深度学习策略融合两个网络的分类结果，有效解决了单个分类器由于数据丢失所引起的分类错误问题，使模型对不同场景的光照和背景噪声干扰有较好的鲁棒性。

6.

发明公开
图像的风格化描述的生成方法、装置及电子设备审中-实审

公开(公告)号：CN116824208A

公开(公告)日：2023-09-29

申请号：CN202310479314.3

申请日：2023-04-28

Applicant: 华中师范大学

Inventor： 廖盛斌 , 齐飞

IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06F16/35 , G06F40/30 , G06N3/0442

Abstract: 本发明提供一种图像的风格化描述的生成方法、装置及电子设备，属于教育信息化技术领域，方法包括：获取图像样本以及图像样本对应的风格化描述文本，并根据不同的风格将风格化描述文本划分为不同的类别；根据图像样本以及对应的风格化描述文本，构造训练集和测试集；基于所述训练集和所述测试集，利用K折交叉验证的方法对预先构建的风格化描述模型进行训练，获取训练完成的风格化描述模型；将待描述图像输入至训练完成的风格化描述模型，输出待描述图像的风格化描述。本发明通过预先构建的风格化描述模型对风格化文本进行标记处理，产生特定的风格化描述，听障儿童能够通过图片的文本描述了解到图片的内容，有利于学生心智的健康发展。

7.

发明公开
一种数字仪表的测量结果识别方法及装置审中-实审

公开(公告)号：CN116469109A

公开(公告)日：2023-07-21

申请号：CN202310399968.5

申请日：2023-04-13

Applicant: 华中师范大学

Inventor： 廖盛斌 , 谢鹏航

IPC: G06V30/19 , G06V10/82 , G06N3/0464 , G06N3/08

Abstract: 本发明提供一种数字仪表的测量结果识别方法及装置，属于图像识别技术领域，所述方法包括：根据预设模板信息，从目标场景灰度图像中提取出数字仪表的显示屏图像；从所述显示屏图像中提取多个字符图像，并确定小数点相对于多个字符图像的位置；所述字符图像包括：数字字符图像和单位字符图像；将每个字符图像输入字符识别模型，输出每个所述字符图像的识别结果；根据每个所述字符图像的识别结果以及小数点的位置，确定所述数字仪表的测量结果。本发明减少了深度学习中数据集的搜集、标记和训练等冗长工作，提高了工作效率；本发明还支持设定多种不同型号数字电阻表的模板信息，以方便用户有不同的需求，适用性更强。

8.

发明公开
一种利用音频生成视频的方法及装置审中-实审

公开(公告)号：CN116389850A

公开(公告)日：2023-07-04

申请号：CN202310243642.3

申请日：2023-03-14

Applicant: 华中师范大学

Inventor： 廖盛斌 , 李一鸣

IPC: H04N21/81 , G06V40/16 , G06V20/40 , G06V10/75 , G06V10/44 , G06V10/82 , G06N3/0442 , G06N3/0464 , G06N3/048 , G06N3/08

Abstract: 本发明提供一种利用音频生成视频的方法及装置，属于计算机技术领域，所述方法包括：从目标音频中提取出目标音频特征；对目标图像进行人脸解析获取人脸解析图像，并对所述人脸解析图像进行逐像素投射光线以进行光线点的采样；将光线点的空间坐标和方向以及所述目标音频特征输入到多层感知机，获取光线点的颜色和密度；基于光线点的颜色和密度，利用体绘制技术渲染出与所述目标音频匹配的目标人脸视频。本发明提供的利用音频生成视频的方法及装置，将目标音频特征和人脸解析图像投射光线点的空间坐标和方向输入到多层感知机中，获取光线点的颜色和密度，然后再利用体绘制技术生成表情和唇部动作与目标音频一致的视频。

9.

发明公开
一种利用文本进行视频检索的方法及装置审中-实审

公开(公告)号：CN116383439A

公开(公告)日：2023-07-04

申请号：CN202310276552.4

申请日：2023-03-16

Applicant: 华中师范大学

Inventor： 廖盛斌 , 张林

IPC: G06F16/783 , G06V10/80 , G06V10/74 , G06V10/82 , G06V20/40 , G06N3/08 , G06N3/0464

Abstract: 本发明提供一种利用文本进行视频检索的方法及装置，属于计算机技术领域，所述方法包括：将关键帧和参考文本特征输入预设形变卷积网络，利用参考文本特征指导预设形变卷积网络生成动态感受野，以提取关键帧的视觉特征；利用动量蒸馏的对比学习方法，对视觉特征和参考文本特征进行特征对齐；将对齐后的视觉特征和参考文本特征输入模态融合网络，确定相似度最高的目标关键帧，作为视频检索结果。本发明在网络结构上重新设计视频数据的编码器，并用文本作为参考特征，指导形变卷积网络的感受野的生成，有效的解决了模型参数过大，训练时损失函数下降困难，模态融合前特征不能充分对齐的问题，兼顾了利用文本检索视频的效率和准确率。

10.

发明公开
一种基于滑动销售漏斗的车企活动运营KPI分配方法及应用审中-实审

公开(公告)号：CN114139920A

公开(公告)日：2022-03-04

申请号：CN202111420595.2

申请日：2021-11-26

Applicant: 华中师范大学

Inventor： 廖盛斌 , 余洋

IPC: G06Q10/06 , G06Q30/02

Abstract: 本申请公开了一种基于滑动销售漏斗的车企活动运营KPI分配方法及应用，该方法包括：获取历史数据，将历史数据以周期为单位输入漏斗表中；基于历史数据计算关键指标及多个属性之间的相关度；从漏斗表中提取窗口长度为设定周期的关键指标及与其关联的多个属性作为训练数据构建当前周期的指标预测模型；根据指标预测模型预测当前周期的关键指标值；获取当前周期真实的关键指标值并填充至漏斗表中，将漏斗表的窗口向前滑动一个周期，从中提取具有设定周期的关键指标值构建下一周期的指标预测模型，预测下一周期的关键指标值；本发明基于滑动窗口的方式进行数据处理，能使计算出的指标有更好的可解释性和准确性，提高了指标预测的精准度和指标调整的合理性。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification