一种说话者确认方法及系统

    公开(公告)号:CN113345444B

    公开(公告)日:2022-10-28

    申请号:CN202110496856.2

    申请日:2021-05-07

    Abstract: 本发明提供一种说话者确认方法及系统,包括:对说话者的音频信息进行预处理,将所述音频信息转换为预设格式的数据;将说话者音频信息对应的预设格式的数据输入到训练好的基于空间注意力机制的深度嵌套残差神经网络,以得到帧级别的说话者向量;基于所述帧级别的说话者向量生成话语级别的说话者向量,并计算所述话语级别的说话者向量和目标说话者向量的余弦相似度,以判断所述说话者是否为目标说话者;所述目标说话者向量是预先获取的。本发明提出了一种基于空间注意力机制的深度嵌套残差神经网络,通过深度神经网络更准确地提取说话者声纹特征。

    一种教师非言语行为测量方法及系统

    公开(公告)号:CN113743263A

    公开(公告)日:2021-12-03

    申请号:CN202110970746.5

    申请日:2021-08-23

    Abstract: 本发明公开了一种教师非言语行为测量方法及系统,其中,测量方法包括:对教室进行三维建模,并对教学视频的二维图像信息进行分析处理,计算每一帧视频中的教师头部三维坐标和头部欧拉角,得到教师视线落点数据,并将视线落点投射在三维建模的教室空间中,实现了教师视线落点的可视化;本发明通过分析教师视线落点的离散度和覆盖率了解教师授课时的注意力分布情况;本发明将教学视频按每5帧分组,通过教师头部欧拉角解析教师头部移动,识别连续头部移动对应的不同教学行为,从而了解教师的授课风格和课堂氛围。

    一种基于声纹识别的S-T分类方法、装置及设备终端

    公开(公告)号:CN110544481A

    公开(公告)日:2019-12-06

    申请号:CN201910798357.1

    申请日:2019-08-27

    Abstract: 本发明公开了一种基于声纹识别的S-T分类方法、装置及设备终端,该方法包括:根据从目标语音样本数据中提取的声纹特征建立目标声纹标准模型;通过话语检测将待测的课堂语音数据分割为不同的语音片段,每个语音片段包含单一说话人的语音数据;将各语音片段与目标声纹标准模型进行匹配并计算相似性得分并将得分高于预设的得分阈值的语音片段判定为目标语音;本发明基于行为在时间维度进行连续抽样,通过话语检测分割出教师和学生各自话语行为的语音片段;根据采集数据分析教学模式,多维度可视化呈现教学过程中的行为数据;在收集数据时有更高的准确性,大大降低了采样时部分行为数据丢失的可能性,提高了后续模型匹配过程中的分类准确性。

    行为分析方法、装置、电子设备及存储介质

    公开(公告)号:CN112668467A

    公开(公告)日:2021-04-16

    申请号:CN202011573481.7

    申请日:2020-12-25

    Abstract: 本申请提供了一种行为分析方法、装置、电子设备及存储介质,涉及数据处理技术领域,该方法包括:基于第一评价数据构建特征矩阵,基于第二评价数据以及设定行为计量表计算得到标签向量。将特征矩阵与标签向量进行拼接后得到第一矩阵,并将第一矩阵输入线性回归模型以得到拟合数据曲线,拟合数据曲线用于表征宣讲者的行为与听讲者的行为的关联性。本申请通过拟合曲线得到宣讲者的行为与听讲者行为的关联性,以分析听讲者对宣讲者行为的反馈行为,避免人工针对听讲者的行为评价宣讲者的行为时的主观性,以提高行为分析的准确性。

    一种数据处理方法、装置、电子设备及存储介质

    公开(公告)号:CN112668476B

    公开(公告)日:2024-04-16

    申请号:CN202011585656.6

    申请日:2020-12-28

    Abstract: 本申请提供一种数据处理方法、装置、电子设备及存储介质,所述数据处理方法具体包括:首先获取教师教学的原始音视频数据;然后从所述原始音视频数据中提取出表征教学行为的特征数据,并根据所述特征数据生成对应的隶属度矩阵,所述隶属度矩阵中的每一行用于表征该行对应的特征数据与预设标准的占比得分;最后基于所述隶属度矩阵以及所述特征数据对应的预设权重矩阵,得到用于表征教学行为质量的目标矩阵。通过本方案能客观、准确地对教学行为质量进行评估,解决了现有教学行为质量评估方法无法客观、准确地对教学行为质量进行评估的问题。

    一种教师非言语行为测量方法及系统

    公开(公告)号:CN113743263B

    公开(公告)日:2024-02-13

    申请号:CN202110970746.5

    申请日:2021-08-23

    Abstract: 本发明公开了一种教师非言语行为测量方法及系统,其中,测量方法包括:对教室进行三维建模,并对教学视频的二维图像信息进行分析处理,计算每一帧视频中的教师头部三维坐标和头部欧拉角,得到教师视线落点数据,并将视线落点投射在三维建模的教室空间中,实现了教师视线落点的可视化;本发明通过分析教师视线落点的离散度和覆盖率了解教师授课时的注意力分布情况;本发明将教学视频按每5帧分组,通过教师头部欧拉角解析教师头部移动,识别连续头部移动对应的不同教学行为,从而了解教师的授课风格和课堂氛围。

    行为分析方法、装置、电子设备及存储介质

    公开(公告)号:CN112668467B

    公开(公告)日:2023-11-07

    申请号:CN202011573481.7

    申请日:2020-12-25

    Abstract: 本申请提供了一种行为分析方法、装置、电子设备及存储介质,涉及数据处理技术领域,该方法包括:基于第一评价数据构建特征矩阵,基于第二评价数据以及设定行为计量表计算得到标签向量。将特征矩阵与标签向量进行拼接后得到第一矩阵,并将第一矩阵输入线性回归模型以得到拟合数据曲线,拟合数据曲线用于表征宣讲者的行为与听讲者的行为的关联性。本申请通过拟合曲线得到宣讲者的行为与听讲者行为的关联性,以分析听讲者对宣讲者行为的反馈行为,避免人工针对听讲者的行为评价宣讲者的行为时的主观性,以提高行为分析的准确性。

    一种说话者确认方法及系统

    公开(公告)号:CN113345444A

    公开(公告)日:2021-09-03

    申请号:CN202110496856.2

    申请日:2021-05-07

    Abstract: 本发明提供一种说话者确认方法及系统,包括:对说话者的音频信息进行预处理,将所述音频信息转换为预设格式的数据;将说话者音频信息对应的预设格式的数据输入到训练好的基于空间注意力机制的深度嵌套残差神经网络,以得到帧级别的说话者向量;基于所述帧级别的说话者向量生成话语级别的说话者向量,并计算所述话语级别的说话者向量和目标说话者向量的余弦相似度,以判断所述说话者是否为目标说话者;所述目标说话者向量是预先获取的。本发明提出了一种基于空间注意力机制的深度嵌套残差神经网络,通过深度神经网络更准确地提取说话者声纹特征。

    一种数据处理方法、装置、电子设备及存储介质

    公开(公告)号:CN112668476A

    公开(公告)日:2021-04-16

    申请号:CN202011585656.6

    申请日:2020-12-28

    Abstract: 本申请提供一种数据处理方法、装置、电子设备及存储介质,所述数据处理方法具体包括:首先获取教师教学的原始音视频数据;然后从所述原始音视频数据中提取出表征教学行为的特征数据,并根据所述特征数据生成对应的隶属度矩阵,所述隶属度矩阵中的每一行用于表征该行对应的特征数据与预设标准的占比得分;最后基于所述隶属度矩阵以及所述特征数据对应的预设权重矩阵,得到用于表征教学行为质量的目标矩阵。通过本方案能客观、准确地对教学行为质量进行评估,解决了现有教学行为质量评估方法无法客观、准确地对教学行为质量进行评估的问题。

    一种基于声纹识别的S-T分类方法、装置及设备终端

    公开(公告)号:CN110544481B

    公开(公告)日:2022-09-20

    申请号:CN201910798357.1

    申请日:2019-08-27

    Abstract: 本发明公开了一种基于声纹识别的S‑T分类方法、装置及设备终端,该方法包括:根据从目标语音样本数据中提取的声纹特征建立目标声纹标准模型;通过话语检测将待测的课堂语音数据分割为不同的语音片段,每个语音片段包含单一说话人的语音数据;将各语音片段与目标声纹标准模型进行匹配并计算相似性得分并将得分高于预设的得分阈值的语音片段判定为目标语音;本发明基于行为在时间维度进行连续抽样,通过话语检测分割出教师和学生各自话语行为的语音片段;根据采集数据分析教学模式,多维度可视化呈现教学过程中的行为数据;在收集数据时有更高的准确性,大大降低了采样时部分行为数据丢失的可能性,提高了后续模型匹配过程中的分类准确性。

Patent Agency Ranking