面向中文短文本的实体识别与实体链接方法

    公开(公告)号:CN113377930B

    公开(公告)日:2021-11-30

    申请号:CN202110931275.7

    申请日:2021-08-13

    Abstract: 本发明提供面向中文短文本的实体识别与实体链接方法,包括:使用知识库中的实体名称与实体别名信息去构建实体名称词典并识别出实体;将实体的描述文本输入到预训练语言模型中,得到实体的名称嵌入表示;将所述识别出的实体在原始短文本中的位置特征、原始短文本和所述实体的名称嵌入表示同时输入到融合知识库实体名嵌入的短文本实体识别模型中,得到当前实体是否为正确实体的概率;再与传统的实体识别模型融合,得到最终实体识别结果;利用给定的知识库构建实体指称项词典,并通过实体识别结果确定每一个待消歧实体的候选实体集合;将原始短文本和待消歧实体的描述文本连在一起,输入实体链接模型,得到正确的链接实体。

    基于Transformer的标记选择和合并的表情识别方法及系统

    公开(公告)号:CN113705541A

    公开(公告)日:2021-11-26

    申请号:CN202111224946.2

    申请日:2021-10-21

    Abstract: 本发明提供基于Transformer的标记选择和合并的表情识别方法及系统,包括:将图像分割成不重叠的斑块,并通过线性投影映射到一个D维度的特征向量,构成标记嵌入向量;将其输入第一Transformer网络,得到标记特征;动态地加入α参数计算标记特征的每个标记向量的权重,将标记向量的权重的数值较大的前k个标记向量输入第二Transformer网络,得到动态标记选择的预测结果;将标记特征进行重塑,得到新的结构化特征,并合并,组成包含上下文特征的标记;将其输入第三Transformer网络编码,得到标记合并的预测结果;取动态标记选择的预测结果和标记合并的预测结果取平均,取阈值最大的为表情识别的结果。

    基于音视频的疲劳状态检测方法和装置

    公开(公告)号:CN113642522A

    公开(公告)日:2021-11-12

    申请号:CN202111021587.0

    申请日:2021-09-01

    Abstract: 本发明提供基于音视频的疲劳状态检测方法和装置,包括:通过人脸识别技术在本地驾驶员档案数据库中确认目标驾驶员身份,如果没有对应人员信息,则新建驾驶员档案;在车辆驾驶过程中,采集目标驾驶员在驾驶过程中的音视频信息和生理信息,并提取出所述音视频信息和生理信息中与疲劳检测相关的数据,得到疲劳检测数据;面部视频信息、整体躯干部位视频信息和音频信息;根据疲劳检测数据和历史的疲劳检测数据对目标驾驶员当前状态进行分析,得出局部疲劳状态;根据局部疲劳状态,以及目标驾驶员当前持续驾驶时间,计算目标驾驶员综合疲劳状态并根据映射关系进行安全评价,根据安全评价的等级对所述目标驾驶员进行防疲劳驾驶示警操作。

    基于原始波形的轻量级神经网络生成语音鉴别方法和系统

    公开(公告)号:CN113314148B

    公开(公告)日:2021-11-09

    申请号:CN202110866648.7

    申请日:2021-07-29

    Abstract: 本发明提供基于原始波形的轻量级神经网络生成语音鉴别方法和系统,包括:按固定采样率对音频文件进行采样,得到所述音频文件的原始波形点,再将所述原始波形点切分为原始音频帧,得到原始音频帧序列;第一层为固定的一维卷积层,所述一维卷积层之后为常规模块和降维模块相互堆叠的结构,再之后是平均池化层,所述平均池化层之后为全连接层来构建搜索网络;将所述原始音频帧序列输入搜索网络,分别搜索常规模块和降维模块中每个神经元之间的最优操作连接,得到最优模型结构;应用所述原始音频帧序列训练搜索到的所述最优模型结构,得到训练好的搜索网络。

    一种语音鉴伪与说话人识别联合建模的方法

    公开(公告)号:CN113555023A

    公开(公告)日:2021-10-26

    申请号:CN202111098690.5

    申请日:2021-09-18

    Abstract: 本发明提供一种语音鉴伪与说话人识别联合建模的方法及系统,其中方法包括:前端信号处理:把训练数据通过信号重采样统一到一个固定采样率,得到信号处理后的训练数据;特征提取:对信号处理后的训练数据的每帧信号提取Fbank特征;表示向量提取:通过滑窗的方式将训练数据的Fbank特征切分成若干长度为T的片段序列,再将片段序列输入可以识别说话人的深度学习网络,得到说话人片段表示向量,并构造帧级别说话人识别损失函数;语音鉴伪和说话人识别联合分类:定义片段级别说话人识别目标函数;定义语音鉴伪目标函数;联合帧级别说话人识别损失函数、片段级别说话人识别目标函数和语音鉴伪目标函数三个目标进行联合优化。

    多模态融合的心理压力分析方法

    公开(公告)号:CN113255635B

    公开(公告)日:2021-10-15

    申请号:CN202110812718.0

    申请日:2021-07-19

    Abstract: 本发明提供多模态融合的心理压力分析方法,包括:把长的音视频切分为带有面部和语音的短音视频,并对短音视频进行分帧处理,得到图像序列和语音信号;对图像序列进行面部特征提取,得到面部帧序列;应用光流法对所述面部帧序列的相邻帧提取光流,得到光流序列;将面部帧序列和所述光流序列融合,进行线性映射得到面部嵌入向量;对图像序列提取感兴趣区,得到感兴趣序列,进行线性映射得到生理信号嵌入向量;以帧为单位提取所述语音信号的基本声学特征,进行线性映射得到声学嵌入向量;对语音信号和图像序列提取情感特征;将上述特征按帧序列的时间顺序融合,得到时空特征向量;将时空特征向量输入模型,再经过softmax分类得到心理压力等级。

    篡改音频的检测方法、装置、电子设备及存储介质

    公开(公告)号:CN113488070A

    公开(公告)日:2021-10-08

    申请号:CN202111048241.X

    申请日:2021-09-08

    Abstract: 本公开涉及一种篡改音频的检测方法、装置、电子设备及存储介质,上述方法包括:获取待检测信号,并对待检测信号进行第一预设阶数的小波变换,得到数量等于第一预设阶数的待检测信号对应的第一低频系数和第一高频系数;对阶数大于等于第二预设阶数的第一高频系数进行小波逆变换,得到待检测信号对应的第一高频分量信号;以帧为单位计算第一高频分量信号的第一梅尔倒谱特征,并将第一高频分量信号的当前帧信号和当前帧信号之前的预设数量的帧信号的第一梅尔倒谱特征融合,得到第一融合特征;通过深度学习模型对第一融合特征进行篡改音频检测。

    一种融合组合模型信息的语音鉴别模型压缩方法

    公开(公告)号:CN113362814A

    公开(公告)日:2021-09-07

    申请号:CN202110910114.X

    申请日:2021-08-09

    Abstract: 本发明提供一种融合组合模型信息的语音鉴别模型压缩方法,包括:采集目标模型的训练数据;提取所述目标模型的训练数据的声学特征;从目标模型的训练数据中提取样本标签信息,作为硬标签信息;同时采用前向计算方法,得到组合模型的后验概率信息;将组合模型的后验概率信息与硬标签信息进行线性插值,得到组合模型的监督概率信息;利用组合模型的监督概率信息辅助目标模型进行训练,通过最小化目标模型和组合模型的概率分布距离,得到训练后的目标模型。

    基于相位偏移检测的数字音频篡改取证方法

    公开(公告)号:CN113178199B

    公开(公告)日:2021-08-31

    申请号:CN202110727936.4

    申请日:2021-06-29

    Abstract: 本发明提供基于相位偏移检测的数字音频篡改取证方法,包括:将待鉴别信号与时间标签做乘积,得到待鉴别信号的调制信号;再对所述待鉴别信号和所述调制信号进行短时傅里叶变换,得到鉴别信号功率谱和调制信号功率谱;应用所述鉴别信号功率谱和调制信号功率谱计算群延迟特征;对所述群延迟特征做均值计算,再应用均值计算结果做平滑计算,得到当前帧信号的相位信息;应用所述当前帧信号的相位信息计算动态阈值,在应用所述动态阈值和所述当前帧信号的相位信息来判定所述待鉴别信号是否被篡改。

Patent Agency Ranking