-
公开(公告)号:CN113255800A
公开(公告)日:2021-08-13
申请号:CN202110615003.6
申请日:2021-06-02
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供基于音视频的鲁棒情感建模系统,包括:原始音频训练数据通过音频数据扩增模块进行数据扩增,得到带噪音频训练数据去训练音频数据增强模块,剔除带噪音频训练数据中的噪声信息,得到增强语音训练数据,将增强语音训练数据输入音频情感识别模块,进行训练并识别音频训练情感状态;原始视频训练数据通过视频数据扩增模块进行数据扩增,得到带噪视频训练数据去训练视频数据增强模块,剔除带噪视频训练数据中的噪声信息,得到增强视频训练数据,将增强视频训练数据输入视频情感识别模块,进行训练并识别视频训练情感状态;决策层融合模块将音频训练情感状态和视频训练情感状态融合,进行训练并输出情感识别预测结果。
-
公开(公告)号:CN113255635A
公开(公告)日:2021-08-13
申请号:CN202110812718.0
申请日:2021-07-19
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供多模态融合的心理压力分析方法,包括:把长的音视频切分为带有面部和语音的短音视频,并对短音视频进行分帧处理,得到图像序列和语音信号;对图像序列进行面部特征提取,得到面部帧序列;应用光流法对所述面部帧序列的相邻帧提取光流,得到光流序列;将面部帧序列和所述光流序列融合,进行线性映射得到面部嵌入向量;对图像序列提取感兴趣区,得到感兴趣序列,进行线性映射得到生理信号嵌入向量;以帧为单位提取所述语音信号的基本声学特征,进行线性映射得到声学嵌入向量;对语音信号和图像序列提取情感特征;将上述特征按帧序列的时间顺序融合,得到时空特征向量;将时空特征向量输入模型,再经过softmax分类得到心理压力等级。
-
公开(公告)号:CN113254670A
公开(公告)日:2021-08-13
申请号:CN202110665550.5
申请日:2021-06-16
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供基于力导向的知识图谱可视化方法,包括:知识图谱数据提取包括:知识图谱构建和知识图谱查询;构造图数据结构:对构建好的知识图谱查询得到的相关的节点和关系进行图数据结构格式转换;力导向算法布局:随机初始化所有节点在屏幕中的坐标;把节点作为电子,使节点彼此之间存在斥力;把关系作为弹簧,使节点彼此之间存在引力;在斥力和引力的作用下迭代n次,最终达到平衡状态,得到所有节点的稳定坐标;可视化呈现:根据所有节点的稳定坐标,分别绘制节点以及节点之间的连线,得到最终知识图谱;运算流程可视化交互:通过最终知识图谱,为每个节点和关系绑定监听事件,使用户能通过鼠标操作节点和关系。
-
公开(公告)号:CN113178199A
公开(公告)日:2021-07-27
申请号:CN202110727936.4
申请日:2021-06-29
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供基于相位偏移检测的数字音频篡改取证方法,包括:将待鉴别信号与时间标签做乘积,得到待鉴别信号的调制信号;再对所述待鉴别信号和所述调制信号进行短时傅里叶变换,得到鉴别信号功率谱和调制信号功率谱;应用所述鉴别信号功率谱和调制信号功率谱计算群延迟特征;对所述群延迟特征做均值计算,再应用均值计算结果做平滑计算,得到当前帧信号的相位信息;应用所述当前帧信号的相位信息计算动态阈值,在应用所述动态阈值和所述当前帧信号的相位信息来判定所述待鉴别信号是否被篡改。
-
公开(公告)号:CN113051404A
公开(公告)日:2021-06-29
申请号:CN202110024807.9
申请日:2021-01-08
Applicant: 中国科学院自动化研究所
IPC: G06F16/36 , G06F16/2455
Abstract: 本申请实施例涉及数据处理技术领域,具体涉及一种基于张量分解的知识推理方法、装置、设备,旨在提高时序知识推理任务的准确率。所述方法包括:对时序知识图谱数据集中的数据进行提取,得到多组四元组数据,多组四元组数据中的每组四元组数据中包含了头实体、关系、尾实体以及时间;对多组四元组数据进行标注及处理,将处理好的四元组数据作为训练材料;将训练材料输入基于张量分解的时序知识推理模型及其变体模型中,利用梯度下降算法对时序知识推理模型及其变体模型分别进行训练,得到训练好的时序知识推理模型及其变体模型;使用训练好的时序知识推理模型及其变体模型分别执行预测任务,推理问题的答案,得到最终的推理结果。
-
公开(公告)号:CN112329748B
公开(公告)日:2021-04-30
申请号:CN202110001077.0
申请日:2021-01-04
Applicant: 中国科学院自动化研究所
Abstract: 本申请实施例涉及一种面向交互场景的自动谎言检测方法、装置、设备及介质,旨在提高自动谎言检测的准确率。所述方法包括:将待测样片分别按照视频、音频和文本这三个模态进行切分,提取出这三个模态的短时特征,将待测样片中每句对话中三个模态的短时特征分别进行融合,得到每句对话对应的三个模态的长时特征,使用自注意力机制对三个模态的长时特征进行融合,得到每句对话的多模态特征,通过图神经网络为每句对话的多模态特征融合交互信息,得到融合交互信息的多模态特征,根据融合交互信息的多模态特征,预测每句对话的谎言水平。
-
公开(公告)号:CN112329746B
公开(公告)日:2021-04-16
申请号:CN202110001041.2
申请日:2021-01-04
Applicant: 中国科学院自动化研究所
Abstract: 本申请实施例涉及数据处理领域,具体涉及一种多模态谎言检测方法、装置、设备,旨在提高自动谎言检测的准确率。所述方法包括:输入待测音频、待测视频以及待测文本这三个模态的原始数据;对输入内容分别进行特征提取,得到三个模态的深度特征;对这三个模态的深度特征中的一阶、二阶以及三阶交互关系进行显式刻画,得到每个词的融合后的多模态特征;对所述每个词的融合后的多模态特征进行上下文建模,得到每个词的最终的特征;对上述每个词的最终的特征进行池化得到全局特征,然后通过全连接层得到谎言分类结果。
-
公开(公告)号:CN112579745A
公开(公告)日:2021-03-30
申请号:CN202110196514.9
申请日:2021-02-22
Applicant: 中国科学院自动化研究所
IPC: G06F16/33 , G06F16/332 , G06F16/35 , G06F40/211 , G06F40/216 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本申请涉及基于图神经网络的对话情感纠错模型,包括:多模态特征抽取模块、基于单句的情感识别模块、交互建模模块、时序建模模块和情感预测模块;所述多模态特征抽取模块和所述基于单句的情感识别模块连接,所述基于单句的情感识别模块与所述交互建模模块连接,所述交互建模模块与所述时序建模模块连接,所述时序建模模块与所述情感预测模块连接。
-
公开(公告)号:CN112560811A
公开(公告)日:2021-03-26
申请号:CN202110188624.0
申请日:2021-02-19
Applicant: 中国科学院自动化研究所
Abstract: 本申请涉及端到端的音视频抑郁症自动检测研究方法,包括:采集音频文件和视频文件中包含有长时音频文件和长时视频文件这两个模态的原始数据;音频文件和视频文件预处理:将长时音频文件切分成若干个音频段,同时将长时视频文件切分成具有固定帧数的多个视频段;将每一个音频段和视频段分别输入音频特征提取网络和视频特征提取网络,得到音频深度特征和视频深度特征;使用多头注意力机制对深度音频特征和深度视频特征进行计算,得到注意力音频特征和注意力视频特征;将注意力音频特征和注意力视频特征通过特征聚合模块聚合成音视频特征;将音视频特征输入决策网络,预测音视频文件中的个体的抑郁水平。
-
公开(公告)号:CN108376234B
公开(公告)日:2021-03-16
申请号:CN201810026649.9
申请日:2018-01-11
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及情感计算领域,提出用于视频图像的情感识别系统,旨在解决由于图片之间信息的损失,造成情感识别的准确率低下的问题,系统包括:人脸提取模块,情感时序编码模块,情感信息建模模块,情感空间映射模块,人脸提取模块对视频图像进行分帧,从分帧后的图片中提取人脸图片,组成图片序列;情感时序编码模块利用3D卷积算法对图片序列的各人脸图片前后帧信息进行情感信息计算,生成情感的时序信息编码;情感信息建模模块接收时序信息编码,基于情感信息的长时动态特性,利用卷积长短时记忆模型确定时序信息的情感特征矩阵;情感空间映射模块接收情感特征矩阵,通过全连接映射到情感空间,输出情感识别结果。实现了对视频图像的情感识别。
-
-
-
-
-
-
-
-
-