一种基于移动窗口粒子群优化的过曝图像质量增强方法

    公开(公告)号:CN112734660B

    公开(公告)日:2022-09-23

    申请号:CN202011600976.4

    申请日:2020-12-29

    Abstract: 本发明公开了一种基于移动窗口粒子群优化的过曝图像质量增强方法,首先提取图片的亮度层图像信息;其次对亮度层图像进行重叠分块分割,分块图像的大小是通过实际实验结果的对比进行筛选;再将每个分割得到的分块图像分别进行基于粒子群优化的gamma校正,通过PSO的迭代优化最优选择出对应分块图像的gamma值,PSO的适应度函数的构建是通过图像熵、图像曝光度和图像均方根对比度这三个参数的平方加权和计算得到的;将增强后的分块图像按照其原始位置进行重叠融合,得到新的亮度层图像。本发明有效地抑制过曝区域图像亮度,提升过曝周围区域的图像对比度,更多地展现了图像中的细节,使得图像更加清晰,改善了图像的视觉效果。

    基于先分类再回归的人头部姿态估计方法

    公开(公告)号:CN114821705A

    公开(公告)日:2022-07-29

    申请号:CN202210262896.5

    申请日:2022-03-17

    Inventor: 刘峰 刘波 赵峥涞

    Abstract: 本发明公开了基于先分类再回归的人头部姿态估计方法,包括如下步骤:步骤1,处理数据集,构建基于GhostNet的多分类神经网络,并进行训练得到基于GhostNet的多分类网络模型;步骤2,构建基于先分类再回归的神经网络模型;步骤3,训练基于先分类再回归的神经网络、基于GhostNet的分类神经网络,融合两个网络模型;步骤4,用基于先分类再回归的神经网络进行头部姿态估计。本发明的方法提出了任务拆分机制,将头部姿态估计预测三个角度值拆分为三个子任务,分别预测俯仰角、偏航角、滚转角,提高了预测结果的精确度,且大大减少了计算量,适用于学生学习或实验操作等AI自动测评任务中。

    两阶段的anchor-based动态视频摘要方法

    公开(公告)号:CN113505266B

    公开(公告)日:2023-09-26

    申请号:CN202110779734.4

    申请日:2021-07-09

    Inventor: 刘峰 徐达 赵峥涞

    Abstract: 本发明是一种两阶段的anchor‑based动态视频摘要方法。该方法包括(1)构建anchor‑based神经网络,神经网络包括提取网络、自注意力机制网络、两阶段网络即区域推荐网络和回归分类网络;(2)确定区域推荐网络和回归分类网络中anchor的种类和长度,完成正负样本的分类,对步骤(1)构建的anchor‑based神经网络进行训练,固定训练好的参数,得到两阶段的anchor‑based神经网络模型,用得到的神经网络模型进行动态视频摘要。本发明提出的全新网络结构可以并行处理所有的视频帧,从而减少了训练的时间,有效提升了最终输出的精确度,并且本网络结构相对简单,对于计算能力的要求不高。

    两阶段的anchor-based动态视频摘要方法

    公开(公告)号:CN113505266A

    公开(公告)日:2021-10-15

    申请号:CN202110779734.4

    申请日:2021-07-09

    Inventor: 刘峰 徐达 赵峥涞

    Abstract: 本发明是一种两阶段的anchor‑based动态视频摘要方法。该方法包括(1)构建anchor‑based神经网络,神经网络包括提取网络、自注意力机制网络、两阶段网络即区域推荐网络和回归分类网络;(2)确定区域推荐网络和回归分类网络中anchor的种类和长度,完成正负样本的分类,对步骤(1)构建的anchor‑based神经网络进行训练,固定训练好的参数,得到两阶段的anchor‑based神经网络模型,用得到的神经网络模型进行动态视频摘要。本发明提出的全新网络结构可以并行处理所有的视频帧,从而减少了训练的时间,有效提升了最终输出的精确度,并且本网络结构相对简单,对于计算能力的要求不高。

    基于先分类再回归的人头部姿态估计方法

    公开(公告)号:CN114821705B

    公开(公告)日:2025-02-18

    申请号:CN202210262896.5

    申请日:2022-03-17

    Inventor: 刘峰 刘波 赵峥涞

    Abstract: 本发明公开了基于先分类再回归的人头部姿态估计方法,包括如下步骤:步骤1,处理数据集,构建基于GhostNet的多分类神经网络,并进行训练得到基于GhostNet的多分类网络模型;步骤2,构建基于先分类再回归的神经网络模型;步骤3,训练基于先分类再回归的神经网络、基于GhostNet的分类神经网络,融合两个网络模型;步骤4,用基于先分类再回归的神经网络进行头部姿态估计。本发明的方法提出了任务拆分机制,将头部姿态估计预测三个角度值拆分为三个子任务,分别预测俯仰角、偏航角、滚转角,提高了预测结果的精确度,且大大减少了计算量,适用于学生学习或实验操作等AI自动测评任务中。

    一种基于视觉、音频与文本融合的跨模态BERT情感分析方法

    公开(公告)号:CN115510224A

    公开(公告)日:2022-12-23

    申请号:CN202210825285.7

    申请日:2022-07-14

    Abstract: 一种基于视觉、音频与文本融合的跨模态BERT情感分析方法,将三种不同方式提取出的模态进行缩放并使用一个一维卷积网络控制其处于相同维度;分别对视觉、音频模态进行类Self‑Attention处理并加权融合生成双模态注意力矩阵;对文本进行相同处理后与双模态注意力矩阵进行进一步融合并通过Mask掩码模块和激活函数生成融合后的多模态权重矩阵;将多模态权重矩阵与文本预训练模型提取到的文本特征进行矩阵相乘处理后通过残差网络和归一化得到的情感分类结果来微调文本预训练模型。本方法结合来自文本、图像和语音模态的信息微调预先训练过的文本模型,采用Cross‑Multimodal作为其核心,通过跨模态交互作用动态调整单词的权重,能够有效提高文本预训练模型对于情感分类的准确性。

    基于句法特征和注意力机制相融合的情感分析系统及方法

    公开(公告)号:CN114118058A

    公开(公告)日:2022-03-01

    申请号:CN202111280270.9

    申请日:2021-11-01

    Abstract: 本发明公开了自然语言处理技术领域的基于句法特征和注意力机制相融合的情感分析系统及方法,包括:获取文本数据,进行数据集分类;基于分类后的文本数据进行词向量嵌入表示转化后,利用双向长短期记忆网络提取初始上下文特征;将初始上下文特征输入到图卷积网络后,结合局部平均池化提取句法特征;将初始上下文特征进行位置编码后输入到注意力模型后,结合全局最大池化提取全局特征;基于句法特征和全局特征进行向量拼接后,输入全连接层和随机失活层,获得情感分类的最终结果。本发明同时考虑了文本的句法信息、位置信息和语义信息,能够有效提高情感分类的准确性。

    一种基于改进遗传算法的人脸识别优化方法

    公开(公告)号:CN113963410A

    公开(公告)日:2022-01-21

    申请号:CN202111249512.8

    申请日:2021-10-26

    Abstract: 一种基于改进遗传算法的人脸识别优化方法,该方法首先通过对样本数据集进行PCA降维和归一化处理,能在提升运算效率的同时不影响识别准确率;接着利用基于改进的遗传算法来对卷积神经网络模型的超参数进行全局调优,得到超参数调优后的卷积神经网络模型;最后将测试集输入训练好的卷积神经网络模型进行人脸识别测试。该方法将遗传算法与卷积神经网络相结合,并对遗传算法中的交叉概率和变异概率进行改进,有效避免了传统参数寻优过程中容易陷入局部最优解的情况,且在人脸识别准确率以及迭代次数上具有更好的效果。

    一种基于移动窗口粒子群优化的过曝图像质量增强方法

    公开(公告)号:CN112734660A

    公开(公告)日:2021-04-30

    申请号:CN202011600976.4

    申请日:2020-12-29

    Abstract: 本发明公开了一种基于移动窗口粒子群优化的过曝图像质量增强方法,首先提取图片的亮度层图像信息;其次对亮度层图像进行重叠分块分割,分块图像的大小是通过实际实验结果的对比进行筛选;再将每个分割得到的分块图像分别进行基于粒子群优化的gamma校正,通过PSO的迭代优化最优选择出对应分块图像的gamma值,PSO的适应度函数的构建是通过图像熵、图像曝光度和图像均方根对比度这三个参数的平方加权和计算得到的;将增强后的分块图像按照其原始位置进行重叠融合,得到新的亮度层图像。本发明有效地抑制过曝区域图像亮度,提升过曝周围区域的图像对比度,更多地展现了图像中的细节,使得图像更加清晰,改善了图像的视觉效果。

Patent Agency Ranking