一种基于中心窗口变差的四象限分块模式的图像纹理特征提取方法

    公开(公告)号:CN105320956A

    公开(公告)日:2016-02-10

    申请号:CN201510661393.5

    申请日:2015-10-14

    Applicant: 华侨大学

    CPC classification number: G06K9/4642

    Abstract: 本发明公开了一种基于中心窗口变差的四象限分块模式的图像纹理特征提取方法,对任一2M×2N像素的图像区域,首先计算其中心部分M×N个像素值的和作为阈值,然后把该2M×2N像素的图像区域分解为4个M×N像素的子区域,再分别计算这4个子区域像素值的和并与阈值进行比较,若像素值的和大于或等于阈值,就置该子区域的位置编码值为1,否则为0;最后将四个子区域的位置编码值乘以对应的权重后进行求和,得到该2M×2N像素的图像区域的纹理特征值。本发明只需要用4个比特就能有效地表示物体的局部纹理信息,可应用于目标检测、识别和跟踪。

    基于深度学习的非相干混沌通信方法及装置

    公开(公告)号:CN119544430B

    公开(公告)日:2025-04-29

    申请号:CN202510080480.5

    申请日:2025-01-20

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于深度学习的非相干混沌通信方法及装置,涉及数据处理领域,包括:获取待解调的混沌接收信号并进行功率谱密度估计,得到PSD序列并输入到经训练的混沌接收信号解调模型,通过输入层接收PSD序列,PSD序列经过第一BiLSTM层,提取到PSD序列的第一时域特征,再经过自注意力层,得到第一中间特征,第一中间特征经过第一Dropout层,得到第二中间特征,第二中间特征经过第二BiLSTM层,提取得到PSD序列的第二时域特征,再经过第二Dropout层,得到第三中间特征;将第三中间特征输入到全连接层和Softmax层进行特征整合,得到概率分布向量,概率分布向量通过分类层进行最大似然判决,得到估计的二进制信息比特。本发明解决现有的混沌通信系统频谱效率低的问题。

    基于机器视觉的石材版面智能仓储管理方法及系统

    公开(公告)号:CN119648117A

    公开(公告)日:2025-03-18

    申请号:CN202510169101.X

    申请日:2025-02-17

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于机器视觉的石材版面智能仓储管理方法及系统,涉及图像处理技术领域,方法包括:通过机器视觉检测石材版面的瑕疵并计算异常得分,进行异常排序与评级,获得每个石材版面的瑕疵评级;将RGB图像归一化为正则RGB,并进行伽玛矫正线性化转换至CIELAB颜色空间,计算石材版面的均色LAB;基于瑕疵评级和均色LAB信息录入RFID标签,并据此分类入库;接收用户对石材版面数量、瑕疵评级和均色的要求,筛选出最相似的石材版面反馈给用户;用户可选择接受或拒绝,若拒绝则重新筛选。本申请通过机器视觉检测石材版面的瑕疵和色差,结合RFID标签实现自动化入库、分类管理和精准出库,提高了仓储效率和管理精度。

    基于自注意力机制的端到端视频压缩方法及系统

    公开(公告)号:CN119316609B

    公开(公告)日:2025-02-25

    申请号:CN202411837846.0

    申请日:2024-12-13

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于自注意力机制的端到端视频压缩方法及系统,涉及视频编码领域,方法包括:提取当前帧、运动参考帧和上一时刻的重构帧的浅层特征;提取当前帧和运动参考帧之间的运动信息特征;压缩运动信息特征,获得压缩后的运动信息特征;将压缩后的运动信息特征补偿在上一时刻的重构帧的浅层特征上,获得当前时刻的上下文信息特征;压缩获得压缩后的上下文信息特征;将压缩后的上下文信息特征和当前帧的浅层特征融合特征进行编码,获得当前时刻的重构帧;对当前时刻的重构帧进行上采样,获得压缩视点图像;对压缩视点图像中的运动信息累积误差进行修正,得到下一帧的运动参考帧。本发明能够在提高运动估计的准确性的同时提升了编码的效率。

    一种无人机森林火灾风险区块检测方法及系统

    公开(公告)号:CN119027845B

    公开(公告)日:2025-02-14

    申请号:CN202411514321.3

    申请日:2024-10-29

    Abstract: 本发明涉及图像处理与人工智能技术领域,公开了一种无人机森林火灾风险区块检测方法及系统,方法包括:构建基于区块分类的目标检测模型并进行训练,利用训练好的基于区块分类的目标检测模型实现无人机森林火灾风险区块检测;所述基于区块分类的目标检测模型利用区块映射器无人机图像中的不同区块映射为区块特征;利用多阶段采样网络对区块特征进行多种尺度的采样,并利用降维映射层进行尺度对齐,获得多尺度区块特征;通过哈达玛积融合多尺度区块特征,利用区块分类器将融合后的多尺度区块特征映射至区块类别概率。本发明以区域分类方式实现风险区块的定位,避免了现有技术因精确定位导致的庞大计算量,延长无人机可用时间。

    基于分层时空感知的屏幕内容视频质量评价方法及装置

    公开(公告)号:CN118865075B

    公开(公告)日:2024-12-03

    申请号:CN202411319739.9

    申请日:2024-09-23

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于分层时空感知的屏幕内容视频质量评价方法及装置,涉及视频评价领域,包括:提取屏幕内容视频中的若干个碎片化视频和若干个关键帧并输入经训练的屏幕内容视频质量评价模型,每个关键帧输入显著性计算模块筛选出若干个显著视频块,每个显著视频块输入双通道卷积神经网络,得到每个阶段的多层特征并输入块级质量评估模块,经过空间门特征增强模块,得到每个阶段的增强特征并输入块级质量聚合模块,得到每个视频块的块级质量分数;采用自适应加权策略计算得到空域感知质量分数;碎片化视频输入时域感知质量评估支路,得到时域感知质量分数,两者结合计算得到屏幕内容视频的质量分数,解决现有视频质量评价方法可靠性差的问题。

    一种基于姿势对抗网络的人脸视频生成方法及系统

    公开(公告)号:CN118379777B

    公开(公告)日:2024-11-22

    申请号:CN202410807403.0

    申请日:2024-06-21

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于姿势对抗网络的人脸视频生成方法及系统,涉及图像处理技术领域,方法包括:构建人脸视频生成模型,包括图像编码器、音频编码器、头部运动预测模块、姿势编码器和解码器,所述人脸视频生成模型接收人脸图像和语音音频,生成人脸说话视频;获取训练数据集并对人脸视频生成模型进行预训练;构建唇型同步判别器作为判别器,对预训练人脸视频生成模型进行生成对抗训练;利用训练好的人脸视频生成模型实现人脸视频生成。本发明利用音频信号的动态特性对头部运动进行建模,并结合生成对抗网络与唇型同步判别器提高人脸视频的唇形同步精度,同时兼顾视频的逼真度,使得其更加真实、自然,从而为各种应用场景提供了更多的灵活性。

Patent Agency Ranking