保护壁纸类型的识别方法、装置、电子设备及存储介质

    公开(公告)号:CN119810806A

    公开(公告)日:2025-04-11

    申请号:CN202411756387.3

    申请日:2024-12-02

    Abstract: 本公开涉及壁纸检测领域,更具体地,本公开涉及一种保护壁纸类型的识别方法、装置、电子设备及存储介质。方法包括:通过预训练的目标检测模型检测识别目标图像,获得第一检测框、第二检测框和第三检测框,其中,第一检测框用于标记门在目标图像中对应的区域,第二检测框用于标记窗户在目标图像中对应的区域,第三检测框用于标记保护壁纸在目标图像中的对应的区域;基于第一检测框、第二检测框和第三检测框的相对位置关系,确定每个第三检测框对应的保护壁纸的类型,保护壁纸的类型包括门的保护壁纸、窗户的标准壁纸或其他类型的保护壁纸。

    一种基于着色编码的三重曝光多端线网布线方法及系统

    公开(公告)号:CN119647395A

    公开(公告)日:2025-03-18

    申请号:CN202411637426.8

    申请日:2024-11-15

    Abstract: 本发明提供一种基于着色编码的三重曝光多端线网布线方法及系统,涉及电路布线技术领域,方法包括:获取芯片的待布线信息;根据所述芯片信息和所述元件位置信息,确定布线图节点,构建待布线区域的布线图结构;根据所述元件位置信息和所述布线设计约束信息,设定在不同掩膜状态下所述布线图结构中的布线连接边权重;初始化所述布线图节点的着色编码;设定线网搜索过程以及线网更新过程中的着色编码变化规则;结合所述着色编码变化规则和所述多端线网连接关系信息,对多端线网进行布线搜索,获取最终布线方案。本发明能够有效提高三重曝光多端线网布线的布通率和降低布线运行时间,提高布线效率。

    一种基于状态分解的三重曝光两端线网布线方法及系统

    公开(公告)号:CN119647394A

    公开(公告)日:2025-03-18

    申请号:CN202411637424.9

    申请日:2024-11-15

    Abstract: 本发明提供一种基于状态分解的三重曝光两端线网布线方法及系统,涉及电路布线技术领域,方法包括:获取布线数据;根据布线数据,构建布线图结构;对布线图结构进行状态分解,得到多条独立的连接边;计算各条连接边的权重;基于各条连接边的权重,对两端线网进行布线搜索,确定最终布线方案。本发明通过结合布线与掩膜状态,采用分解连接边、计算权重和动态搜索策略,能够有效降低布线复杂度,提高布线的准确性和布通率,在布线过程中充分考虑多层掩膜的分配,减少冲突和工艺违规,适用于高密度、复杂电路的布线需求,显著提升了布线效率。

    一种基于特征洗牌的低资源车牌识别方法及装置

    公开(公告)号:CN118351524B

    公开(公告)日:2025-02-11

    申请号:CN202410477685.2

    申请日:2024-04-19

    Abstract: 本发明涉及人工智能与计算机视觉技术领域,特别是指一种基于特征洗牌的低资源车牌识别方法及装置,方法包括:获取车牌图像的样本数据集;构建初始的车牌识别模型;车牌识别模型包括:全局感知编码器、特征洗牌模块以及解码器模块;将样本数据集输入初始的车牌识别模型中,通过全局感知编码器对样本数据进行特征提取,获得全局视觉特征,通过特征洗牌模块对初始的阅读顺序进行洗牌,获得洗牌后的空间关注特征;将空间关注特征输入解码器,获得预测结果;根据预测结果,采用最小化损失函数训练模型,获得训练好的车牌识别模型;获取待识别的车牌图像数据并输入训练好的车牌识别模型中,获得预测车牌号码。采用本发明,可提高低资源车牌识别的性能。

    一种基于局部注意力机制的人脸活体检测方法及装置

    公开(公告)号:CN117133059A

    公开(公告)日:2023-11-28

    申请号:CN202311045752.5

    申请日:2023-08-18

    Abstract: 本发明提供一种基于局部注意力机制的人脸活体检测方法和装置,方法包括:S1、将人脸活体检测数据集中的视频进行预处理,得到预处理后的图片数据;S2、在图像分类数据集ImageNet上预训练的视觉Transformer模型Vi T中,插入局部注意力Patch Attent i on模块和新的MLP分类头,再使用所述预处理后的图片数据对新的视觉Transformer模型进行微调,得到训练完成的Vi T*模型;S3、使用所述Vi T*模型作为教师网络,指导插入局部注意力Patch Attent i on模块的轻量级Vi T‑T i ny模型学习,训练得到最终的Vi T‑T i ny*模型;S4、使用最终的Vi T‑T i ny*模型进行推理,判断待检测图片是否为真实人脸。本发明对演示攻击具有良好的分辨能力,从而提升模型检测精度。

    一种基于堆栈记忆网络的多模态语音合成方法及系统

    公开(公告)号:CN116543749B

    公开(公告)日:2023-09-15

    申请号:CN202310814315.9

    申请日:2023-07-05

    Abstract: 本发明提供一种基于堆栈记忆网络的多模态语音合成方法及系统,涉及视频和语音处理技术领域,包括:用视频信息辅助从文本中合成具有视听同步性的语音。从人脸中提取说话人特性,即利用人脸控制合成语音的音色。在训练和推理时,通过引入的视频‑语音堆栈记忆网络,显式的利用视频检索对应语音,并从检索得到的语音中提取风格特征,解决多模态TTS模块训练‑推理风格不匹配的问题并增强合成音频的表现性,定制个性化语音。本发明引入视频‑语音堆栈记忆网络显式的连接视频和语音两个模态,而非利用距离损失去最小化不同模态信息提取的特征之间的距离。

    异质人脸识别模型的训练方法、识别方法、装置及设备

    公开(公告)号:CN116682154A

    公开(公告)日:2023-09-01

    申请号:CN202310399938.4

    申请日:2023-04-13

    Abstract: 本发明实施例涉及一种异质人脸识别模型的训练方法、识别方法、装置及设备,涉及图像处理领域,通过将样本集中各类目标对象的至少两种模态人脸图像输入到预训练的识别模型中,输出至少两种模态人脸图像对应的特征向量;根据特征向量确定第一原型向量并初始化分类器参数,获得初始异质人脸识别模型;迭代执行如下步骤,直至获得最终识别模型:将预设数量的跨模态困难样本对输入到上一迭代获得的特征提取器中,输出每个跨模态困难样本对的两个特征向量;根据任一特征向量和第一原型向量确定第二原型向量;根据另一特征向量和第二原型向量构建模型损失函数;调整上一迭代获得模型参数;即在模型训练时,在原型中添加了跨模态信息,提高模型精度。

    图像超分辨率方法及装置
    10.
    发明授权

    公开(公告)号:CN115311138B

    公开(公告)日:2023-06-23

    申请号:CN202210800137.X

    申请日:2022-07-06

    Abstract: 本发明涉及一种图像超分辨率方法及装置。所述图像超分辨率方法包括:获取训练数据集,训练数据集中包括多个图像数据对,每个图像数据对包括对应于源域的源图像和对应于目标域的目标图像;使用训练数据集对循环生成对抗网络模型进行训练:循环生成对抗网络模型包括用于将图像从源域转换为目标域的第一域转换模块,用于将图像从目标域转换为源域的第二域转换模块;在训练完成后,将第一待处理图像输入至第一域转换模块,通过第一域转换模块输出第二待处理图像;将第二待处理图像输入至预先训练好的超分辨率模型,通过超分辨率模型输出超分辨率图像。

Patent Agency Ranking