一种基于深度学习的PCB板元器件检测方法

    公开(公告)号:CN110070536A

    公开(公告)日:2019-07-30

    申请号:CN201910333652.X

    申请日:2019-04-24

    Abstract: 本发明公开了一种基于深度学习的PCB板元器件检测方法,包括:获取大量PCB板图像并对其标注用来对网络进行训练;训练faster-rcnn来检测元器件位置并切割下来;训练一个简单的卷积网络来判断元器件极性;训练EAST网络来检测元器件图像上文本框的位置并切割出来;训练CRNN网络识别切割出的文本框图像中的文本内容;将极性与文本内容与PCB设计文件比对得出结果。本发明实现了对物体标识符的全自动识别,解决了目前各个检测阶段对接困难的问题。

    一种基于多特征建模和粒度感知的情感语音转换方法

    公开(公告)号:CN118865938A

    公开(公告)日:2024-10-29

    申请号:CN202410920631.9

    申请日:2024-07-10

    Abstract: 本发明公开了一种基于多特征建模和粒度感知的情感语音转换方法,包括:预训练阶段、微调阶段和转换阶段,其中预训练阶段和微调阶段用于有效实现情感语音语言内容和情感韵律的充分解纠缠,转换阶段则利用训练好的模型分别提取源情感语音的语言内容和目标情感语音的情感韵律以完成测试语料情感状态的转换。为了进一步地提高转换情感语音的情感饱和度,实现高表现力的情感转换效果,本发明还提出了多韵律特征建模和粒度感知的改进方法,分别从韵律特征的多样性和粒度感知性方面来优化韵律空间,从而能够挖掘出更多的韵律信息,有效提升了转换情感语音的情感饱和度。

    融合增强编码模块和LGNet网络的编-解码器结构的跨语种语音转换方法

    公开(公告)号:CN116778902A

    公开(公告)日:2023-09-19

    申请号:CN202310970560.9

    申请日:2023-08-02

    Abstract: 本发明公开一种融合增强编码模块和LGNet网络的编‑解码器结构的跨语种语音转换方法,包括训练阶段和转换阶段,训练阶段中编码器对声学特征解纠缠,获得说话人信息表征和内容表征;编码器和解码器之间采用U型连接,将说话人信息表征从编码器传递到解码器;LGNet网络对提取的内容表征进一步优化;解码器将获取的说话人信息表征和优化后的内容表征进行重构;本发明在编码器中引入增强编码模块,提升了转换语音的质量;利用LGNet网络使得优化后的源语句的内容表征和目标语句的说话人信息表征在解码器中的自适应实例归一化层中充分融合,进一步提高转换语音的自然度和说话人相似度从而实现高质量的跨语种语音转换。

    一种基于关节点提取的人体运动轨迹分析方法

    公开(公告)号:CN110458046A

    公开(公告)日:2019-11-15

    申请号:CN201910664993.5

    申请日:2019-07-23

    Abstract: 本发明公开了一种基于关节点提取的人体运动轨迹分析方法,所述方法包括如下步骤:将待测人体视频中放入人体骨架识别模型中得到关节点位置序列;根据关节点和人体先验对所述关节点位置序列进行分割得到大尺度关节图像;将所述大尺度关节图像放入关节中心预测网络中得到精细关节点位置;将所述精细关节点位置带回到待测人体视频中得到精细关节点在待测人体视频中的位置;根据精细关节点在待测人体视频中的位置分析得到关节点在视频中的运动轨迹。本发明步骤简单,进一步提高了关节点运动轨迹的预测精度。

    一种基于关节点提取的人体运动轨迹分析方法

    公开(公告)号:CN110458046B

    公开(公告)日:2020-11-24

    申请号:CN201910664993.5

    申请日:2019-07-23

    Abstract: 本发明公开了一种基于关节点提取的人体运动轨迹分析方法,所述方法包括如下步骤:将待测人体视频中放入人体骨架识别模型中得到关节点位置序列;根据关节点和人体先验对所述关节点位置序列进行分割得到大尺度关节图像;将所述大尺度关节图像放入关节中心预测网络中得到精细关节点位置;将所述精细关节点位置带回到待测人体视频中得到精细关节点在待测人体视频中的位置;根据精细关节点在待测人体视频中的位置分析得到关节点在视频中的运动轨迹。本发明步骤简单,进一步提高了关节点运动轨迹的预测精度。

Patent Agency Ranking