一种基于醉汉模型的轻量化声学场景感知方法

    公开(公告)号:CN117524252B

    公开(公告)日:2024-04-05

    申请号:CN202311505530.7

    申请日:2023-11-13

    Abstract: 本发明公开了一种基于醉汉模型的轻量化声学场景感知方法,包括:常规音频特征提取:常规音频特征通过特征转换模块处理,得到醉汉特征。常规模型训练。使用常规模型进行通道缩减和添加频率分组融合卷积的操作,以得到醉汉模型的初始版本。使用引导模块得到的初始版本的醉汉模型进行训练。使用常规模型作为教师模型,醉汉模型作为学生模型,通过知识蒸馏的方式来提升学生模型的性能。对融合后的轻量化模型进行评估,得到评估结果。根据评估结果,对轻量化模型进行优化和调整。得到最终的醉汉模型。将常规音频特征输入醉汉模型,得到声学场景感知结果。本发明的优点是:减少训练时间和计算资源的消耗,并且能获得较高的准确率和较低的损失值。

    一种非屏蔽环境下磁传感器阵列的校准方法

    公开(公告)号:CN105548917B

    公开(公告)日:2018-12-07

    申请号:CN201510898444.6

    申请日:2015-12-08

    Abstract: 一种非屏蔽环境下对磁传感器阵列进行校准的方法,包括:选择一组磁场传感器阵列中的磁场传感器测得的包括背景磁场的磁场强度数据,根据预定的指标和规则,选择磁场强度数据中均匀度和一致性相对较好的磁场强度数据,作为后续处理的依据;去除背景磁场强度,依据选择的均匀度和一致性相对较好的磁场强度数据,对背景磁场强度的值进行处理,以得到更符合校准线圈的磁场强度数据;校准磁传感器阵列,对校准磁场强度的信号进行进一步的选择及处理,并得到多个通道之间的校准系数。本发明的优点在于,可在非屏蔽环境实现磁传感器阵列的校准,这对于使用屏蔽条件有限的场合非常实用,且方法简易可行。

    一种非屏蔽环境下磁传感器阵列的校准方法

    公开(公告)号:CN105548917A

    公开(公告)日:2016-05-04

    申请号:CN201510898444.6

    申请日:2015-12-08

    Abstract: 一种非屏蔽环境下对磁传感器阵列进行校准的方法,包括:选择一组磁场传感器阵列中的磁场传感器测得的包括背景磁场的磁场强度数据,根据预定的指标和规则,选择磁场强度数据中均匀度和一致性相对较好的磁场强度数据,作为后续处理的依据;去除背景磁场强度,依据选择的均匀度和一致性相对较好的磁场强度数据,对背景磁场强度的值进行处理,以得到更符合校准线圈的磁场强度数据;校准磁传感器阵列,对校准磁场强度的信号进行进一步的选择及处理,并得到多个通道之间的校准系数。本发明的优点在于,可在非屏蔽环境实现磁传感器阵列的校准,这对于使用屏蔽条件有限的场合非常实用,且方法简易可行。

    一种基于深度学习的动态条码检测方法

    公开(公告)号:CN113378598B

    公开(公告)日:2023-04-25

    申请号:CN202110685243.3

    申请日:2021-06-21

    Abstract: 本发明公开了一种基于深度学习的动态条码检测方法,模型参考SiamMask。首先在模板帧中选定要跟踪的目标(称为template),作为后续检测帧(称为detection)的搜索依据。其次将template以及detection送入SiameseNetwork,对网络得到的特征图做互相关操作。最后将得互相关操作到的特征图送入三分支或二分支,每个分支对应不同的任务,网络最终可以对动态条码的检测、跟踪以及分割。本发明的优点是:在骨干网络ResNet‑50中添加了注意力机制,在不影响检测速度的情况下,主观指标与客观指标均有提高。

    一种声学场景与声音事件联合任务分析方法

    公开(公告)号:CN117935860A

    公开(公告)日:2024-04-26

    申请号:CN202410138072.6

    申请日:2024-01-31

    Abstract: 本发明公开了一种基于多任务学习的声学场景与声音事件联合分析方法,目标是通过加入额外的声音事件信息,重点提升声学场景感知的性能,包括:将Multi‑gate Mixture‑of‑Experts模型引入声学领域,替代传统多任务学习模型,弱化任务间差异带来的固有冲突。在Multi‑gate Mixture‑of‑Experts模型基础上增加两条信息交互分支,提出一种新的模型—Cross_MMoE。将Class‑Balanced Loss代替传统的多任务加权损失,在传统多任务模型、MMoE模型、Cross_MMoE模型进行评估,得到评估结果。本发明的优点是:利用多任务学习策略对声学领域相关联的两个任务进行联合分析,降低了计算和存储成本,大大增加了推理速度,并且提高了声学场景分类的准确率。

    一种基于醉汉模型的轻量化声学场景感知方法

    公开(公告)号:CN117524252A

    公开(公告)日:2024-02-06

    申请号:CN202311505530.7

    申请日:2023-11-13

    Abstract: 本发明公开了一种基于醉汉模型的轻量化声学场景感知方法,包括:常规音频特征提取:常规音频特征通过特征转换模块处理,得到醉汉特征。常规模型训练。使用常规模型进行通道缩减和添加频率分组融合卷积的操作,以得到醉汉模型的初始版本。使用引导模块得到的初始版本的醉汉模型进行训练。使用常规模型作为教师模型,醉汉模型作为学生模型,通过知识蒸馏的方式来提升学生模型的性能。对融合后的轻量化模型进行评估,得到评估结果。根据评估结果,对轻量化模型进行优化和调整。得到最终的醉汉模型。将常规音频特征输入醉汉模型,得到声学场景感知结果。本发明的优点是:减少训练时间和计算资源的消耗,并且能获得较高的准确率和较低的损失值。

    OCC-VLC异构组网系统
    9.
    发明授权

    公开(公告)号:CN113328802B

    公开(公告)日:2022-04-22

    申请号:CN202110586211.8

    申请日:2021-05-27

    Abstract: 本发明公开了一种OCC‑VLC异构组网系统及其运行方法,异构组网系统包括:包含服务器、VLC‑AP、OCC‑AP、LED以及多个用户端。OCC‑AP链路用于用户申请接入组网、发送上行确认信息以及在VLC链路质量不好时负责上下行通信。VLC‑AP负责高速下行链路传输。由于VLC链路不稳定,因此加入重传机制,在VLC链路质量较好的时候通过VLC下行链路重传,当VLC链路质量差时,通过OCC链路进行通信,此时只允许发送文本信息。所有用户均配备光检测以及OCC的收发设备。运行方法针对VLC链路和OCC链路的帧格式设计、系统的接入协议、通信协议以及重传机制。本发明的优点是:具有适用于特殊环境、适用于移动场景、安全等优点。

    一种基于深度学习的动态条码检测方法

    公开(公告)号:CN113378598A

    公开(公告)日:2021-09-10

    申请号:CN202110685243.3

    申请日:2021-06-21

    Abstract: 本发明公开了一种基于深度学习的动态条码检测方法,模型参考SiamMask。首先在模板帧中选定要跟踪的目标(称为template),作为后续检测帧(称为detection)的搜索依据。其次将template以及detection送入SiameseNetwork,对网络得到的特征图做互相关操作。最后将得互相关操作到的特征图送入三分支或二分支,每个分支对应不同的任务,网络最终可以对动态条码的检测、跟踪以及分割。本发明的优点是:在骨干网络ResNet‑50中添加了注意力机制,在不影响检测速度的情况下,主观指标与客观指标均有提高。

Patent Agency Ranking