声纹特征提取的方法和装置
    11.
    发明公开

    公开(公告)号:CN117672230A

    公开(公告)日:2024-03-08

    申请号:CN202210967353.3

    申请日:2022-08-12

    Abstract: 本发明提供了声纹特征提取的方法及装置,方法包括:确定语音片段对应的多帧语音特征;通过局部特征提取模块对多帧语音特征进行声纹信息提取确定第一局部特征;通过第一残差模块基于第一局部特征在不同时域感受野下提取声纹信息确定第二局部特征;通过第二残差模块基于第二局部特征在不同时域感受野下提取声纹信息确定第三局部特征;通过全局特征提取模块基于第三局部特征进行频域的信息的融合确定语音片段对应的全局特征;通过声纹特征提取模块提取全局特征的声纹信息,确定语音片段对应的声纹特征,声纹特征用于确定语音片段表示的说话人的身份信息。通过不同视野提取短语音片段的声纹特征,可以较为准确的识别短语音片段的说话人的身份。

    一种基于关键词的可控文本复述生成方法及装置

    公开(公告)号:CN117669551A

    公开(公告)日:2024-03-08

    申请号:CN202210967383.4

    申请日:2022-08-12

    Abstract: 本发明涉及一种基于关键词的可控文本复述生成方法及装置,所述方法包括:对待复述文本进行关键词提取,得到关键词列表,依次将关键词列表中的每一个关键词拆分为单字,将每一个单字作为一个token,得到token列表;将待复述文本输入到mT5模型中,进行迭代文本复述生成,得到待复述文本的复述文本集合,其中,任一轮迭代文本复述生成包括:将输入文本输入到mT5模型中,得到输出文本;对输出文本进行束搜索,得到第一结果文本;在token列表中选择第一个未被添加到输入文本中的token,将其添加到输入文本的尾部,得到第二结果文本;将第一结果文本与第二结果文本组合,得到生成结果集合;对生成结果集合进行束搜索,将搜索结果作为下一轮迭代的输入文本。

    一种语音通话中的背景人声过滤方法及装置

    公开(公告)号:CN117636888A

    公开(公告)日:2024-03-01

    申请号:CN202210967392.3

    申请日:2022-08-12

    Abstract: 本申请公开了一种语音通话中的背景人声过滤方法及装置,方法包括:获取目标语音;对目标语音进行活动语音切分,获得至少一个语音片段;对各个语音片段进行处理,确定各个语音片段为说话人有效语音或第一背景人声;若任意一个语音片段为说话人有效语音,则对任意一个语音片段进行分窗处理,获得任意一个语音片段的至少一个语音窗;确定各个第一短时平均能量,各个第一短时平均能量为每个语音片段的至少一个语音窗中各个语音窗的短时平均能量;根据各个第一短时平均能量和第一预设阈值,确定说话人有效语音包括第二背景人声;过滤掉第一背景人声和第二背景人声。本申请通过过滤掉第一背景人声和第二背景人声,使得说话人有效语音更加纯净。

    意图识别方法和装置
    14.
    发明公开

    公开(公告)号:CN117591269A

    公开(公告)日:2024-02-23

    申请号:CN202210967340.6

    申请日:2022-08-12

    Abstract: 本申请提供了一种意图识别方法和装置,包括:接收用户语音;将用户语音转化为语音文本;生成策略选择指令;响应于策略选择指令,确定当前计算资源的剩余资源量、多个预设的意图识别策略分别对应的计算时间;根据剩余资源量和多个预设的意图识别策略分别对应的计算时间,确定目标意图识别策略,其中,多个预设的意图识别策略包括目标意图识别策略;根据目标意图识别策略对语音文本进行识别,确定意图结果。根据本申请实施例,能够根据计算机的计算资源以及不同策略的计算时间,确定意图识别策略,从而在保证意图识别准确度的基础上,可以兼顾计算机的计算资源以及意图识别的速度,提高意图识别的效率。

    基于图像识别的异物检测方法、装置、设备、介质和产品

    公开(公告)号:CN114332767A

    公开(公告)日:2022-04-12

    申请号:CN202111654242.9

    申请日:2021-12-30

    Abstract: 本申请涉及智能检测技术领域,提供了一种基于视频图像识别的配电房异物检测方法、装置、计算机设备、存储介质和计算机程序产品。本申请能够实现提高对配电房的异物检测的准确性。该方法包括:获取配电房的待检测图像,将待检测图像进行噪声去除处理,得到预处理图像,将预处理图像输入至异物检测模型,得到配电房的异物检测结果,其中,异物检测模型基于卷积神经网络构建,卷积神经网络的网络层包括卷积层和下采样层,卷积神经网络的卷积层的各神经元基于局部感受野方式进行局部连接,卷积神经网络的每一映射面上对应的各神经元的权值相等。

    基于深度学习的配电房设备开关部件状态监测方法和装置

    公开(公告)号:CN114301180A

    公开(公告)日:2022-04-08

    申请号:CN202111675600.4

    申请日:2021-12-31

    Abstract: 本申请涉及一种基于深度学习的配电房设备开关部件状态监测方法、装置、计算机设备、存储介质和计算机程序产品。方法包括:获取待检测设备图像;待检测设备图像为对目标配电房中的电力设备进行拍摄得到的图像;电力设备包括至少一个开关部件;将待检测设备图像输入至台账标签识别模型,得到台账标签文本内容;以及将待检测设备图像输入至开关部件状态识别模型,得到开关部件的实际开关状态;台账标签文本内容用于表征电力设备的运行状态;确定开关部件在运行状态下的期望开关状态;若实际开关状态与期望开关状态不匹配,则生成针对电力设备的告警提示。采用本方法能够在配电房内对异常的电力设备及时生成告警提示,从而提升对电力设备的监测效果。

    人员穿戴检测方法、装置、计算机设备和存储介质

    公开(公告)号:CN114299540A

    公开(公告)日:2022-04-08

    申请号:CN202111613073.4

    申请日:2021-12-27

    Abstract: 本申请涉及一种人员穿戴方法、装置、计算机设备、存储介质和计算机程序产品。上述方法应用于人员穿戴监测模型,包括:获取待检测人员图像;待检测人员图像为对目标电力生产场所中的人员进行拍摄得到的图像;通过骨干网络层,对待检测人员图像分别进行不同预设倍数的下采样处理,得到不同尺寸的至少两个特征图;通过颈部网络层,对至少两个特征图进行特征融合处理,得到不同尺寸的至少两个融合特征图;通过头部网络层,对至少两个融合特征图进行检测处理,得到待检测人员图像的人员穿戴检测结果;若人员穿戴检测结果不符合预设条件,则针对待检测人员图像中的目标人员进行告警提示。采用本方法能够提升电力生产环境中的人员穿戴检测效果。

Patent Agency Ranking