图像特征提取方法、装置、电子设备、存储介质

    公开(公告)号:CN112434713B

    公开(公告)日:2025-02-28

    申请号:CN202011390511.0

    申请日:2020-12-02

    Abstract: 本发明提供一种图像特征提取方法、装置、电子设备、存储介质,方法包括:获得目标图像的N个不同尺寸的特征图像,N为大于2的整数;将N个不同尺寸的图像作为至少一双层双向特征金字塔神经网络模块的输入;获取所述至少一双层双向特征金字塔神经网络模块的输出作为所述目标图像的图像特征,以对所述目标图像进行目标检测。本发明提供的方法及装置改进BiFPN中信息流动的通畅,以更好的融合不同层次的特征,提高特征的表达能力,从而提高目标检测、图像分类等图像处理功能的性能。

    图像智能美化方法、系统、电子设备及存储介质

    公开(公告)号:CN111738957B

    公开(公告)日:2024-12-24

    申请号:CN202010595315.0

    申请日:2020-06-28

    Abstract: 本发明公开了一种图像智能美化方法、系统、电子设备及存储介质,该方法包括:获取样本数据集,所述样本数据集包含若干样本图像对,所述样本图像对包含训练图像和对应的已美化图像;对所述训练图像进行特征提取处理;利用特征提取处理后的训练图像和对应的已美化图像,对预设的美化系数估计模型进行训练,得到目标美化系数估计模型;获取目标图像,并对所述目标图像进行特征提取处理;利用所述目标美化系数估计模型对特征提取处理后的所述目标图像进行处理,得到所述目标图像的美化估计系数;根据所述美化估计系数对所述目标图像进行美化处理,得到所述目标图像对应的目标美化图像。本发明可以解决现有技术中图像美化操作繁琐、效率低的问题。

    图像排序展示方法、系统、设备和存储介质

    公开(公告)号:CN110909193B

    公开(公告)日:2024-01-05

    申请号:CN201911153777.0

    申请日:2019-11-22

    Inventor: 黄小虎 罗超 胡泓

    Abstract: 本发明公开了一种图像排序展示方法、系统、设备和存储介质,图像排序展示方法包括以下步骤:获取待排序图像;对所述待排序图像进行图像质量分计算,以得到所述待排序图像质量分;对所述待排序图像进行相似度计算,并且将相似度在预设阈值范围内的所述待排序图像归为一组图像,以得到若干组图像;对所述若干组图像进行所述待排序图像的质量分排序;分别从每组图像中挑选出质量分最高的至少一张图像进行展示。本发明能够使质量高的图像排序更加靠前,且使用户浏览到的图像内容更加多样化,优化前端展示效果。

    结合上下文的意图识别方法、系统、电子设备和存储介质

    公开(公告)号:CN112597290B

    公开(公告)日:2023-08-01

    申请号:CN202011557987.9

    申请日:2020-12-25

    Inventor: 邓艳江 罗超 胡泓

    Abstract: 本发明公开了一种结合上下文的意图识别方法、系统、电子设备和存储介质。意图识别方法包括:建立包括多个意图规则的意图规则库,意图规则包含意图与相应的正则表达式和上文话术控制指令之间的映射关系;获取用户端输入的目标用户语音、以及与目标上文话术控制指令;将用户语音转换为对应的目标语音文本;将目标语音文本和目标上文话术控制指令与各意图规则中的正则表达式和上文话术控制指令依次进行匹配,并将匹配成功的意图规则中的意图作为目标用户语音的目标意图识别结果。实现了对目标语音文本意图的自动识别,避免了误识别和无法识别的情形,提高了识别的准确程度,减少了获取、处理历史数据的时间和成本,大大提高了识别的效率。

    口语化文本中命名实体的识别方法、系统、设备和介质

    公开(公告)号:CN111144118B

    公开(公告)日:2023-05-12

    申请号:CN201911368222.8

    申请日:2019-12-26

    Abstract: 本发明公开了一种口语化文本中命名实体的识别方法、系统、设备和介质,所述识别方法包括:获取待识别的目标口语化文本;对目标口语化文本进行分词处理,获取第一识别实体;对目标口语化文本进行模式匹配处理,获取第二识别实体;对目标口语化文本进行序列标注处理,获取第三识别实体;获取同一文本位置的第一识别实体、第二识别实体和第三识别实体的第一类别、第二类别和第三类别;判断每种类别是否属于同一类别,若否,则选取优先级最高的类别对应的识别实体作为文本位置处的目标命名实体继而获取目标口语化文本对应的目标命名实体集。本发明有效地提高了命名实体识别的准确性,减少了人工进行实体的提取,降低了人工成本,提高了识别效率。

    OTA图片标签的识别方法、电子设备和介质

    公开(公告)号:CN110704650B

    公开(公告)日:2023-04-25

    申请号:CN201910934233.1

    申请日:2019-09-29

    Inventor: 成丹妮 罗超 胡泓

    Abstract: 本发明公开了一种OTA图片标签的识别方法、电子设备和介质,其中OTA图片标签的识别方法,包括以下步骤:根据OTA图片库构建OTA图像标签数据集,OTA图片库包括OTA图片和与OTA图片对应的标签;根据OTA图像标签数据集建立标签关系模型;根据标签关系模型建立图像特征提取模型,并提取图像特征;根据图像特征建立标签识别模型;采用标签识别模型识别待测OTA图片的标签。本发明基于OTA酒店下的海量图片信息和当前存在的标签,利用深度学习的方法对图片进行自动化标签识别。

    图像自动裁剪方法、系统、电子设备及存储介质

    公开(公告)号:CN111696112B

    公开(公告)日:2023-04-07

    申请号:CN202010545406.3

    申请日:2020-06-15

    Abstract: 本发明提供一种图像自动裁剪方法、系统、电子设备及存储介质,该方法包括:获取第一、第二样本集;获取不同构图方式下不同图像类别对应的目标权重向量;根据第二样本集,对图像美学评估网络进行训练;获取目标图像,利用语义分割模型对目标图像进行处理,得到目标图像中各个像素的图像类别向量;获取目标图像在不同构图方式下的重心;按照裁剪比例,以目标图像在不同构图方式下的重心为中心,对目标图像进行裁剪得到多个侯选裁剪图像;利用图像美学评估网络对多个侯选裁剪图像进行处理,得到多个侯选裁剪图像对应的预测美学评分,并将评分最高的侯选裁剪图像作为目标裁剪图像。本发明能够提高图像展示的准确性,且能满足图像的美学展示需求。

    模型训练的方法、声纹识别的方法、系统、设备及介质

    公开(公告)号:CN111091835B

    公开(公告)日:2022-11-29

    申请号:CN201911256610.7

    申请日:2019-12-10

    Inventor: 任君 罗超 胡泓

    Abstract: 本发明公开了一种模型训练的方法、声纹识别的方法、系统、设备及介质,其中模型训练的方法,包括以下步骤:获取多个客户的音频数据;将音频数据进行预处理转化为具有预设音频时长的待训练音频数据;从待训练音频数据中筛选出每个客户对应的三元组音频数据输入卷积神经网络模型中进行训练;其中,三元组音频数据包括第一音频数据、第二音频数据以及第三音频数据,卷积神经网络模型使用的损失函数包括第一损失函数和第二损失函数。本发明利用第一损失函数和第二损失函数对神经网络模型进行联合优化,提高了利用模型对客户来电语音的声纹识别的准确度。

    图像分类模型训练方法及系统、图像分类方法及系统

    公开(公告)号:CN113222066A

    公开(公告)日:2021-08-06

    申请号:CN202110608324.3

    申请日:2021-06-01

    Abstract: 本发明公开了一种图像分类模型训练方法及系统、图像分类方法及系统。该图像分类模型训练方法包括:获取预先训练好的图像分类模型以及训练数据集;在图像分类模型的卷积层和全连接层之间加入注意力机制模块,并根据分类标签的类别数量调整全连接层中输出节点的数量,以更新图像分类模型;使用训练数据集训练图像分类模型,以获得目标图像分类模型;其中,在训练过程中冻结全部或部分卷积层的权重参数。本发明将训练好的图像模型在训练数据集上进行迁移学习,使得该模型能够在过滤无关图片的同时准确识别图片类别,获得了相较于直接对整个模型进行训练的方式来说更优的性能。

    基于多维度注意力的图片分类方法、系统、设备及介质

    公开(公告)号:CN112966743A

    公开(公告)日:2021-06-15

    申请号:CN202110250561.7

    申请日:2021-03-08

    Abstract: 本发明提供了一种基于多维度注意力的图片分类方法,利用构建图片数据集,根据预设场景定义图片数据集中各个图片的图片分类标签;构建图片分类模型,图片分类模型中添加有多维度注意力机制;使用图片数据集训练图片分类模型;抽样测试和验证图片分类模型,根据测试结果优化图片分类模型;将待分类的图片输入图片分类模型,得到输出的分类结果。该图片分类方法通过多维度注意力机制模块,重新设计并训练深度学习模型,能够实现轻量级、快速、高准确率的山岳峰谷场景图像分类任务,可替代人工审核分类工作,大幅度节约人工运营成本,提高图像利用效率,提升用户体验。

Patent Agency Ranking