-
公开(公告)号:CN115587616A
公开(公告)日:2023-01-10
申请号:CN202211370044.4
申请日:2022-11-03
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种网络模型训练方法、装置、存储介质及计算机设备。该方法包括:获取目标任务的样本数据集,该样本数据集包括训练数据集和验证数据集,获取网络模型的结构搜索空间,根据训练数据集,利用元学习方式学习结构搜索空间中的多个不同第一子网络结构,以得到元学习方式所对应的元神经网络,并利用元神经网络生成结构搜索空间中的具有网络参数的多个不同第二子网络结构,利用验证数据集对多个不同第二子网络结构进行网络结构搜索,以确定目标任务的最优子网络结构,利用训练数据集对最优子网络结构进行训练,以得到目标任务所对应的网络模型,本申请可提高得到目标任务的网络模型的准确性和效率。
-
公开(公告)号:CN115564834A
公开(公告)日:2023-01-03
申请号:CN202211338236.7
申请日:2022-10-28
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种视线估计方法及装置、存储介质及电子设备,涉及计算机视觉技术领域。该视线估计方法获取相机系统在当前时刻针对目标用户采集的多帧用户图像;基于多帧用户图像,确定目标用户在相机坐标系下的视线方向信息;基于多帧用户图像,确定目标用户在相机坐标系下的瞳孔坐标信息;基于目标用户在相机坐标系下的视线方向信息和瞳孔坐标信息,确定目标用户在世界坐标系下的视线方向信息和瞳孔坐标信息;基于目标用户在世界坐标系下的视线方向信息和瞳孔坐标信息,确定目标用户的视线估计信息。与传统的视线估计方法相比,有效利用了多视角信息,降低了对训练数据量的依赖,扩大了视线估计系统的有效工作范围,提升了视线方向估计的精准度。此外,本申请实施例能够为分析驾驶员的驾驶状态提供全面、准确的支持和依据,具有适用范围广泛的优势。
-
公开(公告)号:CN115546688A
公开(公告)日:2022-12-30
申请号:CN202211193359.6
申请日:2022-09-28
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种跳远评测方法、装置、电子设备和存储介质,其中方法包括:确定跳远评测区域下的待测视频和刻度线坐标;从所述待测视频中的各帧中,确定落地帧;基于所述落地帧中人员的脚部骨骼点的坐标,对所述落地帧进行脚部分割,得到所述落地帧中的多个脚部轮廓点的坐标;基于所述落地帧中的多个脚部轮廓点的坐标,以及所述刻度线坐标,进行跳远成绩评定,克服了传统方案中跳远成绩测算不准确的缺陷,通过人体检测、姿态估计以及脚部分割分析测试人员所处的状态,以确定落地帧对应的落地帧,并据此进行成绩评定,提升了跳远成绩测算的准确性;此外,利用计算机视觉技术和循环状态机进行跳远评测,还提升了跳远评测效率和体育课堂的教学效率。
-
公开(公告)号:CN115424253A
公开(公告)日:2022-12-02
申请号:CN202211065170.9
申请日:2022-08-29
Applicant: 科大讯飞股份有限公司
IPC: G06V20/62 , G06V10/774 , G06V30/262
Abstract: 本发明提供一种车牌识别方法、装置、电子设备和存储介质,其中方法包括:获取车牌图像序列;将所述车牌图像序列中的各图像逐个作为当前图像,基于排列在所述当前图像前的上一图像的识别特征,对所述当前图像进行车牌识别,得到所述当前图像的识别结果,所述上一图像的识别特征是基于所述上一图像的识别结果确定的;基于车牌图像序列中的各图像的识别结果,确定车牌识别结果。本发明提供的方法、装置、电子设备和存储介质,对车牌图像序列中的每个图像进行车牌识别的过程中,均参考了排列在自身之前的所有图像的识别结果所体现出的识别特征,保证了单帧图像的车牌识别过程能够获取到更加丰富的信息输入,提高了车牌识别的可靠性。
-
公开(公告)号:CN115376214A
公开(公告)日:2022-11-22
申请号:CN202210813381.X
申请日:2022-07-11
Applicant: 科大讯飞股份有限公司
IPC: G06V40/70 , G06V10/40 , G06V10/74 , G06V10/774
Abstract: 本发明提供一种情绪识别方法、装置、电子设备和存储介质,其中方法包括:确定至少两个模态的待识别数据;基于各个模态的情绪识别模型,确定各个模态的待识别数据的情绪概率分布;基于各个模态的情绪概率分布,确定情绪识别结果;情绪识别模型用于对对应模态的待识别数据进行特征提取,并基于特征提取所得的数据特征进行情绪识别;各个模态的情绪识别模型是基于各个模态的样本数据的样本数据特征在同一空间内的特征相似度,和/或,各个模态的样本数据的预测概率分布之间的分布相似度,联合训练得到,利用不同模态的样本数据所表征的情绪信息的一致性,和相同情绪在不同模态间的互补关系训练模型,能够提升模型的泛化能力和情绪识别过程的精准度。
-
公开(公告)号:CN115375809A
公开(公告)日:2022-11-22
申请号:CN202211310590.9
申请日:2022-10-25
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了虚拟形象的生成方法、装置、设备及存储介质,具体实现方案为:基于获取到的表达信息确定情绪特征以及脸部特征;基于所述情绪特征对特定视频序列进行情绪编辑处理,得到具有所述情绪特征的视频序列;其中,所述特定视频序列,包括特定对象的包含脸部的视频序列;至少基于具有所述情绪特征的视频序列以及所述脸部特征,生成目标对象的虚拟形象。根据本申请的技术方案,能够有效解决生成的虚拟形象表达情绪单一的问题。
-
公开(公告)号:CN114900714A
公开(公告)日:2022-08-12
申请号:CN202210382403.1
申请日:2022-04-12
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开一种基于神经网络的视频生成方法及相关装置。视频生成方法包括:获取素材文件,其中所述素材文件包括语音文件、文本文件以及图像文件中的至少一种;将所述素材文件输入视频生成神经网络,通过所述视频生成神经网络对所述素材文件生成压缩视频数据;其中,所述压缩视频数据中至少部分视频帧的表征依赖于其他视频帧。通过上述方案可以节省编码计算量,提高视频生成网络本身的运行效率和生成视频流的质量。
-
公开(公告)号:CN114462571A
公开(公告)日:2022-05-10
申请号:CN202111678978.X
申请日:2021-12-31
Applicant: 科大讯飞股份有限公司
Abstract: 本申请实施例提供了一种训练深度学习模型的方法、数据处理方法及装置,通过将深度学习模型所需的至少部分模型参数压缩在一个共享参数池中,多个模型参数可以共享该共享参数池中同一位置存储的参数,能够在不影响模型精度的情况下压缩模型的参数量,解决了深度学习模型的参数的数量过多的技术问题。
-
公开(公告)号:CN114359446A
公开(公告)日:2022-04-15
申请号:CN202111658559.X
申请日:2021-12-30
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种动画绘本生成方法、装置、设备和存储介质,该方法包括:识别静态绘本中的若干对象以及若干文本;确定各对象以及各文本之间的对应关系,其中,对应关系表示文本由与文本对应的对象讲述;生成各文本的语音数据,以及确定各文本对应的对象的画面变化内容,其中,画面变化内容表示在播放文本对应的语音数据过程中对象的预设部位的变化;基于语音数据和画面变化内容,生成静态绘本对应的动画绘本数据。通过上述方式,本申请能够将绘本中的静态人物转化为能说会动的动画人物。
-
公开(公告)号:CN114357135A
公开(公告)日:2022-04-15
申请号:CN202111672307.2
申请日:2021-12-31
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06F16/338 , G06F16/33 , G06V40/16 , G06F40/295 , G06K9/62 , G06V10/774
Abstract: 本申请公开了交互方法、交互装置、电子设备以及存储介质,其中,该交互方法包括:获取到用户的问询文本以及面部表情,并确定用户当前的情感类型标签;基于问询文本与情感类型标签确定问询文本的回复文本,并基于问询文本以及回复文本形成对话文本;利用对话文本以及情感类型标签得到与情感类型标签匹配的情感回应数据;将情感回应数据加载到虚拟形象中,以对用户做出带有情感的交互响应。通过上述方案,本申请交互方法对应的虚拟形象能够进行类人的情感表达,从而能够使用户对应获得更自然,更具趣味性的交互体验。
-
-
-
-
-
-
-
-
-