-
公开(公告)号:CN119692417A
公开(公告)日:2025-03-25
申请号:CN202311607988.3
申请日:2023-11-27
Applicant: 华为云计算技术有限公司
IPC: G06N3/084 , G06N3/092 , G06N3/0499 , G06N3/0464 , G06N3/045
Abstract: 本申请提供了一种模型训练的方法、装置以及计算设备,该方法包括:接收用户输入的第一模型的配置参数的多个取值,该第一模型的配置参数包括该第一模型的训练参数和/或模型参数;根据第二模型预测得到该配置参数的多个取值分别对应的该第一模型的多个训练指标数据,该第一模型的训练指标数据包括该第一模型的训练过程数据和/或服务器训练该第一模型所消耗的硬件指标数据;从第一模型的多个训练指标数据中确定目标训练指标数据,并将该配置参数的多个取值中与该目标训练指标数据对应的目标取值发送给该用户;接收该用户确认的该目标取值,并基于该目标取值对该第一模型进行训练。该方法可以提高模型的训练速度和训练效率。
-
公开(公告)号:CN117351555A
公开(公告)日:2024-01-05
申请号:CN202210751554.X
申请日:2022-06-28
Applicant: 华为云计算技术有限公司
Abstract: 本申请实现方式公开了一种唇语识别方法,包括:获取待识别的多人说话视频;将多人说话视频输入至预设的目标唇语识别模型,由目标唇语识别模型提取多人说话视频的每帧图像中各人员的人脸图像,并根据人脸图像,得到每帧图像中各人员作为说话人的可能性信息,以及根据可能性信息,从每帧图像中筛选出目标说话人,并提取目标说话人的唇部图像,根据唇部图像,得到目标说话人的说话内容。如此,可以先识别出多人说话场景中潜在的真正的目标说话人,然后只需要对真正的目标说话人的唇语进行识别,即可以实现对多人说话视频中的说话人以及对应说话内容的准确识别。本申请实现方式还公开了一种唇语识别装置、唇语识别模型的训练方法和装置。
-
公开(公告)号:CN119814948A
公开(公告)日:2025-04-11
申请号:CN202311412575.X
申请日:2023-10-27
Applicant: 华为云计算技术有限公司
IPC: H04N5/76 , H04N5/91 , H04N21/431 , H04N21/439 , H04N21/44
Abstract: 本申请提供一种多媒体流的处理方法,包括:输出配置界面,并响应于用户在该配置界面上的操作,获取第一配置信息,该第一配置信息用于配置录制任务、检测算法、录制要求;获取该录制任务下的多媒体流,该多媒体流为对被采集对象进行视频录制得到的视频流,或者是进行语音录制得到的音频流;根据用户配置的检测算法,对多媒体流进行检测,得到检测结果,并当该检测结果不满足用户配置的录制要求时,输出针对被采集对象的录制建议。如此,通过反馈建议,能够有效提高生成符合用户预期的录制视频/音频的效率,而且,能够满足不同用户对于不同录制任务、不同检测算法、不同录制要求的差异化需求。此外,本申请还提供了对应的处理装置及相关设备。
-
公开(公告)号:CN118779340A
公开(公告)日:2024-10-15
申请号:CN202310323092.6
申请日:2023-03-29
Applicant: 华为云计算技术有限公司
IPC: G06F16/2452 , G06F16/242 , G06F16/2455 , G06F16/248 , G06F3/0482
Abstract: 本申请实施例涉及人工智能领域,提供了一种自然语言查询语句的处理方法、装置,该方法包括:获取自然语言查询语句,自然语言查询语句用于在待查数据表中查询数据;将自然语言查询语句和待查数据表输入子表召回模型,以获取至少一张候选数据表;从至少一张候选数据表中确定目标数据表;将自然语言查询语句和目标数据表输入自然语言转结构化查询语句模型,以获取结构化查询语句。上述方法通过基于自然语言查询语句根据待查数据表获取字段数更少的子表作为NL2SQL模型的输入,从而缩小自然语言查询语句转SQL语句时需要检索的字段范围,提高将自然语言查询语句转化为SQL语句的效率与准确性,进而提高根据自然语言查询数据的效率与准确率。
-
公开(公告)号:CN117668206A
公开(公告)日:2024-03-08
申请号:CN202211021755.0
申请日:2022-08-24
Applicant: 华为云计算技术有限公司
IPC: G06F16/335 , G06F16/338
Abstract: 一种知识搜索方法及相关设备,属于云计算技术领域。所述方法包括:生成知识搜索引擎主页面,知识搜索引擎主页面包括搜索信息输入框和多个知识颗粒度选项;接收用户通过搜索信息输入框输入的搜索信息和从多个知识颗粒度选项中选择的至少一个知识颗粒度;在知识库中进行知识搜索,得到与搜索信息相关的至少一个知识颗粒度的多个搜索结果;生成搜索结果页面,搜索结果页面包括多个搜索结果。利用所述方法可以提高知识搜索的效率,快速定位用户所需知识。
-
公开(公告)号:CN117172250A
公开(公告)日:2023-12-05
申请号:CN202210986086.4
申请日:2022-08-16
Applicant: 华为云计算技术有限公司
IPC: G06F40/295 , G06F40/169 , G06N3/04 , G06N3/08
Abstract: 本申请提供了一种样本标注的校对方法、装置、计算设备集群和存储介质,属于神经网络技术领域。该方法包括:获取目标样本,目标样本为待校对的标注样本,对目标样本进行结构解析,获得目标样本的第一结构解析结果,将第一结构解析结果与多个已校对的标注样本的结构解析结果进行匹配,若多个已校对的标注样本的结构解析结果中不存在与第一结构解析结果匹配的目标结构解析结果,则输出提示消息,该提示消息用于提示用户检查目标样本的标注结果。采用本申请的方案,能够为用户提示可能标注错误的样本,提升样本标注的准确率。
-
公开(公告)号:CN116994340A
公开(公告)日:2023-11-03
申请号:CN202210449295.5
申请日:2022-04-24
Applicant: 华为云计算技术有限公司
IPC: G06V40/40 , G06V40/16 , G06V20/40 , G06V10/44 , G06V10/74 , G06V10/764 , G06V10/82 , G10L25/30 , G10L25/51 , G10L25/87 , G06F21/32 , G06N3/04 , G06N3/08
Abstract: 本申请实施例提供了一种活体检测方法,应用于配置有音频采集装置和摄像头的电子设备,该方法包括:通过音频采集装置采集待检测对象的第一音频,以及通过摄像头采集待检测对象的第一视频;第一音频和第一视频的采集时间一致;确定第一音频为音频采集装置响应真实人声而采集到的音频;以及确定第一视频为摄像头面对真实人脸而采集到的视频;基于第一音频和第一视频之间的匹配度,得到待检测对象的活体检测结果。该方法可以提高活体检测结果的准确性。
-
公开(公告)号:CN115862584A
公开(公告)日:2023-03-28
申请号:CN202111124499.3
申请日:2021-09-24
Applicant: 华为云计算技术有限公司
IPC: G10L13/02 , G10L13/10 , G10L15/26 , G06F40/117 , G06F40/284
Abstract: 本申请实施例公开了一种韵律信息标注方法以及相关设备,用于提高标注的效率。本申请实施例方法包括:计算机设备获取音频信息以及第一文本信息。计算机设备标注第一文本信息中的韵律词以及韵律短语,得到第一标注后文本,第一标注后文本中的韵律短语需要基于所述音频信息进行。计算机设备基于第一标注后文本中标注的韵律词、第一标注后文本中标注的韵律短语以及音频信息标注第一标注后文本中的语调短语,得到第二标注后文本。
-
公开(公告)号:CN115700584A
公开(公告)日:2023-02-07
申请号:CN202110838414.1
申请日:2021-07-23
Applicant: 华为云计算技术有限公司
IPC: G06F40/289 , G06F16/33 , G06F18/214 , G06N3/02
Abstract: 本申请实施例公开了一种分词方法及其相关设备,涉及自然语言处理领域。该方法包括获取分词策略,分词策略包括构词方式信息。根据构词方式信息,对已标注语料进行筛选,获得目标已标注语料。其中,每个目标已标注语料均携带有对应的标注信息。根据目标已标注语料对目标分词模型进行训练。利用训练后的目标分词模型对语言文本数据进行分词处理。利用上述方法,可以根据用户偏好的分词策略来获取目标分词模型,一方面可以减少标注语料资源的浪费,另一方面可以获得满足用户个性化需求的自定义分词模型,提高了分词效率。
-
公开(公告)号:CN114817453A
公开(公告)日:2022-07-29
申请号:CN202110117800.1
申请日:2021-01-28
Applicant: 华为云计算技术有限公司
IPC: G06F16/33 , G06F16/35 , G06F40/211 , G06F40/289 , G06K9/62
Abstract: 本申请提供了一种数据处理方法、装置及电子设备,涉及数据挖掘技术领域。其在对文档样本进行因果关系挖掘时,可以将挖掘过程中产生的聚类结果和因果分析结果呈现给用户,使得用户可以基于自身需求对相应的结果进行实时修正;之后,可以基于用户的修正操作,对其他的结果进行实时更新,并将更新后的结果呈现给用户,提升了挖掘效率。
-
-
-
-
-
-
-
-
-