-
公开(公告)号:CN112149700B
公开(公告)日:2025-01-17
申请号:CN201910575404.6
申请日:2019-06-28
Applicant: 北京百度网讯科技有限公司
Inventor: 杨海华
IPC: G06F18/214 , G06F18/2431 , G06N20/00
Abstract: 本申请提供一种特征漂移幅度的识别方法、装置、设备和存储介质,该方法中,设备按照时间序列,将预先获取到的数据样本进行划分,得到多个子数据样本,根据极端梯度提升模型对每个子数据样本进行训练,得到每个特征在每个时间段中的重要性指标,根据每个特征在不同时间段中的重要性指标,获取所述特征的漂移幅度,基于模型对特征漂移的幅度进行识别,简单易用,且准确度较高。
-
公开(公告)号:CN114360581B
公开(公告)日:2025-05-23
申请号:CN202111662755.4
申请日:2021-12-30
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种识别设备故障的方法、装置及电子设备,涉及工业大数据领域,尤其涉及人工智能领域。具体实现方案为:获取待检测设备发生故障时的声音数据;对声音数据进行特征提取,得到声音数据对应的声音组合特征;从预设样本库中所包含的多个组合特征中确定目标组合特征,其中,目标组合特征与声音组合特征的相似度满足预设条件,预设样本库至少包括:至少一种故障类型标签、多个组合特征,多个组合特征是基于待检测设备的历史环境信息以及待检测设备发生历史故障时的声音数据所确定的;根据目标组合特征所对应的目标故障类型标签确定待检测设备的故障类型。本公开至少解决了现有技术中存在的故障声音识别准确度低的技术问题。
-
公开(公告)号:CN112148764B
公开(公告)日:2024-05-07
申请号:CN201910576711.6
申请日:2019-06-28
Applicant: 北京百度网讯科技有限公司
IPC: G06F16/2458
Abstract: 本申请提供一种特征的筛选方法、装置、设备和存储介质,该方案中,电子设备获取待筛选的多个样本,每个样本中包括至少一个类型的特征,根据预设时间间隔,获取不同时间段内的每个类型的特征的互信息和覆盖率,根据每个时间段内的每个类型的特征的互信息和覆盖率,获取每个类型特征的稳定性指标,根据每个类型的特征的稳定性指标,对所述多个样本中的特征进行筛选,通过计算在不同时间段上稳定性衡量的动态指标来做特征选择,可有效提升建模效果,提高模型准确度。
-
公开(公告)号:CN112148765B
公开(公告)日:2024-04-09
申请号:CN201910576727.7
申请日:2019-06-28
Applicant: 北京百度网讯科技有限公司
Inventor: 杨海华
IPC: G06F16/2458 , G06F16/26 , G06N20/00
Abstract: 本申请提供一种业务数据的处理方法、装置及存储介质,其中,该方法包括:获取待处理的业务数据,该业务数据具有至少两个数据特征且业务数据中所包含的总数据样本具有时间标记,根据时间标记对业务数据中所包含的总数据样本按照时间段进行划分得到与各时间段分别对应的分桶数据样本,针对每个分桶数据样本,计算各数据特征分别对应的第一统计值,进而计算该业务数据的各数据特征的第一波动幅度,根据该业务数据的各数据特征的第一波动幅度,对全部数据特征进行特征过滤,得到业务数据的关键特征。该技术方案在特征筛选的过程中将时间维度作为考虑因素,解决了由于特征随着时间偏移会发生改变的问题,提高筛选特征的准确性。
-
公开(公告)号:CN115169720A
公开(公告)日:2022-10-11
申请号:CN202210866758.8
申请日:2022-07-22
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了发电数据生成方法和装置,具体涉及风力发电预测技术领域。具体实现方案为:获取待处理数据;基于第一预测天气数据,确定目标预测天气数据;将目标预测天气数据和第一风力发电数据输入预设的电力预测模型,得到第二风力发电数据,提升了预测的风力发电数据的准确性。该方式提升了预测的风力发电数据的准确性,有助于完成科学的电力调度规划。
-
公开(公告)号:CN113435923B
公开(公告)日:2022-09-27
申请号:CN202110662885.1
申请日:2021-06-15
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请提出了一种用电量的预测方法、装置及电子设备,涉及数据处理领域,尤其涉及电力调度领域及深度学习等人工智能领域,可应用于智慧城市场景下,包括:获取目标区域的历史用电数据;根据所述历史用电数据,确定所述目标区域的目标用电类型;调用与所述目标用电类型匹配的目标预测模型;由所述目标预测模型基于所述历史用电数据进行预测,获取下一用电时间段的预测母线负荷量。本申请中,通过对历史用电数据进行数据分析确定目标区域的目标用电类型,实现了对于历史用电数据的有效利用,对不同的目标用电类型分别进行单独的预测,提高了模型预测的效率以及准确率,增加了用电量预测方法的适用性和实用性,有效减少了资源浪费。
-
公开(公告)号:CN112149702A
公开(公告)日:2020-12-29
申请号:CN201910576748.9
申请日:2019-06-28
Applicant: 北京百度网讯科技有限公司
IPC: G06K9/62
Abstract: 本发明实施例提供一种特征的处理方法和装置,该方法包括:获取待处理数据集合,所述待处理数据集合中包括至少两个类型的特征,以及每个类型的特征对应的至少两个数据,计算得到所述待处理数据集合中的每两个类型的特征之间的相关系数,所述相关系数表示两类特征的关联程度,采用重要性分析模型,获取所述至少两个类型的特征的重要性排序,根据所述相关系数与所述重要性排序,对所述至少两个类型的特征进行过滤,得到用于模型训练的特征。这样,结合相关系数与重要性来进行特征筛选,提高了特征筛选的准确度,从而提升了建模效果。
-
公开(公告)号:CN112148765A
公开(公告)日:2020-12-29
申请号:CN201910576727.7
申请日:2019-06-28
Applicant: 北京百度网讯科技有限公司
Inventor: 杨海华
IPC: G06F16/2458 , G06F16/26 , G06N20/00
Abstract: 本申请提供一种业务数据的处理方法、装置及存储介质,其中,该方法包括:获取待处理的业务数据,该业务数据具有至少两个数据特征且业务数据中所包含的总数据样本具有时间标记,根据时间标记对业务数据中所包含的总数据样本按照时间段进行划分得到与各时间段分别对应的分桶数据样本,针对每个分桶数据样本,计算各数据特征分别对应的第一统计值,进而计算该业务数据的各数据特征的第一波动幅度,根据该业务数据的各数据特征的第一波动幅度,对全部数据特征进行特征过滤,得到业务数据的关键特征。该技术方案在特征筛选的过程中将时间维度作为考虑因素,解决了由于特征随着时间偏移会发生改变的问题,提高筛选特征的准确性。
-
公开(公告)号:CN112148764A
公开(公告)日:2020-12-29
申请号:CN201910576711.6
申请日:2019-06-28
Applicant: 北京百度网讯科技有限公司
IPC: G06F16/2458
Abstract: 本申请提供一种特征的筛选方法、装置、设备和存储介质,该方案中,电子设备获取待筛选的多个样本,每个样本中包括至少一个类型的特征,根据预设时间间隔,获取不同时间段内的每个类型的特征的互信息和覆盖率,根据每个时间段内的每个类型的特征的互信息和覆盖率,获取每个类型特征的稳定性指标,根据每个类型的特征的稳定性指标,对所述多个样本中的特征进行筛选,通过计算在不同时间段上稳定性衡量的动态指标来做特征选择,可有效提升建模效果,提高模型准确度。
-
公开(公告)号:CN114662702A
公开(公告)日:2022-06-24
申请号:CN202210340068.9
申请日:2022-03-31
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种故障检测方法、装置、设备、介质和产品,涉及计算机技术领域,具体为工业大数据、机器学习技术领域。故障检测方法包括:基于目标频率范围和目标设备的运行状态数据的频率,对运行状态数据进行分解,得到与目标频率范围对应的频率区间数据;对频率区间数据进行特征提取,得到与频率区间数据对应的初始特征集合,其中,初始特征集合中的初始特征包括类别标识;基于类别标识,对初始特征集合进行处理,得到目标特征;基于目标特征,确定针对目标设备的故障信息。
-
-
-
-
-
-
-
-
-