-
公开(公告)号:CN116227552A
公开(公告)日:2023-06-06
申请号:CN202310195726.4
申请日:2023-02-24
Applicant: 北京百度网讯科技有限公司
IPC: G06N3/0464 , G06N3/08 , G06F18/10 , G06F18/2131 , G06F18/24
Abstract: 本公开提供了一种预训练模型的训练方法、时序数据的识别方法及装置,涉及人工智能技术领域,尤其涉及数据处理、机器学习技术领域。具体实现方案为:对原始时序数据添加噪声,得到样本时序数据。然后通过预训练模型提取样本时序数据的趋势项和季节项,其中,趋势项表示样本时序数据的变化趋势,季节项表示样本时序数据的变化周期。之后通过预训练模型基于趋势项和季节项,预测添加噪声前的时序数据,得到预测时序数据。再基于原始时序数据和预测时序数据,训练预训练模型。从而实现了提高对时序数据进行识别的准确性。
-
公开(公告)号:CN115809727A
公开(公告)日:2023-03-17
申请号:CN202211461213.5
申请日:2021-09-09
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请公开了天然气净化发泡预警模型训练方法、装置以及设备,涉及工业大数据技术领域,尤其涉及人工智能、深度学习领域。具体实现方案为:天然气净化发泡预警模型训练方法,包括:获取影响天然气发泡的第一数据;对所述第一数据进行采样获得第二数据;基于所述第一数据和第二数据进行计算得到统计变量;利用所述统计变量进行模型训练,获得训练后的天然气净化发泡预警模型。本公开将天然气净化厂塔内是否发泡进行提前预测,高效预警,避免高度依赖人工,减少漏判错判的情况,而且能够减少阻泡剂的使用,避免资源的浪费,提升整个净化厂的运营效率。
-
公开(公告)号:CN114358406A
公开(公告)日:2022-04-15
申请号:CN202111618429.3
申请日:2021-12-27
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种资源数据处理方法、资源预测模型的训练方法、装置、设备、介质和产品,涉及人工智能技术领域,具体为大数据、机器学习等技术领域。资源数据处理方法包括:获取与历史时间信息相关联的历史资源关联数据;基于历史时间信息与第一指定时间信息之间的关联性,确定针对历史资源关联数据的权重;基于历史资源关联数据和权重,确定针对第一指定时间信息的第一目标资源数据。
-
公开(公告)号:CN110543943B
公开(公告)日:2022-03-25
申请号:CN201910858156.6
申请日:2019-09-10
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请公开了一种网络融合方法及装置、电子设备、存储介质,涉及大数据领域。具体实现方案为:至少将从网络数据中获取到的线上信息作为第一节点,并基于线上信息之间的关联关系,构建包含有第一节点的第一网络,线上信息包含有至少一个账号及至少一个网络媒体信息;至少将从移动通信数据中获取到的线下信息作为第二节点,并基于线下信息之间的关联关系,构建包含有第二节点的第二网络,线下信息包含至少一个终端标识及至少一个终端标识所对应终端的位置信息;利用线上信息所包含的账号及线下信息所包含的终端标识之间的关联关系,对第一网络和第二网络进行融合,如此,构建出异构网络,解决了网络中信息有损的问题。
-
公开(公告)号:CN113515568A
公开(公告)日:2021-10-19
申请号:CN202110792127.1
申请日:2021-07-13
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了一种图关系网络构建方法、图神经网络模型训练方法及装置,涉及大数据处理领域,尤其涉及用户理解、关系理解、图关系网络构建、图神经网络模型训练技术领域。具体实现方案为:构建的图关系网络中融合了用户事件之间的时序信息,从而构建的包含时序信息的图网络关系能提供更好的用户表征以及用户事件节点表征,为后续的基于图神经网络等的图关系网络数据挖掘提供良好的数据基础。
-
公开(公告)号:CN113011922A
公开(公告)日:2021-06-22
申请号:CN202110291936.4
申请日:2021-03-18
Applicant: 北京百度网讯科技有限公司
Abstract: 本申请公开了相似人群的确定方法、装置、电子设备和存储介质,涉及计算机技术领域,尤其涉及人工智能领域。具体实现方案为:基于人群预测模型确定人群中候选用户的个体预测得分;根据人群区分度阈值和所述候选用户的个体预测得分,选择属于目标相似人群的候选用户;其中,所述人群区分度阈值根据所述人群预测模型的训练样本得到。本申请实施例能够提高相似人群划分的准确度。
-
公开(公告)号:CN112149834A
公开(公告)日:2020-12-29
申请号:CN201910579024.X
申请日:2019-06-28
Applicant: 北京百度网讯科技有限公司
Abstract: 本发明实施例公开了一种模型训练方法、装置、设备和介质。该方法包括:将第二方拥有的特征数据表示中取值为固定数值的元素,作为特征数据表示中的目标特征元素;基于待训练的网络模型对第二方拥有的特征数据进行预测得到第二方预测结果;向第一方发送第二方预测结果;根据从第一方获取的残差密文、固定数值密文,以及特征数据表示中的目标特征元素和其他特征元素,确定第二方梯度密文;向第一方发送第二方梯度密文,供第一方对第二方梯度密文进行同态解密得到第二方梯度原文;根据从第一方获取的第二方梯度原文,继续对第二方的网络模型进行训练。本发明实施例实现了减少密文与明文的相乘次数,大幅度降低计算量,提高模型训练效率的效果。
-
公开(公告)号:CN112149706A
公开(公告)日:2020-12-29
申请号:CN201910579010.8
申请日:2019-06-28
Applicant: 北京百度网讯科技有限公司
Abstract: 本发明实施例公开了一种模型训练方法、装置、设备和介质。该方法包括:基于待训练的网络模型对第二方拥有的特征数据进行预测得到第二方预测结果;向第一方发送第二方预测结果;根据从第一方获取的残差密文和第二方拥有的特征数据,确定第二方梯度密文;为第二方梯度密文添加扰动数据,得到第二方扰动梯度密文;向第一方发送第二方扰动梯度密文,供第一方对第二方扰动梯度密文进行同态解密得到第二方扰动梯度;根据从第一方获取的第二方扰动梯度,继续对第二方的网络模型进行训练。本发明实施例通过为第二方梯度密文添加扰动数据得到第二方扰动梯度密文,提高了特征数据求解方程的未知数数量,使得特征数据无法求解,避免第二方特征数据泄露。
-
公开(公告)号:CN111833199A
公开(公告)日:2020-10-27
申请号:CN201910295117.X
申请日:2019-04-12
Applicant: 北京百度网讯科技有限公司
IPC: G06Q50/00
Abstract: 本发明提出一种社区结构的划分方法、装置、设备和计算机可读介质,所述方法包括:计算网络结构中的每个顶点的归属概率;根据获取的归属概率随机采样多个顶点,构成社区结构;计算社区结构模块度指标;判断所述社区结构的模块度指标是否达到预设条件;若否,则根据所述的模块度指标更新顶点的归属概率,并更新所述社区结构;若是,则输出当前的社区结构。本发明实施例通过顶点的归属概率确定社区结构,并通过迭代计算更新的方式,可以逐步优化全局的社区结构,使得社区结构中顶点的构成更加合理,更能体现全局的社区性。
-
公开(公告)号:CN110659427A
公开(公告)日:2020-01-07
申请号:CN201910841067.0
申请日:2019-09-06
Applicant: 北京百度网讯科技有限公司
IPC: G06F16/9537 , G06K9/62
Abstract: 本申请提出一种基于多源数据的城市功能划分方法、装置和电子设备,涉及大数据领域,其中,方法包括:获取待划分网格区域内的用户到访数据特征向量、用户搜索数据特征向量和卫星图像特征向量;将用户访问数据特征向量、用户搜索数据特征向量和卫星图像特征向量输入预设的多源多模融合网络进行融合处理生成融合特征向量;将融合特征向量输入预设分类器进行处理,输出与待划分网格区域对应的目标类别。解决现有技术中城市功能划分不够准确的技术问题,通过将用户访问数据特征向量、用户搜索数据特征向量和卫星图像特征向量输入预设的多源多模融合网络融合生成融合特征向量后输入预设分类器进行处理,输出目标类别,提高了城市功能区域划分的准确性。
-
-
-
-
-
-
-
-
-