-
公开(公告)号:CN112822302B
公开(公告)日:2023-03-24
申请号:CN201911127228.6
申请日:2019-11-18
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04L61/301 , H04L61/4511
Abstract: 本申请公开了数据归一化的方法、装置、电子设备及存储介质,涉及数据处理领域,尤其是网络地址归一化处理技术领域。具体实现方案为:获取多个规则词表,多个规则词表由离线模块生成,多个规则词表分别记录不同作用范围的正则表达式;获取目标网络地址;根据多个规则词表,按照记录的正则表达式的作用范围由大至小的顺序,依次对网络地址进行字符匹配,得到归一化网络地址。依次使用多个规则对目标网络地址进行正则表达式的匹配,提高了网络地址归一化处理的准确性。在线模块无需进行规则词表的生成,因此在线模块能够不间断的对获取到的目标地址进行归一化处理,提高了网络地址归一化处理效率。
-
公开(公告)号:CN118035557A
公开(公告)日:2024-05-14
申请号:CN202410324000.0
申请日:2024-03-20
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/9535 , H04L67/306 , H04L67/55
Abstract: 本公开提供了资源推送方法、装置、电子设备、存储介质及程序产品,人工智能技术领域,尤其涉及智能检索技术领域、大数据技术领域和深度学习技术领域,可以应用于资源检索、广告资源竞拍等场景。具体实现方案为:响应于搜索请求,根据搜索请求中携带的目标信息构建用于筛选资源的场景特征;对场景特征进行处理,生成用于执行筛选流程中的筛选任务的任务参数,其中,筛选流程包括至少一个筛选任务;根据任务参数执行筛选流程中的筛选任务,得到目标资源;以及推送目标资源。
-
公开(公告)号:CN112817965A
公开(公告)日:2021-05-18
申请号:CN201911128994.4
申请日:2019-11-18
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了一种数据拼接方法、装置、电子设备和存储介质,涉及大数据处理技术领域。具体实现方案为:从至少两个数据分桶中为待拼接的目标数据选择目标分桶;将所述目标数据分发到所述目标分桶的未拼接数据中,以指示所述目标分桶在监测到拼接触发事件时,对所述未拼接数据进行拼接;其中所述拼接触发事件根据所述目标分桶中的未拼接数据和已拼接数据生成。本申请实施例由于目标分桶中的未拼接数据和已拼接数据是动态变化的,而根据未拼接数据和已拼接数据的数量生成拼接触发事件,可到达动态调整拼接时间间隔的目的,也即可自适应调整数据拼接频率,由此既保证了数据的时效性,还能减少整个拼接过程中计算资源的消耗,提升计算效率。
-
公开(公告)号:CN112822302A
公开(公告)日:2021-05-18
申请号:CN201911127228.6
申请日:2019-11-18
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04L29/12
Abstract: 本申请公开了数据归一化的方法、装置、电子设备及存储介质,涉及数据处理领域,尤其是网络地址归一化处理技术领域。具体实现方案为:获取多个规则词表,多个规则词表由离线模块生成,多个规则词表分别记录不同作用范围的正则表达式;获取目标网络地址;根据多个规则词表,按照记录的正则表达式的作用范围由大至小的顺序,依次对网络地址进行字符匹配,得到归一化网络地址。依次使用多个规则对目标网络地址进行正则表达式的匹配,提高了网络地址归一化处理的准确性。在线模块无需进行规则词表的生成,因此在线模块能够不间断的对获取到的目标地址进行归一化处理,提高了网络地址归一化处理效率。
-
公开(公告)号:CN117573973A
公开(公告)日:2024-02-20
申请号:CN202311542158.7
申请日:2023-11-17
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/9535 , G06F18/25 , G06N3/0464 , G06N3/08
Abstract: 本公开提供了资源推荐方法、装置、电子设备以及存储介质,涉及计算机技术领域,尤其涉及大数据技术领域、智能搜索技术领域和人工智能技术领域。具体实现方案为:响应于资源推荐请求,获取多个候选资源各自相关的候选资源特征;根据预训练的深度学习模型处理多个所述候选资源特征,从多个所述候选资源中得到至少一个第一推荐资源;根据与至少一个所述第一推荐资源相关的第一推荐资源特征,从多个所述候选资源中确定至少一个第二推荐资源;以及在交互页面中展示推荐资源集,其中,所述推荐资源集包括所述第一推荐资源和所述第二推荐资源。
-
公开(公告)号:CN112819491B
公开(公告)日:2024-02-09
申请号:CN201911120892.8
申请日:2019-11-15
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06Q30/0242 , G06Q10/0639 , G06F16/2458
Abstract: 本申请公开了转化数据处理的方法、装置、电子设备及存储介质,涉及数据处理领域,尤其是目标转化出价中的转化数据处理技术。具体实现方案为:根据指标参数对多种类型的转化数据进行归一化处理,得到归一化数据,归一化数据包括基于时间的指标值序列;根据时间权重判断指标值序列是否存在异常数据;若存在异常数据,从指标值序列中删除异常数据。归一化处理能够将多种类型的转化数据转化为具有相同数据结构的归一化数据,基于时间权重对归一化数据包含的指标值序列进行异常数据检测,能够提高异常数据检测的准确性。
-
公开(公告)号:CN112817965B
公开(公告)日:2023-10-17
申请号:CN201911128994.4
申请日:2019-11-18
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了一种数据拼接方法、装置、电子设备和存储介质,涉及大数据处理技术领域。具体实现方案为:从至少两个数据分桶中为待拼接的目标数据选择目标分桶;将所述目标数据分发到所述目标分桶的未拼接数据中,以指示所述目标分桶在监测到拼接触发事件时,对所述未拼接数据进行拼接;其中所述拼接触发事件根据所述目标分桶中的未拼接数据和已拼接数据生成。本申请实施例由于目标分桶中的未拼接数据和已拼接数据是动态变化的,而根据未拼接数据和已拼接数据的数量生成拼接触发事件,可到达动态调整拼接时间间隔的目的,也即可自适应调整数据拼接频率,由此既保证了数据的时效性,还能减少整个拼接过程中计算资源的消耗,提升计算效率。
-
公开(公告)号:CN112819491A
公开(公告)日:2021-05-18
申请号:CN201911120892.8
申请日:2019-11-15
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06Q30/02 , G06Q10/06 , G06F16/2458
Abstract: 本申请公开了转化数据处理的方法、装置、电子设备及存储介质,涉及数据处理领域,尤其是目标转化出价中的转化数据处理技术。具体实现方案为:根据指标参数对多种类型的转化数据进行归一化处理,得到归一化数据,归一化数据包括基于时间的指标值序列;根据时间权重判断指标值序列是否存在异常数据;若存在异常数据,从指标值序列中删除异常数据。归一化处理能够将多种类型的转化数据转化为具有相同数据结构的归一化数据,基于时间权重对归一化数据包含的指标值序列进行异常数据检测,能够提高异常数据检测的准确性。
-
-
-
-
-
-
-