-
公开(公告)号:CN115017218A
公开(公告)日:2022-09-06
申请号:CN202210691815.3
申请日:2022-06-17
Applicant: 中国电信股份有限公司
IPC: G06F16/25 , G06F16/2458
Abstract: 本公开是关于一种分布式调用链的处理方法及装置、存储介质、电子设备,涉及计算机技术领域,该方法包括:拦截原始日志数据,并对所述原始日志数据进行解析,得到所述原始日志数据中包括的具有第一数据格式的分布式调用链;对所述具有第一数据格式的分布式调用链进行格式转换,得到具有第二数据格式的分布式调用链;基于预设的压缩算法对所述具有第二数据格式的分布式调用链进行数据压缩,得到压缩后的分布式调用链;将所述压缩后的分布式调用链发送至Kafka集群,以使得所述Kafka集群对所述压缩后的分布式调用链进行存储。本公开提高了数据的完整性。
-
公开(公告)号:CN113051442A
公开(公告)日:2021-06-29
申请号:CN201911365065.5
申请日:2019-12-26
Applicant: 中国电信股份有限公司
IPC: G06F16/903 , G06F16/904 , G06F16/906
Abstract: 本公开提出一种时间序列数据处理方法、装置和计算机可读存储介质,涉及大数据技术领域。本公开的一种时间序列数据处理方法,包括:将时间序列数据做图形化处理,获取时间序列曲线;根据时间序列曲线的图形化特征对时间序列数据做预定粒度的划分,获取多组初分类时间序列数据;通过聚类算法处理每组初分类时间序列数据,获取聚类时间序列数据簇;根据聚类时间序列数据簇执行数据存储或挖掘中的至少一项。通过这样的方法,能够便于舍弃相似度偏低的序列数据,着重研究相似度较高的数据,有效提高下游任务后续挖掘的精度和效率,提高对时间序列数据的有效利用和处理效率。
-
公开(公告)号:CN107770738B
公开(公告)日:2021-06-04
申请号:CN201610707910.2
申请日:2016-08-23
Applicant: 中国电信股份有限公司
IPC: H04W4/14 , H04M1/72436 , G06F16/35
Abstract: 本发明公开一种用于实现短信自动分类的方法和用户终端,涉及大数据领域。其中在用户终端接收到短信后,判断短信是否与发送方号码规则相匹配,若短信与发送方号码规则相匹配,则将短信存入相对应的分类文件夹中,若短信与发送方号码规则不匹配,则进一步判断短信是否与文本分类器相匹配,若短信与文本分类器相匹配,则将短信存入相对应的分类文件夹中。本发明无需用户输入关键字和发送方号码就可以实现短信分类,克服发送方号码多变和人工确定关键字困难的缺陷,从而可以更智能地解决短信自动分类的问题。
-
公开(公告)号:CN107872480B
公开(公告)日:2020-12-29
申请号:CN201610853276.3
申请日:2016-09-26
Applicant: 中国电信股份有限公司
IPC: H04L29/08
Abstract: 本发明公开了一种大数据集群数据平衡方法和装置,涉及大数据领域。其中的方法包括:获取数据平衡策略信息;获取大数据集群负载和性能数据;根据数据平衡策略和大数据集群负载和性能数据动态调整数据平衡的网络带宽,重新启动数据平衡程序。本发明能够在保障集群正常数据生产的同时,提高集群数据平衡的效率和弹性。
-
公开(公告)号:CN113946861B
公开(公告)日:2025-02-18
申请号:CN202111196559.2
申请日:2021-10-14
Applicant: 中国电信股份有限公司
IPC: G06F21/62 , G06N20/00 , H04W12/03 , H04W12/041
Abstract: 本公开涉及一种推荐模型的训练方法及装置、信息推荐方法及装置、电子设备及计算机可读介质,属于机器学习技术领域。该推荐模型的训练方法包括:将所有终端划分为终端对并生成密钥;对各个终端的特征进行分箱后计算特征的统计信息;根据特征统计信息与终端的密钥,得到终端中每个特征的加密统计信息以及各个特征的总体统计信息;将训练样本集合作为决策树模型中的节点,并根据总体统计信息确定目标分裂点;根据目标分裂点对决策树进行分裂后,重新计算训练样本集合中各个特征的统计信息并确定下一目标分裂点,直到满足预设条件时停止迭代,得到终端的推荐模型。本公开通过在模型训练过程中对终端的特征统计信息进行加密,可以保护用户隐私。
-
公开(公告)号:CN115314931A
公开(公告)日:2022-11-08
申请号:CN202110499293.2
申请日:2021-05-08
Applicant: 中国电信股份有限公司
Abstract: 本公开提供了一种室内外确定方法和装置、模型训练方法和装置,涉及大数据处理技术领域,室内外确定方法包括:获取第一用户在至少一个第一时间窗口内的多条MR数据;构建包括第一元素的第一矩阵,第一元素包括每条MR数据中的多个服务小区的RSRP,多个服务小区包括主服务小区和多个邻服务小区;构建包括第二元素的第二矩阵,第二元素包括第一组和第二组元素中的至少一组,第一组元素包括与每条MR数据中的TA成正比的第一距离,第二组元素包括每条MR数据中的主服务小区与时间最早的MR数据中的主服务小区之间的第二距离;和将输入参数输入到训练好的机器学习模型,以确定第一用户在每个第一时间窗口内位于室内还是室外,输入参数包括第一和第二矩阵。
-
公开(公告)号:CN114218002A
公开(公告)日:2022-03-22
申请号:CN202111530032.9
申请日:2021-12-09
Applicant: 中国电信股份有限公司
Abstract: 本公开提供一种异常日志检测方法、装置、电子设备和可读介质,其中,异常日志检测方法包括:将采集的日志序列转换为多个日志向量;将日志向量输入构建的双向T‑LSTM网络,双向T‑LSTM网络的输出层引入注意力机制为日志事件分配权重,权重是由时间序列之间的时间间隔确定的;对分配权重的日志事件进行分类处理,以确定日志事件中的异常日志。通过本公开实施例,提高了异常日志检测的可靠性、准确性和效率。
-
公开(公告)号:CN113946861A
公开(公告)日:2022-01-18
申请号:CN202111196559.2
申请日:2021-10-14
Applicant: 中国电信股份有限公司
IPC: G06F21/62 , G06N20/00 , H04W12/03 , H04W12/041
Abstract: 本公开涉及一种推荐模型的训练方法及装置、信息推荐方法及装置、电子设备及计算机可读介质,属于机器学习技术领域。该推荐模型的训练方法包括:将所有终端划分为终端对并生成密钥;对各个终端的特征进行分箱后计算特征的统计信息;根据特征统计信息与终端的密钥,得到终端中每个特征的加密统计信息以及各个特征的总体统计信息;将训练样本集合作为决策树模型中的节点,并根据总体统计信息确定目标分裂点;根据目标分裂点对决策树进行分裂后,重新计算训练样本集合中各个特征的统计信息并确定下一目标分裂点,直到满足预设条件时停止迭代,得到终端的推荐模型。本公开通过在模型训练过程中对终端的特征统计信息进行加密,可以保护用户隐私。
-
公开(公告)号:CN109429296B
公开(公告)日:2021-04-30
申请号:CN201710769617.3
申请日:2017-08-31
Applicant: 中国电信股份有限公司
Abstract: 本发明公开了一种用于终端与上网信息关联的方法、装置及存储介质,其中的方法包括:获取与无线接入点对应的用户上网信息;判断用户上网信息中是否包含有终端标识;如果是,则将终端标识与用户上网信息相关联;如果否,则确定时间窗口以及无线接入点,统计与此无线接入点对应的用户上网信息中的终端标识在时间窗口内的上网次数,基于统计结果确定此没有包含终端标识的用户上网信息所对应的终端标识,并将此终端标识与其进行关联。本发明的方法、装置及存储介质,能够对用户上网行为进行识别,算法比较简单、实现容易,不需要多次迭代运算,运算效率高,能及时响应各种业务需求,可以广泛应用于实时广告推荐以及市场营销等商业活动中。
-
公开(公告)号:CN112399013A
公开(公告)日:2021-02-23
申请号:CN201910752357.8
申请日:2019-08-15
Applicant: 中国电信股份有限公司
Abstract: 本公开提供一种异常话务识别方法和装置。异常话务识别装置实时采集通信话务数据,将在预定时间段内所采集的通信话务数据转换为相应的第一矩阵式归一化数据向量表,在第一矩阵式归一化数据向量表中,提取出与当前时间窗口相对应的归一化数据向量,将提取出的归一化数据向量输入经过训练的神经网络,以便输出异常话务识别结果,延迟预定时间后,将当前时间窗口沿时间轴方向滑动预定步长,然后重复执行提取出与当前时间窗口相对应的归一化数据向量的步骤。本公开利用滑动的时间窗口提取出相应的数据向量以输入经过训练的神经网络,从而能够对实际通信行业中与诈骗行为相关联的号码进行流水线式检测。
-
-
-
-
-
-
-
-
-