-
公开(公告)号:CN117668618B
公开(公告)日:2025-01-28
申请号:CN202311750113.9
申请日:2023-12-19
Applicant: 北京九栖科技有限责任公司
IPC: G06F18/24 , G06F18/213 , H04W4/029 , H04W4/20
Abstract: 本发明公开了一种基于信令数据的交通工具识别方法,包括:S1获取终端信令数据,并进行预处理,得到用户轨迹数据;S2基于用户轨迹数据识别得到对应的交通工具类型;S3基于用户轨迹数据和对应的交通工具类型提取常规性特征值,并获取每个特征值的分布情况;S4基于常规性特征值和分布情况建立常规特征规则策略;S5基于用户轨迹数据和分布情况建立高级特征规则策略;S6基于常规特征规则策略和高级特征规则策略建立专家系统规则;S7验证并调整专家系统规则,得到最优专家系统规则;S8基于最优专家系统规则识别待测终端信令数据,得到交通工具类型。通过最优专家系统规则高效精准识别信令数据所属的交通工具类型。
-
公开(公告)号:CN118503419B
公开(公告)日:2024-11-22
申请号:CN202410565826.6
申请日:2024-05-09
Applicant: 北京九栖科技有限责任公司
IPC: G06F16/35 , G06F18/2134 , G06F18/23213 , G06F18/2413 , H04W4/14 , H04W12/00
Abstract: 本发明公开了一种基于伪标签融合聚类的垃圾短信分类方法及装置;方法包括:构建垃圾短信分类模型;确定固定号码知识库,根据固定号码对应的数据集,基于伪标签融合聚类对垃圾短信分类模型进行训练;利用训练好的垃圾短信分类模型对垃圾短信进行分类。本发明基于伪标签融合聚类的垃圾短信分类方法,可充分利用无标注数据,挖掘其潜在特征,从而提升模型泛化能力,以及提升垃圾短信的识别能力。
-
公开(公告)号:CN118413886B
公开(公告)日:2024-10-25
申请号:CN202410875759.8
申请日:2024-07-02
Applicant: 北京九栖科技有限责任公司
IPC: H04W64/00 , G06F18/23 , G06F18/243 , H04W4/029
Abstract: 本发明涉及机器学习技术领域,涉及一种基于机器学习的基站位置预测方法,包括:S1:获取运营商基站数据、第三方基站数据和信令轨迹数据;S2:计算基站在运营商基站数据和第三方基站数据中的间距,并根据预设的间距阈值进行区分,生成白名单基站表和灰名单基站表;S3:根据信令轨迹数据对白名单基站表和灰名单基站表进行纠正;S4:提取白名单基站的基站特征训练机器学习模型,并利用训练好的机器学习模型对灰名单基站的基站特征进行预测。本发明结合多方数据对各个基站的进行划分;由白名单基站提供高精度的基站特征训练模型,并利用训练好的模型对灰名单基站进行预测,实现对灰名单基站位置的校正,提高了基站定位的精度。
-
公开(公告)号:CN118215008A
公开(公告)日:2024-06-18
申请号:CN202410613018.2
申请日:2024-05-17
Applicant: 北京九栖科技有限责任公司
Abstract: 本发明公开了一种区域自适应的图信融合计算方法,属于大数据挖掘技术领域,首先获取各区域基站基础数据、车辆杆体数据,与实时轨迹数据结合使用;对各区域手机信令轨迹数据进行插值,筛选每个手机号码的职住轨迹;依次基于源区域正样本数据进行信令轨迹压缩、杆体附近轨迹过滤、时间切片轨迹碰撞、运营商平权相似度计算等操作,直至完成源区域模型参数训练;利用源区域模型计算目标区域全量数据置信度,筛选目标区域潜在正样本集合,重复执行上述操作直至完成目标区域模型参数训练。利用本发明方法可提高图信融合计算模型的准确性,便于准确度量车辆与手机号码的轨迹相似性;同时解决了目标区域正样本匮乏问题,提升了计算模型的可移植性。
-
公开(公告)号:CN117670515A
公开(公告)日:2024-03-08
申请号:CN202311653037.X
申请日:2023-12-05
Applicant: 北京九栖科技有限责任公司
Abstract: 本发明公开了一种基于通信数据的网贷欺诈风险识别方法及系统,方法包括根据种子逾期号码确定候选SP号码集合,对集合中各候选SP号码进行度量得到催缴系数,根据催缴系数确定催缴SP号码;以催缴SP号码的通联号码作为本期逾期号码;对本期逾期号码进行风险度量,得到目标逾期号码,根据目标逾期号码对网贷欺诈风险进行识别。本发明基于通信大数据,能够在数据限制条件下,快速而准确地从大范围群体中自动识别欺诈风险,并能全面的提供风险类型特点和相关信息,有良好适用性和泛化性。
-
公开(公告)号:CN117493977A
公开(公告)日:2024-02-02
申请号:CN202311770421.8
申请日:2023-12-21
Applicant: 北京九栖科技有限责任公司
IPC: G06F18/241 , G06F18/214 , G06F16/901 , G06N3/042 , G06N3/0464 , G06N3/084 , G06F18/25 , G06N5/04
Abstract: 本发明公开了一种基于GraphSAGE图推理模型的风险识别算法及装置,涉及数据安全技术领域。其方法包括,基于用户关系数据构建图谱网络,所述用户关系数据包括用户社交关系数据或用户交易关系数据;在所述图谱网络上进行特征采样和特征融合,构建图谱网络节点的二分类模型;基于GraphSAGE算法对所述二分类模型进行训练;利用训练好的二分类模型对未知用户的关系数据进行风险识别。利用本发明提高了高风险识别的准确性和效率。
-
公开(公告)号:CN115759474A
公开(公告)日:2023-03-07
申请号:CN202211573438.X
申请日:2022-12-08
Applicant: 北京九栖科技有限责任公司
IPC: G06Q10/04 , G06Q10/0631 , G06Q50/06 , G06F18/25 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于Autoformer模型和XGBoost模型的多任务负荷预测方法及其系统,包括以下步骤:获取历史数据,分别提取时间特征、气象特征、人口特征以及居民负荷数据,从而构造历史时序数据;基于Autoformer模型进行对人口数量和居民负荷进行预测,得到一个时间段内人口数量预测值和居民最大负荷预测值;基于XGboost模型利用时间特征、气象特征以及Autoformer模型预测的人口数量预测值对同一个时间段内的居民最大负荷进行预测;将Autoformer模型和XGboost模型预测到的居民最大负荷进行融合,得到最终预测结果。该系统包括特征提取模块、Autoformer模型预测模块、XGboost模型预测模块和预测结果融合模块;本发明解决了现有技术中无法有效利用时序数据进行负荷预测这一问题。
-
公开(公告)号:CN119132049B
公开(公告)日:2025-04-11
申请号:CN202411192242.5
申请日:2024-08-28
Applicant: 北京九栖科技有限责任公司
Abstract: 本发明公开了一种用于高速公路场景的车码拟合方法及系统,包括:获取高速公路车辆轨迹数据及手机定位数据,提取关键字段,分别创建车辆时空轨迹表和手机号码时空轨迹表;根据两类时空轨迹表,进行车码拟合计算,得到每日的车码拟合结果;进一步,基于每日的车码拟合结果,采用阈值过滤和基于首尾端轨迹的样本过滤两类噪声过滤方法进行结果降噪,得到高置信伴随结果候选集;基于高置信伴随结果候选集,按月聚合得到最终车码拟合结果;本发明不仅能够有效处理数据中的噪声,还能在稀疏数据环境下准确识别高速公路车辆与手机号码的伴随关系,提高了伴随关系识别的准确性和可信度。
-
公开(公告)号:CN118965081A
公开(公告)日:2024-11-15
申请号:CN202411260369.6
申请日:2024-09-10
Applicant: 北京九栖科技有限责任公司
IPC: G06F18/24 , G06F16/2455 , G06F16/2458 , G06F18/15 , G06F18/21
Abstract: 本发明涉及一种基于在线局部敏感哈希算法的一人多号识别方法,通过获取各通信运营商中不同手机号码的轨迹路线;对所述轨迹路线进行轨迹点个数对齐;并基于p‑稳定分布,构造多个哈希函数,创建哈希桶;以及将对齐后的轨迹路线通过多个哈希桶分别映射为指纹值,通过对多个指纹值取交得到不同用户的近似近邻号码集合。本发明能够在保证去重质量的同时,显著降低数据处理的复杂度和时间成本;并且应对大规模数据集时,能够快速找到近似样本集合,从而通过简化样本量的方式显著提高一人多号识别的效率,以更高效地应对大规模数据的挑战。
-
公开(公告)号:CN118193645A
公开(公告)日:2024-06-14
申请号:CN202410600054.5
申请日:2024-05-15
Applicant: 北京九栖科技有限责任公司
IPC: G06F16/27 , G06F16/22 , G06F16/25 , G06F16/2457 , G06F16/29 , G06N3/0455 , G06N3/084
Abstract: 本发明公开了一种基于Hbase和向量数据库的轨迹检索方法、系统及介质,属于时空数据挖掘技术领域。本发明的技术方案中,基于Hbase和向量数据库的轨迹检索方法首先通过利用预训练模型获取轨迹的嵌入向量,解决了轨迹相似度难以衡量的问题;其次,利用向量数据库对轨迹进行相似检索,有效解决了嵌入向量检索效率低的问题;最后,结合Hbase非关系型分布式数据库的特性,进一步提高了检索效率。
-
-
-
-
-
-
-
-
-