-
公开(公告)号:CN111259657A
公开(公告)日:2020-06-09
申请号:CN202010033448.9
申请日:2020-01-13
申请人: 佳都新太科技股份有限公司 , 广州佳都科技软件开发有限公司 , 广州新科佳都科技有限公司
IPC分类号: G06F40/279 , G06F40/30 , G06F40/126
摘要: 本发明实施例公开了一种车站名称识别方法、装置、设备及存储介质,涉及数据处理技术领域,其包括:获取基于用户的语音请求数据得到的文本识别结果;查找所述文本识别结果中出现的备选车站名称;生成所述备选车站名称的正则表达式,并根据所述正则表达式在车站名称集合中匹配相关的目标车站名称,所述正则表达式为拼音的混淆发音表达式;利用所述目标车站名称替换所述文本识别结果中的所述备选车站名称,以得到最终文本识别结果。采用上述方案可以解决现有技术中,由于用户混淆发音而无法对语音数据进行正确识别的技术问题。
-
公开(公告)号:CN111242040A
公开(公告)日:2020-06-05
申请号:CN202010040705.1
申请日:2020-01-15
申请人: 佳都新太科技股份有限公司 , 广州佳都科技软件开发有限公司 , 广州新科佳都科技有限公司
摘要: 本申请实施例公开了一种动态人脸聚类方法、装置、设备和存储介质。该方法包括对批量人脸图片进行静态聚类处理,得到多个包括邻居人脸集合的簇,根据每个簇中每张人脸图片相对于簇中其他人脸图片的平均相似度,对每个簇中的人脸图片进行筛选,从每个簇中选取多张人脸图片分别建立档案,根据档案的邻居相似度对满足邻居合并条件的簇进行合并,并基于合并后的簇重新建立档案,根据新增人脸图片与每个档案中的人脸图片的平均相似度,确定所述新增人脸图片所对应的档案,将所述新增人脸图片加入所述档案对应的簇中。本方案提高了人脸聚类的效率。
-
公开(公告)号:CN111261165A
公开(公告)日:2020-06-09
申请号:CN202010033625.3
申请日:2020-01-13
申请人: 佳都新太科技股份有限公司 , 广州佳都科技软件开发有限公司 , 广州新科佳都科技有限公司
摘要: 本发明实施例公开了一种车站名称识别方法、装置、设备及存储介质,涉及数据处理技术领域,其包括:获取基于用户的语音请求数据得到的字符识别结果以及与所述字符识别结果对应的备选车站名称集合;计算所述备选车站名称集合中每个备选车站名称的匹配评价分数,所述匹配评价分数包括:字符统计分数和/或字符排序分数;根据所述匹配评价分数选择至少一个备选车站名称作为所述语音请求数据的车站名称识别结果。采用上述方案可以解决现有技术中,在文本提取时,无法在降低对数据集的要求时,保证泛化能力的技术问题。
-
公开(公告)号:CN110825785A
公开(公告)日:2020-02-21
申请号:CN201911072865.8
申请日:2019-11-05
申请人: 佳都新太科技股份有限公司 , 广州佳都科技软件开发有限公司
IPC分类号: G06F16/2458 , G06Q50/26
摘要: 本申请实施例公开了一种数据挖掘方法、装置、电子设备及存储介质。本申请实施例通过获取用于犯罪团伙挖掘的业务数据,将业务数据进行时间切片得到切片数据集,通过提取犯罪嫌疑人在对应时间段的经纬度信息或手机MAC地址信息,与切片数据集进行比对,通过确定经纬度信息或MAC地址信息存在设定关联关系的第一挖掘对象集合,以该第一挖掘对象集合中确定与犯罪嫌疑人为同伙关系的挖掘对象。采用上述技术手段,可以通过信息关联较快地进行犯罪团伙挖掘,避免繁琐的信息查询流程,进而简化同伙挖掘流程,提高信息挖掘效率。
-
公开(公告)号:CN110807052A
公开(公告)日:2020-02-18
申请号:CN201911072846.5
申请日:2019-11-05
申请人: 佳都新太科技股份有限公司 , 广州佳都科技软件开发有限公司
IPC分类号: G06F16/2458 , G06F16/28
摘要: 本发明实施例公开了一种用户群分类方法、装置、设备及存储介质,涉及数据处理技术领域,其包括:获取用户群中每位用户在各维度下的行为数据,每个所述维度对应至少一类所述行为数据;根据所述行为数据确定每个所述维度下各所述用户之间的行为相似度;根据所述行为相似度计算基于全部所述维度的用户之间的最终相似度;根据所述最终相似度对所述用户群进行分类。采用上述方案可以解决现有技术中嫌疑人团伙确定方案准确度低、应用场景单一的技术问题。
-
公开(公告)号:CN111261165B
公开(公告)日:2023-05-16
申请号:CN202010033625.3
申请日:2020-01-13
申请人: 佳都科技集团股份有限公司 , 广州佳都科技软件开发有限公司 , 广州新科佳都科技有限公司
摘要: 本发明实施例公开了一种车站名称识别方法、装置、设备及存储介质,涉及数据处理技术领域,其包括:获取基于用户的语音请求数据得到的字符识别结果以及与所述字符识别结果对应的备选车站名称集合;计算所述备选车站名称集合中每个备选车站名称的匹配评价分数,所述匹配评价分数包括:字符统计分数和/或字符排序分数;根据所述匹配评价分数选择至少一个备选车站名称作为所述语音请求数据的车站名称识别结果。采用上述方案可以解决现有技术中,在文本提取时,无法在降低对数据集的要求时,保证泛化能力的技术问题。
-
公开(公告)号:CN111242040B
公开(公告)日:2022-08-02
申请号:CN202010040705.1
申请日:2020-01-15
申请人: 佳都科技集团股份有限公司 , 广州佳都科技软件开发有限公司 , 广州新科佳都科技有限公司
摘要: 本申请实施例公开了一种动态人脸聚类方法、装置、设备和存储介质。该方法包括对批量人脸图片进行静态聚类处理,得到多个包括邻居人脸集合的簇,根据每个簇中每张人脸图片相对于簇中其他人脸图片的平均相似度,对每个簇中的人脸图片进行筛选,从每个簇中选取多张人脸图片分别建立档案,根据档案的邻居相似度对满足邻居合并条件的簇进行合并,并基于合并后的簇重新建立档案,根据新增人脸图片与每个档案中的人脸图片的平均相似度,确定所述新增人脸图片所对应的档案,将所述新增人脸图片加入所述档案对应的簇中。本方案提高了人脸聚类的效率。
-
公开(公告)号:CN111091196A
公开(公告)日:2020-05-01
申请号:CN201911120492.7
申请日:2019-11-15
申请人: 佳都新太科技股份有限公司 , 广州新科佳都科技有限公司
摘要: 本申请涉及一种客流数据确定方法、装置、计算机设备和存储介质。该方法包括:获取影响客流量预测因素对应的关联数据和预测站点标识,预测因素为时间参数、天气参数、属性参数中的至少一种;将关联数据和预测站点标识输入至已训练好的客流量预测模型中,得到预测站点标识对应的预测客流量;根据预测因素确定关联数据是否符合预设条件,当关联数据符合预设条件时,获取已训练的客流量影响因子;根据预测客流量和客流量影响因子计算得到预测站点标识对应的目标预测客流量。采用本方法能够提高客流量预测准确率。
-
公开(公告)号:CN110428109B
公开(公告)日:2020-11-03
申请号:CN201910728058.0
申请日:2019-08-07
申请人: 佳都新太科技股份有限公司 , 广州新科佳都科技有限公司 , 广东华之源信息工程有限公司
IPC分类号: G06F16/00
摘要: 本发明涉及一种地铁屏蔽门故障间隔时间预测模型建立及预测方法,地铁屏蔽门故障间隔时间预测模型建立,包括以下步骤:步骤1:获取地铁屏蔽门的历史运行数据,对历史运行数据进行预处理;步骤2:对预处理后的历史运行数据建立特征工程,得到特征工程数据;步骤3:对特征工程数据进行WOE和IV计算,得到每一条特征工程数据的IV值;步骤4:筛选出当前站点的当前屏蔽门的若干个IV值作为训练模型的训练数据,将训练数据输入GBDT模型进行训练,得到当前站点的当前屏蔽门的训练模型,得到的训练模型作为预测模型。本发明基于数据驱动对地铁屏蔽门故障进行预测,能够针对性的为每个屏蔽门建立对应的预测模型,预测准确性高,通用性好。
-
公开(公告)号:CN110991607A
公开(公告)日:2020-04-10
申请号:CN201911120453.7
申请日:2019-11-15
申请人: 佳都新太科技股份有限公司 , 广州新科佳都科技有限公司
摘要: 本申请实施例公开了一种地铁客流预测方法,包括:获取乘车数据源;将乘车数据源整合为对应的乘车数据,并根据乘车数据构建时间特征;整合分析以获得若干模型输入量;基于模型输入量构建若干个距离待测时刻不同时刻范围的数据特征集并进行归一化处理,构建每一个时间范围分别对应的RTNN模型,且按照时间范围距离待测时刻由远至近的顺序,将每个RTNN模型中的每一个数据特征依次进行传递。本方案中,基于RTNN网络模型不仅克服了现有技术中只能挖掘一个张量内各元素之间的相互关系或时序关系,而可以刻画多个张量间的时序变化,且结合了时间序列之间的传递性,可以有效避免网络中长时间间隔信息损失的问题。
-
-
-
-
-
-
-
-
-