-
公开(公告)号:CN111105627B
公开(公告)日:2021-12-07
申请号:CN201811252861.3
申请日:2018-10-25
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请涉及一种路段平均速度的确定方法、装置、系统、计算机可读存储介质和计算机设备。所述方法包括:获取目标时间间隔内从分布式消息系统得到的车辆定位信息;其中,各所述车辆定位信息包括车辆位置点和车辆速度;基于流处理框架,从预定道路路段中分别确定各所述车辆位置点所属的道路路段;基于属于所述预定道路路段的车辆位置点所对应的车辆速度,得到所述预定道路路段在所述目标时间间隔内的路段平均速度。本申请提供的方案能够提高系统的可用性。
-
公开(公告)号:CN106547852B
公开(公告)日:2021-03-12
申请号:CN201610911559.9
申请日:2016-10-19
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/21
Abstract: 本发明提出一种异常数据检测方法及装置、数据预处理方法及系统,其异常数据检测方法,包括以下步骤:将待检测数据集利用主成分算法进行降维处理,形成第一数据集;将所述第一数据集利用主成分算法进行重构,形成第二数据集,所述第二数据集与所述待检测数据集具有相同的维度;计算所述待检测数据集与所述第二数据集对应数据之间的相关性;获取所述待检测数据中与所述第二数据集中对应数据差异大的异常数据。本发明不用假设要分析的数据集合服从某种特定的分布,具有很强的可靠性、通用性和稳定性。
-
公开(公告)号:CN106650780B
公开(公告)日:2021-02-12
申请号:CN201610912823.0
申请日:2016-10-18
Applicant: 腾讯科技(深圳)有限公司
IPC: G06K9/62
Abstract: 本发明提出一种数据处理方法及装置、分类器训练方法及系统,其数据处理方法包括:从无标签数据中提取多组数据组,其中每组数据组均包含预设数量的数据样本;为每一组数据组的数据样本设置标签,构成每一组数据组中包含所有标签组合的多个样本集,其中一个样本集中包含一种标签组合的数据样本;分别利用有标签数据和每一组数据组中的每一个样本集训练所述分类器;获取每一组数据组中最高性能分类器对应的样本集,并构成候选训练集;将所述候选训练集中预设数量的数据加入到有标签数据中。通过本发明的数据处理,可以有效提升分类器的性能,使得分类器有更好的泛化能力。
-
公开(公告)号:CN108875451A
公开(公告)日:2018-11-23
申请号:CN201710325609.X
申请日:2017-05-10
Applicant: 腾讯科技(深圳)有限公司
CPC classification number: G06K9/00463 , G06K9/2054 , G06K9/4671
Abstract: 一种定位图像的方法、装置、存储介质和程序产品,所述方法包括:从获取的图片中确定与图像模版匹配的至少一个匹配区域;根据所述至少一个匹配区域确定目标区域;根据特征匹配算法在所述目标区域中提取第一特征信息;根据预设的识别条件和所述第一特征信息在所述目标区域内的分布特征,确定所述目标区域中的至少一个有效区域;根据所述至少一个有效区域内的特征信息的分布特征确定出结果图像。通过采用本方案,能够有效的提高识别特定类型的图片的效率,也能提高识别出的特定类型的图片的准确性。
-
公开(公告)号:CN108304838A
公开(公告)日:2018-07-20
申请号:CN201710331435.8
申请日:2017-05-11
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本发明实施例公开了一种图片信息识别方法,该方法包括:采集待识别的身份图片信息;从身份图片信息中提取出图片特征信息;将图片特征信息、第一身份模板的特征信息和第二身份模板的特征信息分别进行相关性计算,得到第一相关度和第二相关度;根据预设有效相关度策略,对第一相关度和第二相关度进行有效相关度的判定,得到第一有效相关度结果和第二有效相关度结果;从第一有效相关度结果和第二有效相关度结果中,选择出最高的有效相关度结果,将与最高的有效相关度结果对应的身份模板作为身份图片信息的身份识别结果。本发明实施例还同时公开了一种终端。
-
公开(公告)号:CN102880615B
公开(公告)日:2018-04-27
申请号:CN201110198294.X
申请日:2011-07-15
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F17/30
Abstract: 本发明实施例公开了一种数据存储方法和装置,该方法包括:获得需要存储的数据和所述数据的逻辑存储信息;根据所述逻辑存储信息将所述数据以段为单位存储在数据文件中,并在所述数据文件中形成数据段和数据段索引,所述数据段索引用于在所述数据文件中定位数据所在的数据段,以便分布式集群并行处理所述数据文件的数据段。采用本发明,可提高分布式集群中的数据处理效率。
-
公开(公告)号:CN106650780A
公开(公告)日:2017-05-10
申请号:CN201610912823.0
申请日:2016-10-18
Applicant: 腾讯科技(深圳)有限公司
IPC: G06K9/62
Abstract: 本发明提出一种数据处理方法及装置、分类器训练方法及系统,其数据处理方法包括:从无标签数据中提取多组数据组,其中每组数据组均包含预设数量的数据样本;为每一组数据组的数据样本设置标签,构成每一组数据组中包含所有标签组合的多个样本集,其中一个样本集中包含一种标签组合的数据样本;分别利用有标签数据和每一组数据组中的每一个样本集训练所述分类器;获取每一组数据组中最高性能分类器对应的样本集,并构成候选训练集;将所述候选训练集中预设数量的数据加入到有标签数据中。通过本发明的数据处理,可以有效提升分类器的性能,使得分类器有更好的泛化能力。
-
公开(公告)号:CN106547852A
公开(公告)日:2017-03-29
申请号:CN201610911559.9
申请日:2016-10-19
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F17/30
Abstract: 本发明提出一种异常数据检测方法及装置、数据预处理方法及系统,其异常数据检测方法,包括以下步骤:将待检测数据集利用主成分算法进行降维处理,形成第一数据集;将所述第一数据集利用主成分算法进行重构,形成第二数据集,所述第二数据集与所述待检测数据集具有相同的维度;计算所述待检测数据集与所述第二数据集对应数据之间的相关性;获取所述待检测数据中与所述第二数据集中对应数据差异大的异常数据。本发明不用假设要分析的数据集合服从某种特定的分布,具有很强的可靠性、通用性和稳定性。
-
公开(公告)号:CN102385606B
公开(公告)日:2016-08-03
申请号:CN201010274687.X
申请日:2010-09-03
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F17/30
Abstract: 本发明提供了一种分布式数据仓库的访问方法和装置:将接收到的每个文本格式的文件转换为结构化格式,并进行存储;每个结构化格式的文件中包括一个文件头(Head)、一个以上数据段(Segment)以及一个一级块索引表,一级块索引表中保存有每个Segment对应的一级块索引项,每个一级块索引项中保存有其对应的Segment的索引信息;每个Segment中包括一个以上单元(Unit)和一个二级块索引表,二级块索引表中保存有每个Unit对应的二级块索引项,每个二级块索引项中保存有其对应的Unit的索引信息;每个Unit中包括一个以上的数据块(Chunk),每个Chunk对应一个记录;根据索引信息对分布式数据仓库进行访问。应用本发明所述方案,能够方便用户使用,且能够节省存储空间和提高数据的安全性。
-
公开(公告)号:CN104113567A
公开(公告)日:2014-10-22
申请号:CN201310135874.3
申请日:2013-04-18
Applicant: 腾讯科技(深圳)有限公司
Inventor: 赵伟
IPC: H04L29/08
Abstract: 本发明实施例公开了一种内容分发网络的数据处理方法、装置及系统,涉及互联网技术领域,解决了现有技术中的内容分发网络的带宽存在很大的浪费,内容分发网络的带宽利用率较低的问题。所述方法包括:获取数据文件的版本信息;根据所述数据文件的版本信息判断所述数据文件是否有内容更新;若所述数据文件有内容更新,从内容分发网络服务器上获取所述版本信息所对应的数据文件。本发明适用于内容分发网络中。
-
-
-
-
-
-
-
-
-