-
公开(公告)号:CN108376177B
公开(公告)日:2019-10-25
申请号:CN201810213755.8
申请日:2018-03-15
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/583 , G06F16/51
Abstract: 本申请实施例公开了用于处理信息的方法和分布式系统。包括:主控节点和多个数据处理节点。该系统的一具体实施方式包括:该主控节点,用于将检索请求发送给该多个数据处理节点;每个数据处理节点,用于获取图片信息,构建利用所获取的图片信息中的聚类中心的标识来指示图片标识和图片特征的索引;获取目标图片集中的图片的图片信息,确定在该目标图片集中的图片所对应的聚类中心的标识与该索引中的聚类中心的标识中,是否存在相同的聚类中心的标识;响应于确定存在,检索与该目标图片集中的图片的图片特征相匹配的图片特征,确定相匹配的图片特征所对应的图片标识。本申请实施例通过分布式系统进行图片的检索,能够提高检索效率。
-
公开(公告)号:CN102314411B
公开(公告)日:2015-02-18
申请号:CN201010222379.2
申请日:2010-06-30
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明公开了一种处理词条编创冲突的方法与系统。其中,该方法包括在提交词条版本时,判断词条数据库中是否存在与词条版本的基线版本相同的已通过审核版本;如果存在,则拒绝用户提交创建或编辑的词条版本,并为用户提供退出编辑或通过版本继承的方式进行后续编辑的选择,否则,判断词条数据库中是否存在与词条版本的基线版本相同的待审核版本;如果存在,则为用户提供继续编辑、延后提交或立即提交的选择,如果用户选择立即提交,则判定用户提交的词条版本与词条版本的基线版本相同的待审核版本相应地存在创建冲突或编辑冲突,并按照审核优先级处理创建冲突或编辑冲突。本发明的方法与系统能够有效改善由“先审核后发布”机制所造成的编创冲突。
-
公开(公告)号:CN102314453A
公开(公告)日:2012-01-11
申请号:CN201010222129.9
申请日:2010-06-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明公开一种高质量版本的筛选方法及系统,该方法包括:读取用户创建的百科版本数据,并对百科版本数据进行解析;对解析后得到的信息进行统计分析;根据统计分析的结果,过滤百科版本数据,并对符合预定标准的百科版本执行简单编辑版本进程或复杂编辑版本进程。发明能够在降低人工筛选投入的前提下,有效提高对复杂编辑的百科版本数据的筛选效率。进一步地,对进入简单编辑版本进程或复杂编辑版本进程的百科版本执行连续版本过滤进程,从而更加准确地从海量百科数据中筛选出待审核的高质量百科版本。通过快速准确筛选出高质量版本和非高质量版本,有针对性地引导用户持续完善词条信息,同时还有利于完善对百科用户的分级管理。
-
公开(公告)号:CN102314411A
公开(公告)日:2012-01-11
申请号:CN201010222379.2
申请日:2010-06-30
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明公开了一种处理词条编创冲突的方法与系统。其中,该方法包括在提交词条版本时,判断词条数据库中是否存在与词条版本的基线版本相同的已通过审核版本;如果存在,则拒绝用户提交创建或编辑的词条版本,并为用户提供退出编辑或通过版本继承的方式进行后续编辑的选择,否则,判断词条数据库中是否存在与词条版本的基线版本相同的待审核版本;如果存在,则为用户提供继续编辑、延后提交或立即提交的选择,如果用户选择立即提交,则判定用户提交的词条版本与词条版本的基线版本相同的待审核版本相应地存在创建冲突或编辑冲突,并按照审核优先级处理创建冲突或编辑冲突。本发明的方法与系统能够有效改善由“先审核后发布”机制所造成的编创冲突。
-
公开(公告)号:CN106778812B
公开(公告)日:2020-06-19
申请号:CN201611040671.6
申请日:2016-11-10
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06K9/62
Abstract: 本发明实施例公开了一种聚类实现方法和装置,涉及数据处理技术领域。所述方法包括:对待聚类数据集的聚类中心进行初始化;根据聚类中心,计算与待聚类数据集中的各数据点分别对应的最近聚类中心,其中,在计算所述最近聚类中心过程中消除了数据点自身平方计算带来的冗余;根据待聚类数据集中的各数据点的所述聚类中心的计算结果,更新聚类中心;返回执行根据聚类中心,计算与待聚类数据集中的各数据点分别对应的最近聚类中心的操作,直至满足聚类迭代结束条件。本发明实施例的技术方案,优化了现有的K‑means聚类算法,降低了K‑means聚类算法的计算复杂度。
-
公开(公告)号:CN102314453B
公开(公告)日:2015-11-25
申请号:CN201010222129.9
申请日:2010-06-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明公开一种高质量版本的筛选方法及系统,该方法包括:读取用户创建的百科版本数据,并对百科版本数据进行解析;对解析后得到的信息进行统计分析;根据统计分析的结果,过滤百科版本数据,并对符合预定标准的百科版本执行简单编辑版本进程或复杂编辑版本进程。发明能够在降低人工筛选投入的前提下,有效提高对复杂编辑的百科版本数据的筛选效率。进一步地,对进入简单编辑版本进程或复杂编辑版本进程的百科版本执行连续版本过滤进程,从而更加准确地从海量百科数据中筛选出待审核的高质量百科版本。通过快速准确筛选出高质量版本和非高质量版本,有针对性地引导用户持续完善词条信息,同时还有利于完善对百科用户的分级管理。
-
公开(公告)号:CN108376177A
公开(公告)日:2018-08-07
申请号:CN201810213755.8
申请日:2018-03-15
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本申请实施例公开了用于处理信息的方法和分布式系统。包括:主控节点和多个数据处理节点。该系统的一具体实施方式包括:该主控节点,用于将检索请求发送给该多个数据处理节点;每个数据处理节点,用于获取图片信息,构建利用所获取的图片信息中的聚类中心的标识来指示图片标识和图片特征的索引;获取目标图片集中的图片的图片信息,确定在该目标图片集中的图片所对应的聚类中心的标识与该索引中的聚类中心的标识中,是否存在相同的聚类中心的标识;响应于确定存在,检索与该目标图片集中的图片的图片特征相匹配的图片特征,确定相匹配的图片特征所对应的图片标识。本申请实施例通过分布式系统进行图片的检索,能够提高检索效率。
-
公开(公告)号:CN106778812A
公开(公告)日:2017-05-31
申请号:CN201611040671.6
申请日:2016-11-10
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06K9/62
CPC classification number: G06K9/6223
Abstract: 本发明实施例公开了一种聚类实现方法和装置,涉及数据处理技术领域。所述方法包括:对待聚类数据集的聚类中心进行初始化;根据聚类中心,计算与待聚类数据集中的各数据点分别对应的最近聚类中心,其中,在计算所述最近聚类中心过程中消除了数据点自身平方计算带来的冗余;根据待聚类数据集中的各数据点的所述聚类中心的计算结果,更新聚类中心;返回执行根据聚类中心,计算与待聚类数据集中的各数据点分别对应的最近聚类中心的操作,直至满足聚类迭代结束条件。本发明实施例的技术方案,优化了现有的K‑means聚类算法,降低了K‑means聚类算法的计算复杂度。
-
-
-
-
-
-
-