-
公开(公告)号:CN1253815C
公开(公告)日:2006-04-26
申请号:CN00124352.7
申请日:2000-09-08
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 一种提高计算机在进行中文数据识别时相关度的方法,由计算机的识别模块对输入模块输入的中文信息进行处理并查找出姓氏关键字;并由中央处理器对查找出的姓氏关键字进行判断,判断该姓氏关键字是否为存储模块中的关键字,如不属于计算机存储模块中的纯姓氏存储模块,中央处理器再对其进行判断,最终提高中文数据识别相关度。本发明能够有效地从被识别对象中快捷识别中文姓名,获得较高地识别准确性,而且能够通过相关度的调整、排序,获得更准确的高质量识别结果。
-
公开(公告)号:CN1342942A
公开(公告)日:2002-04-03
申请号:CN00124352.7
申请日:2000-09-08
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 一种中文姓名的计算机识别及检索方法,包括用于计算机检索的数据源,该方法的步骤包括从所述的数据源中随机选取学习数据源,根据姓名识别规则库的内容对分析的数据源进行姓名识别,再创建索引,提供检索结果。姓名识别规则库包括姓氏配置文件、电子版高频词词典和姓氏前、后的高频单字文件。本发明能够有效地从被检索对象中快捷地识别中文姓名,获得较高的识别准确性,而且能够通过相关度的调整、排序,获得更准确的高质量检索结果。
-
公开(公告)号:CN1435782A
公开(公告)日:2003-08-13
申请号:CN02100552.4
申请日:2002-01-31
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/40
Abstract: 本发明为一种使用快照的方式实现对网上信息进行纪录和分析的方法。本方法是通过对互联网上一个特定信息的多次进行快照的方式,将信息当时的状态进行保留。并通过对一系列快照信息的分析,得到有效数据。本发明不仅能够有效的对网上信息进行纪录,分析,得到该信息的变动情况,而且在必要的时候还可以通过保存下来的快照对分析结果加以佐证。
-
-
公开(公告)号:CN1462003A
公开(公告)日:2003-12-17
申请号:CN02117998.0
申请日:2002-05-28
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明是一种利用搜索引擎发布信息并按竞价排名的方法,通过信息发布者输入信息、设定搜索关键字和每次点击金额,然后由计算机程序将信息发布在指定关键字的搜索结果内,按照设定的每次点击付费金额进行排序,再由页面生成系统根据预先设置的网页格式模版,将搜索结果核心内容按照排序系统所给出的顺序整合起来,生成最终结果页面。通过此方法,信息的发布者能够在大范围内将信息展现在需要这些信息的浏览者眼前,而浏览者则可以简单地通过搜索引擎,以“关键字搜索”的方式找到所需的信息。
-
公开(公告)号:CN1435775A
公开(公告)日:2003-08-13
申请号:CN02100550.8
申请日:2002-01-31
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明为一种互联网上镜像和准镜像网站的识别方法。该方法是通过对已知的大量网站首页进行相似度判定,选取候选镜像网站组;再通过对候选镜像网站组中的网站上内容进行抽样比较统计,通过设定相似度阈值的方法获得镜像和准镜像网站。该方法对于需要大量采集互联网上信息的系统(如搜索引擎)具有十分重要的意义,可以避免这类系统对雷同信息的重复获取,节省网络资源和本地资源,提高系统服务的质量和效率。
-
公开(公告)号:CN1209726C
公开(公告)日:2005-07-06
申请号:CN02100550.8
申请日:2002-01-31
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明为一种互联网上镜像和准镜像网站的识别方法。该方法是通过对已知的大量网站首页进行相似度判定,选取候选镜像网站组;再通过对候选镜像网站组中的网站上内容进行抽样比较统计,通过设定相似度阈值的方法获得镜像和准镜像网站。该方法对于需要大量采集互联网上信息的系统(如搜索引擎)具有十分重要的意义,可以避免这类系统对雷同信息的重复获取,节省网络资源和本地资源,提高系统服务的质量和效率。
-
-
-
-
-
-