-
公开(公告)号:CN102982011B
公开(公告)日:2017-05-31
申请号:CN201110264214.6
申请日:2011-09-07
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明的目的是提供一种用于识别失序文本的方法与设备。其中,识别设备获取待识别的目标文本;根据所述目标文本,获得与所述目标文本相对应的统计信息;根据所述统计信息,识别所述目标文本是否为失序文本。与现有技术相比,本发明根据获得的与目标文本相对应的统计信息,识别该目标文本是否为失序文本,进而实现有效的文本内容管理。
-
公开(公告)号:CN105243120A
公开(公告)日:2016-01-13
申请号:CN201510632775.5
申请日:2015-09-29
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
CPC classification number: G06F16/3329
Abstract: 本发明公开了一种检索方法及装置。所述检索方法包括:对用户的查询语句进行语义分析;通过检索非结构化数据语料库,获得语义分析结果匹配的语料片段;对匹配的语料片段进行分词和过滤处理,并采用抽取器对过滤后的语料片段进行抽取,以获得所述查询语句的答案。本发明实施例的技术方案,提供了一种兼具高可信度及适应范围宽的检索信息方式。
-
公开(公告)号:CN105224642A
公开(公告)日:2016-01-06
申请号:CN201510625039.7
申请日:2015-09-25
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G06F17/30864 , G06F17/275
Abstract: 本发明提出一种实体标签的抽取方法和装置,该实体标签的抽取方法包括:从网页中获取用于描述实体间共性的自然语言片段;获取满足所述自然语言片段的实体;将所述自然语言片段作为多实体标签,建立所述多实体标签与所述实体之间的关联关系。该方法能够提高能够描述的实体关系的覆盖范围,并且可以提高描述方式的自然度。
-
公开(公告)号:CN102982041A
公开(公告)日:2013-03-20
申请号:CN201110262702.3
申请日:2011-09-06
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明的目的是提供一种用于检测互动平台中爆发信息的方法与设备,其中,检测设备通过获取互动平台中多个发布信息以确定爆发模式,进而根据所述爆发模式,从所述多个发布信息中确定爆发信息。与现有技术相比,本发明可以及时准确地检测互动平台中是否产生爆发现象,使得对爆发信息进行有效处理成为可能,从而达到用户能够有效获取互动平台的信息和进行互动沟通的目的。
-
公开(公告)号:CN102315953B
公开(公告)日:2016-08-03
申请号:CN201010214189.6
申请日:2010-06-29
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提供一种用于基于帖子在检测社区网络中出现规律来检测垃圾帖子的方法和设备。该方法包括:a.对帖子进行识别,根据其内容特征及在一个或多个社区网络中的出现规律来判断该帖子是否为垃圾帖子。优选地,步骤a包括:a1.根据预定语义规则对该帖子进行识别,提取其中的内容特征;a2.根据所述帖子的内容特征来查询与该帖子在社区网络中的出现规律;a3.基于第一预定规律根据该帖子在所述社区网络中的出现规律来判断所述帖子是否为垃圾帖子。现有技术通常孤立地对单个帖子的内容进行脏词匹配或者语义分析所造成的无法检测出在社区网络中存在大量重复帖子的情形,与之相比本发明提高了对垃圾帖子的判断准确度。
-
公开(公告)号:CN104915420A
公开(公告)日:2015-09-16
申请号:CN201510315695.7
申请日:2015-06-10
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种知识库数据处理方法,所述方法包括:从知识库中提取标记的三元组数据并选取所述三元组数据中的关系信息,根据选取的所述关系信息,训练得到与所述关系信息对应的模板,以所述模板作为输入特征,训练得到机器学习模型,在对所述机器学习模型评估达标后提取所述关系信息;将提取的所述关系信息加入所述知识库中,通过搜索引擎查询请求数据,并对查询到的数据进行模板匹配,再由所述机器学习模型进行预测处理。通过采用本发明,可更加准确高效地对知识库数据进行补充。
-
公开(公告)号:CN103309746A
公开(公告)日:2013-09-18
申请号:CN201310174314.9
申请日:2013-05-13
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F9/50
Abstract: 本发明实施例提供一种调研环境的搭建方法及装置。本发明实施例通过根据待调研的目标程序,确定与所述目标程序相关的至少一个服务模块,进而获得所述至少一个服务模块的配置信息,以及为所述至少一个服务模块分配空闲的处理资源,使得能够根据所述配置信息,在所述处理资源上,配置所述至少一个服务模块,以运行所述目标程序,无需调研人员参与搭建过程,操作简单,且正确率高,从而提高了搭建操作的效率和可靠性。
-
公开(公告)号:CN102315978A
公开(公告)日:2012-01-11
申请号:CN201010214176.9
申请日:2010-06-29
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04L12/26
Abstract: 本发明的目的是提供一种检测开放式互动平台中子集的异常状态的方法与设备。其中,子集异常状态检测设备自动获取与开放式互动平台中子集相关的信息发布行为,识别其中的异常信息发布行为,并根据所述异常信息发布行为,检测所述开放式互动平台中子集的异常状态。本发明通过对开放式互动平台的有效检测和处理,可以更好地服务于人们获取开放式互动平台的信息和有效互动沟通的需求。
-
公开(公告)号:CN105354224B
公开(公告)日:2019-07-23
申请号:CN201510640181.9
申请日:2015-09-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/2455 , G06N5/02
Abstract: 本发明实施例公开了一种知识数据的处理方法和装置。所述处理方法包括:获取待检测的知识数据;从所述待检测的知识数据提取主体、谓词和客体的数据,得到相应的第一结构化知识数据;根据预设的知识冲突检测规则,将所述第一结构化知识数据和已有的第二结构化知识数据进行比对,确定所述待检测的知识数据是否与所述已有的知识数据存在信息冲突。采用本发明实施例,便于后续对存在信息冲突的知识数据的正确性做进一步判别,以提高知识库中知识数据的准确率。
-
公开(公告)号:CN105224642B
公开(公告)日:2019-03-12
申请号:CN201510625039.7
申请日:2015-09-25
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/951 , G06F17/27
Abstract: 本发明提出一种实体标签的抽取方法和装置,该实体标签的抽取方法包括:从网页中获取用于描述实体间共性的自然语言片段;获取满足所述自然语言片段的实体;将所述自然语言片段作为多实体标签,建立所述多实体标签与所述实体之间的关联关系。该方法能够提高能够描述的实体关系的覆盖范围,并且可以提高描述方式的自然度。
-
-
-
-
-
-
-
-
-