一种用于识别失序文本的方法与设备

    公开(公告)号:CN102982011B

    公开(公告)日:2017-05-31

    申请号:CN201110264214.6

    申请日:2011-09-07

    Abstract: 本发明的目的是提供一种用于识别失序文本的方法与设备。其中,识别设备获取待识别的目标文本;根据所述目标文本,获得与所述目标文本相对应的统计信息;根据所述统计信息,识别所述目标文本是否为失序文本。与现有技术相比,本发明根据获得的与目标文本相对应的统计信息,识别该目标文本是否为失序文本,进而实现有效的文本内容管理。

    一种检索方法及装置
    12.
    发明公开

    公开(公告)号:CN105243120A

    公开(公告)日:2016-01-13

    申请号:CN201510632775.5

    申请日:2015-09-29

    CPC classification number: G06F16/3329

    Abstract: 本发明公开了一种检索方法及装置。所述检索方法包括:对用户的查询语句进行语义分析;通过检索非结构化数据语料库,获得语义分析结果匹配的语料片段;对匹配的语料片段进行分词和过滤处理,并采用抽取器对过滤后的语料片段进行抽取,以获得所述查询语句的答案。本发明实施例的技术方案,提供了一种兼具高可信度及适应范围宽的检索信息方式。

    基于帖子的出现规律来检测垃圾帖子的方法及设备

    公开(公告)号:CN102315953B

    公开(公告)日:2016-08-03

    申请号:CN201010214189.6

    申请日:2010-06-29

    Abstract: 本发明提供一种用于基于帖子在检测社区网络中出现规律来检测垃圾帖子的方法和设备。该方法包括:a.对帖子进行识别,根据其内容特征及在一个或多个社区网络中的出现规律来判断该帖子是否为垃圾帖子。优选地,步骤a包括:a1.根据预定语义规则对该帖子进行识别,提取其中的内容特征;a2.根据所述帖子的内容特征来查询与该帖子在社区网络中的出现规律;a3.基于第一预定规律根据该帖子在所述社区网络中的出现规律来判断所述帖子是否为垃圾帖子。现有技术通常孤立地对单个帖子的内容进行脏词匹配或者语义分析所造成的无法检测出在社区网络中存在大量重复帖子的情形,与之相比本发明提高了对垃圾帖子的判断准确度。

    知识库数据处理方法及系统

    公开(公告)号:CN104915420A

    公开(公告)日:2015-09-16

    申请号:CN201510315695.7

    申请日:2015-06-10

    Abstract: 本发明公开了一种知识库数据处理方法,所述方法包括:从知识库中提取标记的三元组数据并选取所述三元组数据中的关系信息,根据选取的所述关系信息,训练得到与所述关系信息对应的模板,以所述模板作为输入特征,训练得到机器学习模型,在对所述机器学习模型评估达标后提取所述关系信息;将提取的所述关系信息加入所述知识库中,通过搜索引擎查询请求数据,并对查询到的数据进行模板匹配,再由所述机器学习模型进行预测处理。通过采用本发明,可更加准确高效地对知识库数据进行补充。

    调研环境的搭建方法及装置

    公开(公告)号:CN103309746A

    公开(公告)日:2013-09-18

    申请号:CN201310174314.9

    申请日:2013-05-13

    Abstract: 本发明实施例提供一种调研环境的搭建方法及装置。本发明实施例通过根据待调研的目标程序,确定与所述目标程序相关的至少一个服务模块,进而获得所述至少一个服务模块的配置信息,以及为所述至少一个服务模块分配空闲的处理资源,使得能够根据所述配置信息,在所述处理资源上,配置所述至少一个服务模块,以运行所述目标程序,无需调研人员参与搭建过程,操作简单,且正确率高,从而提高了搭建操作的效率和可靠性。

    知识数据的处理方法和装置

    公开(公告)号:CN105354224B

    公开(公告)日:2019-07-23

    申请号:CN201510640181.9

    申请日:2015-09-30

    Abstract: 本发明实施例公开了一种知识数据的处理方法和装置。所述处理方法包括:获取待检测的知识数据;从所述待检测的知识数据提取主体、谓词和客体的数据,得到相应的第一结构化知识数据;根据预设的知识冲突检测规则,将所述第一结构化知识数据和已有的第二结构化知识数据进行比对,确定所述待检测的知识数据是否与所述已有的知识数据存在信息冲突。采用本发明实施例,便于后续对存在信息冲突的知识数据的正确性做进一步判别,以提高知识库中知识数据的准确率。

    实体标签的抽取方法和装置

    公开(公告)号:CN105224642B

    公开(公告)日:2019-03-12

    申请号:CN201510625039.7

    申请日:2015-09-25

    Abstract: 本发明提出一种实体标签的抽取方法和装置,该实体标签的抽取方法包括:从网页中获取用于描述实体间共性的自然语言片段;获取满足所述自然语言片段的实体;将所述自然语言片段作为多实体标签,建立所述多实体标签与所述实体之间的关联关系。该方法能够提高能够描述的实体关系的覆盖范围,并且可以提高描述方式的自然度。

Patent Agency Ranking