面向开放网络知识库的实体间关系推断方法及系统

    公开(公告)号:CN103824115A

    公开(公告)日:2014-05-28

    申请号:CN201410072412.6

    申请日:2014-02-28

    Abstract: 本发明提供一种面向开放网络知识库的实体间关系推断方法。该方法包括根据目标实体从知识库中找出所有与该目标实体之间有关系路径相连的所有实体作为候选实体集;根据待推断的目标关系从所述知识库中找出的所有存在所述目标关系的实体对;以及综合考虑所找出的各实体对间的关系路径信息以及各实体的属性信息来从所述候选实体集中选出可能与该目标实体存在所述目标关系的候选实体。该方法利用知识库中已有的实体关系和实体的属性自动对实体间的关系进行推理,有效改善了推断效果,实现了对知识库中关系的丰富与完善。

    查询多意图识别方法和系统

    公开(公告)号:CN103235812A

    公开(公告)日:2013-08-07

    申请号:CN201310146037.0

    申请日:2013-04-24

    Abstract: 本发明提供一种查询多意图识别方法和系统,所述方法包括:根据G-PLSI模型计算查询意图概率特征向量,其中,G-PLSI模型用于模拟摘要文本的产生过程、相同查询意图下搜索不同查询时的点击链接行为,以及相同查询意图下在同一session中搜索不同查询的行为,查询意图概率特征向量体现摘要文本信息以及不同查询在相同链接上的点击概率和在同一session中的共现概率。所述方法还包括:计算不同查询的查询意图概率特征向量之间的相似度并且根据该相似度进行查询聚类。本发明使用的查询意图概率特征向量对查询内容和用户点击行为进行结合利用,能够更准确地反映用户搜索意图。

    社交网络中的人物标签推荐方法和系统

    公开(公告)号:CN104077417B

    公开(公告)日:2018-05-22

    申请号:CN201410342939.6

    申请日:2014-07-18

    Abstract: 本发明提供一种社交网络中的人物标签推荐方法和系统,所述方法包括:基于被推荐用户的社交对象发布的文本内容,将社交对象划分为在语义空间上相似的多个类簇;其中,每个社交对象发布的文本内容由该社交对象发布的多个短文本消息组成。所述方法还包括:对于所述多个类簇中的每个类簇,将该类簇中的社交对象所对应的标签进行冗余处理,得到与该类簇对应的标签集合以提供给被推荐用户。本发明解决了现有人物标签推荐技术中,标签推荐质量不高的问题,以及能使标签推荐的结果更具个性化并且更加多样化。

    一种业务流程间交互冲突的半自动修正方法及其系统

    公开(公告)号:CN101894022B

    公开(公告)日:2015-09-16

    申请号:CN201010224004.X

    申请日:2010-07-02

    Abstract: 本发明有关于一种业务流程间交互冲突的半自动修正方法及其系统,其中该方法包括:步骤一,识别存在交互冲突的业务流程模型的独立编辑区域;步骤二,针对每个独立编辑区域计算修正计划及其相应的修改代价;步骤三,计算存在交互冲突的业务流程模型的修正计划及其相应的修改代价。与现有的方法相比,本发明一方面能够提多样的修正计划供业务人员选择,另外一方面避免了修正过程中引入新的交互冲突,同时能够实现即时的交互冲突的修正。

    一种查询纠错方法和系统

    公开(公告)号:CN103198149A

    公开(公告)日:2013-07-10

    申请号:CN201310142075.9

    申请日:2013-04-23

    Abstract: 本发明提供一种查询纠错方法和系统。所述方法包括:将查询语句转换为字符序列,判断字符序列的长度是否大于预定阈值δ;对长度大于δ的字符序列同时进行正向和反向查询纠错处理,直到重合处理的字符个数达到阈值M,得到正向和反向的候选语句项集合。所述方法还包括将正向的候选语句项集合中后M个字符与反向候选语句项集合中前M个字符相同的候选语句项进行拼接,拼接后的候选语句项构成纠错候选项集合。所述方法支持中、英文混杂的查询语句,并且可对长查询采用正反向并行的查询纠错处理,这种并行的处理方式在保证正确率的同时节省了查询纠错的处理时间。

    面向领域的暗网资源采集方法和系统

    公开(公告)号:CN103116635A

    公开(公告)日:2013-05-22

    申请号:CN201310049317.X

    申请日:2013-02-07

    Abstract: 本发明提供了一种面向领域的暗网资源采集方法。该方法从抓取的页面中识别与指定领域相关的页面,获取有效表单集合;对于有效表单集合中的每个表单,判断其表单类型并按照不同的表单类型构造有效查询,所述表单类型为单输入项的表单或多输入项的表单;以及输出有效的查询所返回的结果,作为采集的暗网资源。该方法能够实现暗网资源查询接口的自动识别和分类,同时实现简单查询接口和复杂查询接口的查询的有效构造,从而实现暗网资源的采集。该方法不仅能够无缝的集成到现有的搜索引擎当中,而且能够同时进行简单查询接口和复杂查询接口所指向的暗网资源的采集。

    一种面向在线百科的实体属性抽取方法及系统

    公开(公告)号:CN103853823B

    公开(公告)日:2017-01-18

    申请号:CN201410065743.7

    申请日:2014-02-26

    Abstract: 本发明提供一种面向在线百科的实体属性抽取方法及系统,该方法包括:在待抽取的在线百科网页文本集合T中选择一个页面,抽取该页面的实体属性表达规则,得到当前规则集合。该方法还包括使用当前规则集合对所述待抽取的在线百科网页文本集合T进行实体属性抽取,并且根据抽取得到的实体属性抽取T的实体属性表达规则,用抽取得到的规则集合作为当前规则集合并重复这一过程k次,得到最终规则集合。使用所述最终规则集合对T进行实体属性抽取。本发明提供的实体属性抽取方法能够适应文本结构的变化,适用于各种在线百科,具有召回率高并且准确率高的效果。

Patent Agency Ranking