更新数据库中非永久性的关系数据的方法及系统

    公开(公告)号:CN105069045B

    公开(公告)日:2018-07-31

    申请号:CN201510437705.4

    申请日:2015-07-23

    Abstract: 本发明提供种更新数据库中非永久性的关系数据的方法及系统,所述方法包括:抓取网络中到当前时间点为止的预定时间段内增加或者更新的网页;从抓取到的网页中提取关系类型属于待更新的数据库的非永久性关系集合的关系三元组数据;根据提取出的关系三元组数据更新数据库中非永久性的关系数据。采用本发明提供的技术方案,可以实时地根据网络中到当前时间点为止的预定时间段内增加或者更新的网页,对数据库中非永久性的关系数据进行更新,从而保证数据库中非永久性的关系数据的准确性和时效性。

    一种基于功能区域识别的网页切分方法及装置

    公开(公告)号:CN103440239B

    公开(公告)日:2016-08-10

    申请号:CN201310176551.9

    申请日:2013-05-14

    Abstract: 公开了一种基于功能区域识别的网页切分方法及装置。所述方法包括:针对网页生成文档对象模型(DOM)树,DOM树包括用于网页展示的内容;提取DOM树节点的位置信息和大小信息;解析出层叠样式表(CSS)属性中的边界边缘属性和栏外空白区属性;利用网页分块标注算法对网页进行标注,以标注出功能和语义区,并将标注的块标记为粒度候选;根据DOM树结构在剩余网页中扫描图文混排块,将扫描出的图文混排块标记为粒度候选;扫描剩余的块,如果扫描出的块的边界边缘属性和栏外空白区属性不为0,则将所述块标记为粒度候选;将DOM树中剩余没有标记的块标记为粒度候选。

    一种获取网页分块的标注规则的方法及装置

    公开(公告)号:CN103942224B

    公开(公告)日:2018-12-14

    申请号:CN201310024439.3

    申请日:2013-01-23

    Abstract: 本发明提供了一种获取网页分块的标注规则的方法及装置,其中所述方法包括:A.获取一个以上的网页集合中节点的多页面信息,其中一个节点的多页面信息用于描述该节点在所属网页集合中的分布状况;B.从所述一个以上的网页集合中获取分块样本集;C.利用预设的种子标注规则对所述分块样本集进行标注,以得到训练样本集;D.确定所述训练样本集的分类特征,其中一个训练样本的分类特征至少包括由该训练样本所包含节点的多页面信息构成的多页面特征;E.根据确定的分类特征,对所述训练样本集进行机器学习,以得到机器标注规则。通过上述方式,本发明能够提高对网页分块进行标注的准确性。

    搜索结果的提供方法和装置

    公开(公告)号:CN103927380A

    公开(公告)日:2014-07-16

    申请号:CN201410175750.2

    申请日:2014-04-28

    CPC classification number: G06F17/30864 G06F17/30902

    Abstract: 本发明提出一种搜索结果的提供方法和装置。该方法包括:接收用户输入的搜索词,并根据搜索词获得搜索结果;对搜索词进行分析以确定搜索词对应的图片展现需求信息;根据图片展现需求信息在预先建立的图片数据库中查询搜索结果对应的网页是否存在代表图片,代表图片是根据对应网页的站长发布的数据所提取的;向用户展现搜索结果,其中,当搜索结果对应的网页存在代表图片时,向用户展现所述代表图片。本发明实施例的方法,向用户展现的代表图片最新、更有权威性;另外,由于站长发布的数据的规范性,在获取代表图片时更加简捷、快速、准确、维护成本低,不容易失效,而且适合任何网页。

    兴趣点代表图片的挖掘方法、装置和服务器

    公开(公告)号:CN103399885A

    公开(公告)日:2013-11-20

    申请号:CN201310306642.X

    申请日:2013-07-19

    Abstract: 本发明公开了一种兴趣点代表图片的挖掘方法、装置和服务器。所述兴趣点代表图片的挖掘方法包括:根据兴趣点的名称和地址从互联网上获取所述兴趣点对应的实体站点;根据所述实体站点的首页上的锚文本查找所述实体站点的至少一个代表页面,其中,所述代表页面包括所述实体站点的介绍信息;读取所述代表页面,获取代表图片集合;以及获取所述代表图片集合中最为符合预定特征的至少一张图片作为所述兴趣点的代表图片。所述兴趣点代表图片的挖掘方法和装置能够自动的从兴趣点对应的实体站点上挖掘代表图片,并且获取的代表图片清晰度更高,更加符合用户直观了解兴趣点的需求。

    基于关联兴趣点的语句推荐方法和装置

    公开(公告)号:CN109977215B

    公开(公告)日:2021-06-18

    申请号:CN201910252164.6

    申请日:2019-03-29

    Abstract: 本发明提出一种基于关联兴趣点的语句推荐方法和装置,其中,方法包括:通过获取用户输入语句;提取输入语句中的关键字,并在预设兴趣点关联网络中查找与关键词匹配的当前兴趣点;根据预设兴趣点关联网络确定与当前兴趣点匹配的多个相关兴趣点,并按照预设的筛选策略对多个相关兴趣点进行筛选出扩展兴趣点;根据当前兴趣点和扩展兴趣点在预设的语料库中检索出第一回复语句和第二回复语句提供给用户。由此,通过不同兴趣点之间的关联来引导到扩展兴趣点,然后将包含该扩展兴趣点的回复句提供给用户,然后基于用户反馈扩展用户兴趣点集合,可以更高效地拓展用户兴趣画像,提升人机对话中话题的多样性,提升用户体验。

    更新数据库中非永久性的关系数据的方法及系统

    公开(公告)号:CN105069045A

    公开(公告)日:2015-11-18

    申请号:CN201510437705.4

    申请日:2015-07-23

    CPC classification number: G06F17/30377

    Abstract: 本发明提供一种更新数据库中非永久性的关系数据的方法及系统,所述方法包括:抓取网络中到当前时间点为止的预定时间段内增加或者更新的网页;从抓取到的网页中提取关系类型属于待更新的数据库的非永久性关系集合的关系三元组数据;根据提取出的关系三元组数据更新数据库中非永久性的关系数据。采用本发明提供的技术方案,可以实时地根据网络中到当前时间点为止的预定时间段内增加或者更新的网页,对数据库中非永久性的关系数据进行更新,从而保证数据库中非永久性的关系数据的准确性和时效性。

    一种搜索结果展示方法及装置

    公开(公告)号:CN104598617A

    公开(公告)日:2015-05-06

    申请号:CN201510051383.X

    申请日:2015-01-30

    CPC classification number: G06F16/951 G06F16/3338

    Abstract: 本发明实施例公开了一种搜索结果展示方法及装置,所述方法包括:接收客户端发送的用户输入的查询语句;提取所述查询语句中包含的实体作为第一实体;获取与第一实体关联的第二实体;从预先挖掘得到的实体相关事件数据中查询与第一实体和第二实体相关的事件数据,将所述事件数据和所述查询语句对应的搜索结果发送给客户端,以使客户端将所述事件数据在所述搜索结果的展示页面中进行展现,丰富了搜索结果相关信息,引导用户产生更多的搜索操作。

    一种确定网页图片相关度及显示检索结果的方法及装置

    公开(公告)号:CN104063489A

    公开(公告)日:2014-09-24

    申请号:CN201410317567.1

    申请日:2014-07-04

    CPC classification number: G06F16/951 G06F16/532

    Abstract: 本发明实施例公开了一种确定网页图片相关度及显示检索结果的方法及装置,所述确定网页图片相关度的方法包括:获取目标网页中的图片;根据图片在目标网页中的位置、图片的周边信息和图片与目标网页主题的相关度中的至少一项,确定图片与目标网页的相关度;根据图片与目标网页之间的相关度,建立网页图片信息索引库。通过本发明公开的一种确定网页图片相关度及显示检索结果的方法及装置,可以确定图片与所述目标网页之间的相关度,建立网页图片信息索引库,并且在检索结果中显示网页主图,使得用户通过网页主图直观的获得页面主题,判断该页面是否是正确的检索结果,提高了用户检索的效率。

    对话生成方法、装置、电子设备及存储介质

    公开(公告)号:CN111177339B

    公开(公告)日:2023-07-25

    申请号:CN201911242509.6

    申请日:2019-12-06

    Abstract: 本申请公开了对话生成方法、装置、电子设备及存储介质,涉及人工智能领域,其中方法可包括:在对话过程中,获取待回复的对话语句,对所述对话语句进行关键词提取;确定出提取出的关键词对应的闲聊图谱中的节点,闲聊图谱为预先构建的,其中包含有分别对应于不同关键词的节点,节点之间的边体现不同关键词之间的对话跳转方式;将闲聊图谱中与确定出的节点存在直接边关系的节点对应的关键词作为候选关键词;从候选关键词中选出最佳关键词;根据最佳关键词生成回复语句。应用本申请所述方案,可生成主题、语义等连贯和准确的对话语句等。

Patent Agency Ranking