-
公开(公告)号:CN117668270A
公开(公告)日:2024-03-08
申请号:CN202211015767.2
申请日:2022-08-23
申请人: 北京奇虎科技有限公司
IPC分类号: G06F16/53 , G06F16/51 , G06F16/583 , G06F16/55
摘要: 本申请实施例公开了一种图片检索方法、装置、存储介质以及电子设备,涉及图片处理技术领域。预先根据特征点码表对各样本图片中的样本图片特征点进行量化编码,以及根据各样本图片特征点的样本量化值构建相同图索引,那么在提取目标图片的目标图片特征点之后,同样可以根据特征点码表对各目标图片特征点进行量化编码得到目标量化值,进而在相同图索引中查找目标量化值对应的样本图片,也即得到了目标图片对应的检索结果,由于量化编码的计算量要远小于直接比较样本图片和目标图片中的特征点的计算量,因此可以减少检索相似图片时的计算量,有效提高检索相似图片时的检索速度。
-
公开(公告)号:CN116319406A
公开(公告)日:2023-06-23
申请号:CN202111584730.7
申请日:2021-12-21
申请人: 北京奇虎科技有限公司
IPC分类号: H04L43/08 , H04L67/02 , G06F16/951 , G06F16/958
摘要: 本发明属于计算机技术领域,公开了一种网页死链确定方法、装置、设备及存储介质。本发明通过获取待分析链接对应的网页站点及链接存活时长;根据网页站点及链接存活时长对待分析链接进行风险分析,确定待分析链接是否是高风险链接;若待分析链接是高风险链接,则获取待分析链接对应的网页内容;根据网页内容确定待分析链接是否为网页死链。由于只会在待分析链接被判定为高风险链接时才会获取对应的网页内容,并根据获取到的网页内容判定待分析链接是否为网页死链,可以节省对低风险的网页链接的检测,合理利用网页爬取工具的资源,从而提高发现网页死链的能力。
-
公开(公告)号:CN108399265A
公开(公告)日:2018-08-14
申请号:CN201810246407.0
申请日:2018-03-23
申请人: 北京奇虎科技有限公司
摘要: 本发明提供了一种基于搜索的实时热点新闻提供方法及装置。该方法包括:获取具有实时热点属性的新闻的原始标题,对新闻的原始标题进行词法句法分析,得到分析结果;基于所述分析结果,提取新闻的原始标题中的句子主干内容,并将提取的句子主干内容作为新闻候选标题;利用新闻标题的摘要质量评估策略,对所述新闻候选标题的质量进行评估,进而根据评估结果确定新闻摘要标题;在搜索页面提供所述新闻摘要标题。本发明实施例在搜索页面提供新闻摘要标题,提升用户使用搜索引擎的体验,提高用户的点击率。
-
公开(公告)号:CN107679186B
公开(公告)日:2021-12-21
申请号:CN201710916084.7
申请日:2017-09-30
申请人: 北京奇虎科技有限公司
IPC分类号: G06F16/33 , G06F16/31 , G06F16/36 , G06F40/295
摘要: 本发明提供了一种基于实体库进行实体搜索的方法及装置,上述方法包括:接收来自用户的query,并确定所述query的实体词频度;基于所述query的实体词频度确定出与所述query相似度最高的高频query;以该高频query为实体词,到实体库中进行相关信息搜索。基于本发明提供的实体搜索的方法,可以识别出用户发起的query查询意图,并且可以基于query的实体词并识别出频度,进而为该query确定出与其相似度最高的高频query,基于该高频query为实体词到快速实体库中进行相关信息的搜索。
-
公开(公告)号:CN108491512A
公开(公告)日:2018-09-04
申请号:CN201810247766.8
申请日:2018-03-23
申请人: 北京奇虎科技有限公司
摘要: 本发明提供了一种新闻标题的摘要方法及装置。该方法包括:获取新闻的原始标题,对新闻的原始标题进行词法句法分析,得到分析结果;基于所述分析结果,提取新闻的原始标题中的句子主干内容,并将提取的句子主干内容作为新闻候选标题;利用新闻标题的摘要质量评估策略,对所述新闻候选标题的质量进行评估,进而根据评估结果确定新闻摘要标题。本发明实施例利用词法句法分析对新闻标题进行压缩式摘要,使新闻标题中的主干内容被提取的同时尽可能保留了原新闻标题中的重点信息,能够得到更准确、更严谨的新闻标题。
-
公开(公告)号:CN108470026A
公开(公告)日:2018-08-31
申请号:CN201810247767.2
申请日:2018-03-23
申请人: 北京奇虎科技有限公司
IPC分类号: G06F17/27
摘要: 本发明提供了一种新闻标题的句子主干内容提取方法及装置。该方法包括:获取新闻的原始标题,并对新闻的原始标题进行词法句法分析,得到分析结果;基于所述分析结果,生成新闻的原始标题的句法树;通过对所述句法树的筛选与剪枝,提取新闻的原始标题的句子主干内容。本发明实施例利用词法句法分析对新闻标题进行压缩式摘要,使新闻标题中的主干内容被提取的同时尽可能保留了原新闻标题中的重点信息,能够得到更准确、更严谨的新闻标题。
-
公开(公告)号:CN108460150A
公开(公告)日:2018-08-28
申请号:CN201810247228.9
申请日:2018-03-23
申请人: 北京奇虎科技有限公司
摘要: 本发明提供了一种新闻标题的处理方法及装置。该方法包括:获取新闻资源,并从新闻资源中提取新闻的原始标题;对新闻的原始标题进行词法分析,得到词法分析结果;根据所述词法分析结果,采用句法分析算法对新闻的原始标题进行句法分析,得到句法分析结果;基于所述词法分析结果和所述句法分析结果,提取新闻的原始标题中的句子主干内容,作为新闻候选标题。本发明实施例利用词法句法分析对新闻标题进行压缩式摘要,使新闻标题中的主干内容被提取的同时尽可能保留了原新闻标题中的重点信息,能够得到更准确、更严谨的新闻标题。
-
公开(公告)号:CN118093781A
公开(公告)日:2024-05-28
申请号:CN202410288440.5
申请日:2024-03-13
申请人: 北京奇虎科技有限公司
IPC分类号: G06F16/33 , G06F16/36 , G06F40/242 , G06F40/284 , G06F18/22
摘要: 本发明涉及计算机技术领域,公开了一种文本匹配方法、装置、设备及存储介质,该方法包括:加载文本存储系统中的字典,根据加载完成的字典构建AC自动机,通过AC自动机对待匹配文本进行文本匹配;由于本发明采用AC自动机匹配算法来替换Trie树匹配算法进行文本匹配,而AC自动机的性能优于Trie树,从而能够提高文本匹配性能,进而能够降低文本匹配时延,提升用户体验。
-
公开(公告)号:CN117892284A
公开(公告)日:2024-04-16
申请号:CN202410070167.9
申请日:2024-01-17
申请人: 北京奇虎科技有限公司
IPC分类号: G06F21/44
摘要: 本发明属于人工智能技术领域,公开了一种部署鉴权方法、装置、设备及存储介质。本发明通过获取目标客户端的设备信息及授权许可证,目标客户端为以私有化部署有模型推理程序的设备;对授权许可证进行解析,提取设备信息码;根据设备信息及设备信息码进行部署鉴权;在部署鉴权通过时,允许目标客户端运行模型推理程序。由于可根据目标客户端的设备信息及授权许可证中提取到的设备信息码快速进行鉴权验证,确定目标客户端是否经过供应商授权,从而保证经过供应商授权的设备才允许运行模型推理程序。
-
公开(公告)号:CN116263800A
公开(公告)日:2023-06-16
申请号:CN202111539233.5
申请日:2021-12-15
申请人: 北京奇虎科技有限公司
IPC分类号: G06F16/955 , G06F40/216 , G06F40/289 , G06F16/35
摘要: 本发明涉及互联网技术领域,公开了一种网页分析方法、设备、存储介质及装置,该方法包括:在接收到输入网页地址时,将输入网页地址与模式树进行匹配,模式树基于网页地址样本中的显著性词语构建,根据匹配结果确定输入网页地址在模式树中的节点路径,根据节点路径确定输入网页地址的模式信息;由于本发明通过网页地址和模式树来对有着相似信息的网页进行汇聚,从而在不需要人工标注和开发人员经验的情况下,提取模式信息,进而大幅降低了获取同类网页的计算成本和难度,避免了需要对同类网页分析和算法开发时人工标注的额外成本。
-
-
-
-
-
-
-
-
-