-
公开(公告)号:CN116304385A
公开(公告)日:2023-06-23
申请号:CN202310194129.X
申请日:2023-02-24
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/9537 , G06F16/951 , G06F40/289 , G06F16/35 , G06N3/0455 , G06N3/047 , G06N3/08
Abstract: 本公开公开了中文网页兴趣点检索方法、装置及电子设备,涉及神经网络技术领域和云计算技术领域。解决了模型训练过程中,仅对网页的纯文本内容进行预训练,导致忽视网页数据中的位置结构信息,进而造成模型学习表征过于单一,影响下游任务信息抽取的准确性的技术问题,具体实现方案为:响应于用户选取兴趣点的指令,获取包含所述兴趣点的目标网页的目标网页数据;将所述目标网页数据输入到中文网页预训练模型中,得到所述兴趣点对应的目标属性信息;展示所述目标属性信息。
-
公开(公告)号:CN110647623B
公开(公告)日:2022-09-23
申请号:CN201810593526.3
申请日:2018-06-11
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 谢红伟
IPC: G06F16/335 , G06F16/33 , G06F16/9535
Abstract: 本申请实施例公开了用于更新信息的方法及装置。该方法的一具体实施方式包括:从文本信息中获取至少一条待处理兴趣点信息;对于上述至少一条待处理兴趣点信息中的待处理兴趣点信息,执行以下更新操作:将该待处理兴趣点信息与预先设定的兴趣点信息库中的兴趣点信息进行匹配;根据匹配结果确定上述兴趣点信息库是否存在待更新兴趣点信息;如果存在,则根据该待处理兴趣点信息对上述待更新兴趣点信息进行更新。该实施方式提高了兴趣点信息的准确性和兴趣点信息库的更新效率。
-
公开(公告)号:CN113255398A
公开(公告)日:2021-08-13
申请号:CN202010084328.1
申请日:2020-02-10
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06K9/00 , G06K9/32 , G06F40/263
Abstract: 本申请实施例公开了一种兴趣点判重方法、装置、设备和存储介质,涉及地图数据处理技术领域。具体实现方案为:根据至少两个兴趣点的候选语种名称,从候选语种中确定目标语种以及所述至少两个兴趣点的目标语种名称;基于所述目标语种的相似度计算模型,根据所述至少两个兴趣点的目标语种名称,确定所述至少两个兴趣点是否属于同一兴趣点。通过对待比较的多个兴趣点的名称进行所属语种的区分,综合确定兴趣点名称在不同语种下的相似度,提高相似度计算的准确率以及地图国际化数据中跨语种处理的泛化能力,为兴趣点判重提供了有效依据。
-
公开(公告)号:CN107609186A
公开(公告)日:2018-01-19
申请号:CN201710922974.9
申请日:2017-09-30
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明提供一种用于对地图中的兴趣点进行去重的信息处理方法、信息处理装置、终端设备以及计算机存储介质。该信息处理方法包括:获取地图中的多个兴趣点作为待去重兴趣点集合,并且获取所述待去重兴趣点集合中每个兴趣点的多个决策树属性;确定所述去重兴趣点集合中任意两个兴趣点之间的每个决策树属性的相似度;以及利用预先根据兴趣点的决策树属性构建的决策树,基于所述两个兴趣点之间的每个决策树属性的相似度来确定所述两个兴趣点是否相同,从而对所述待去重兴趣点集合中的兴趣点进行去重。根据本发明实施例的信息处理装置、信息处理方法、终端设备以及存储介质至少能够提高去重处理的准确率。
-
公开(公告)号:CN107609185A
公开(公告)日:2018-01-19
申请号:CN201710922431.7
申请日:2017-09-30
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 谢红伟
Abstract: 本发明的实施方式涉及用于地图兴趣点POI的相似度计算的方法、装置、设备和计算机可读存储介质。所述方法包括:构建至少一条训练样本;对所构建的至少一条训练样本进行序列化处理,其中该序列化处理包括利用one-hot编码用预设的one-hot编码字典至少一条训练样本转换为序列;以及将经序列化处理后的至少一条训练样本输入至LSTM神经网络模型,对LSTM神经网络模型进行训练。根据本发明的实施方式,利用LSTM的深度学习模型,构建了端到端的POI相似度计算模型,提升了POI相似度计算的准确性。
-
-
-
-