-
公开(公告)号:CN111881669B
公开(公告)日:2023-06-09
申请号:CN202010587761.7
申请日:2020-06-24
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F40/247 , G06F40/295 , G06F40/30 , G06F18/214
Abstract: 本申请公开了同义文本获取方法、装置、电子设备及存储介质,涉及智能搜索及深度学习领域,其中的方法可包括:针对待处理的第一文本,按照预定方式获取对应的模板形式的第一文本,所述预定方式包括:对文本进行实体识别,得到识别出的实体类型和实体值,并用识别出的实体类型作为槽位替换文本中的对应实体值;利用预先训练得到的翻译模型生成模板形式的第一文本对应的同义的模板形式的第二文本;利用识别出的待处理的第一文本的实体值替换模板形式的第二文本中的对应实体类型,得到待处理的第一文本的同义文本。应用本申请所述方案,可提升同义文本的召回能力等。
-
公开(公告)号:CN111881669A
公开(公告)日:2020-11-03
申请号:CN202010587761.7
申请日:2020-06-24
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F40/247 , G06F40/295 , G06F40/30 , G06K9/62
Abstract: 本申请公开了同义文本获取方法、装置、电子设备及存储介质,涉及智能搜索及深度学习领域,其中的方法可包括:针对待处理的第一文本,按照预定方式获取对应的模板形式的第一文本,所述预定方式包括:对文本进行实体识别,得到识别出的实体类型和实体值,并用识别出的实体类型作为槽位替换文本中的对应实体值;利用预先训练得到的翻译模型生成模板形式的第一文本对应的同义的模板形式的第二文本;利用识别出的待处理的第一文本的实体值替换模板形式的第二文本中的对应实体类型,得到待处理的第一文本的同义文本。应用本申请所述方案,可提升同义文本的召回能力等。
-
公开(公告)号:CN111881255B
公开(公告)日:2023-10-27
申请号:CN202010587746.2
申请日:2020-06-24
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/33 , G06F16/36 , G06F40/247 , G06F40/30 , G06F18/214
Abstract: 本申请公开了同义文本获取方法、装置、电子设备及存储介质,涉及智能搜索及深度学习领域,其中的方法可包括:获取训练数据,任一训练数据中分别包括:两个同义的文本;利用训练数据训练图模型,得到图模型中的各节点的向量表达,其中,图模型中的各节点分别对应于训练数据中的一个不同的文本,若任意两个节点出现在同一训练数据中,则将两个节点通过边相连;针对图模型中的任一节点对应的待处理的文本,根据图模型中的各节点的向量表达,确定出待处理的文本的K个近邻文本,作为待处理的文本的同义文本,K为正整数。应用本申请所述方案,可提升同义文本的召回能力等。
-
公开(公告)号:CN111598616B
公开(公告)日:2023-08-01
申请号:CN202010391847.2
申请日:2020-05-11
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06Q30/0273 , G06Q30/0241 , G06F16/9535
Abstract: 本申请实施例公开了一种对象集合筛选的实现方法、装置、设备以及存储介质,涉及大数据处理和人工智能技术领域。具体实现方案为:获取初始对象集合;其中,所述初始对象集合中包括至少两个对象;基于强化学习的序列决策算法中的筛选策略,对所述初始对象集合执行对象筛选操作,以形成目标对象集合;其中,所述初始对象集合和/或所述对象筛选操作的数量为两个以上,以形成至少两个所述目标对象集合;获取将各所述目标对象集合在运行环境中实施而获得的收益;根据各所述目标对象集合之间的收益差异,对形成各所述目标对象集合的筛选策略进行更新。本申请实施例解决了集合筛选过程决策的通用性问题。
-
公开(公告)号:CN113221550A
公开(公告)日:2021-08-06
申请号:CN202010081748.4
申请日:2020-02-06
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F40/284 , G06F40/30 , G06F40/247
Abstract: 本申请实施例公开了一种文本过滤方法、装置、设备和介质,涉及数据处理技术领域,尤其涉及智能搜索技术。具体实现方案为:对目标文本进行切词,得到候选词序列;对所述候选词序列中的词语进行词性标注;根据词性标注结果,过滤所述候选词序列中的冗余词,以生成目标词序列。本申请实施例提供一种文本过滤方法、装置、设备和介质,以提高文本过滤的准确率。
-
公开(公告)号:CN111797205A
公开(公告)日:2020-10-20
申请号:CN202010624239.1
申请日:2020-06-30
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 连义江
IPC: G06F16/33 , G06F40/284
Abstract: 本申请公开了一种词表检索方法、装置、电子设备及存储介质,涉及智能搜索技术领域及自然语言处理技术领域。具体方案为:接收用户提交的检索词;在预先设置的词表的关键字中匹配检索词;响应于在词表的关键字中未匹配到检索词,根据检索词计算得到与其对应的规约检索词;在词表的关键字中搜索规约检索词;响应于在词表的关键字中搜索到规约检索词,根据搜索到的关键字得到规约检索词对应的值,根据规约检索词对应的值确定检索词对应的检索结果。本申请实施例能够极大地提升词表的命中率,同时还可以节省词表的存储空间。
-
公开(公告)号:CN111598616A
公开(公告)日:2020-08-28
申请号:CN202010391847.2
申请日:2020-05-11
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06Q30/02 , G06F16/9535
Abstract: 本申请实施例公开了一种对象集合筛选的实现方法、装置、设备以及存储介质,涉及大数据处理和人工智能技术领域。具体实现方案为:获取初始对象集合;其中,所述初始对象集合中包括至少两个对象;基于强化学习的序列决策算法中的筛选策略,对所述初始对象集合执行对象筛选操作,以形成目标对象集合;其中,所述初始对象集合和/或所述对象筛选操作的数量为两个以上,以形成至少两个所述目标对象集合;获取将各所述目标对象集合在运行环境中实施而获得的收益;根据各所述目标对象集合之间的收益差异,对形成各所述目标对象集合的筛选策略进行更新。本申请实施例解决了集合筛选过程决策的通用性问题。
-
公开(公告)号:CN108388480A
公开(公告)日:2018-08-10
申请号:CN201710063676.9
申请日:2017-02-03
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明公开了短串相关性校验方法和装置,所述方法包括:获取第一短串;获取与第一短串相对应的第二短串;分别将获取到的每个第二短串与第一短串组成一个校验对;获取校验对的深层语义特征;根据深层语义特征,确定出校验对中的两个短串之间的相关性。应用本发明所述方案,能够提高校验结果的准确性等。
-
公开(公告)号:CN111797205B
公开(公告)日:2024-03-12
申请号:CN202010624239.1
申请日:2020-06-30
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 连义江
IPC: G06F16/33 , G06F40/284
Abstract: 本申请公开了一种词表检索方法、装置、电子设备及存储介质,涉及智能搜索技术领域及自然语言处理技术领域。具体方案为:接收用户提交的检索词;在预先设置的词表的关键字中匹配检索词;响应于在词表的关键字中未匹配到检索词,根据检索词计算得到与其对应的规约检索词;在词表的关键字中搜索规约检索词;响应于在词表的关键字中搜索到规约检索词,根据搜索到的关键字得到规约检索词对应的值,根据规约检索词对应的值确定检索词对应的检索结果。本申请实施例能够极大地提升词表的命中率,同时还可以节省词表的存储空间。
-
公开(公告)号:CN113221550B
公开(公告)日:2023-09-29
申请号:CN202010081748.4
申请日:2020-02-06
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F40/284 , G06F40/30 , G06F40/247
Abstract: 本申请实施例公开了一种文本过滤方法、装置、设备和介质,涉及数据处理技术领域,尤其涉及智能搜索技术。具体实现方案为:对目标文本进行切词,得到候选词序列;对所述候选词序列中的词语进行词性标注;根据词性标注结果,过滤所述候选词序列中的冗余词,以生成目标词序列。本申请实施例提供一种文本过滤方法、装置、设备和介质,以提高文本过滤的准确率。
-
-
-
-
-
-
-
-
-