-
公开(公告)号:CN111274353B
公开(公告)日:2023-08-01
申请号:CN202010037943.7
申请日:2020-01-14
Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
IPC: G06F16/33 , G06F40/289
Abstract: 本申请实施例公开了一种文本切词方法、装置、设备和介质,涉及数据处理技术领域,尤其涉及智能搜索技术。具体实现方案为:将待切分文本划分为至少两层字符片段组合;其中,任一层字符片段为上一层字符片段的子字符片段,和/或为下一层字符片段的父字符片段;基于所述至少两层字符片段组合,根据目标词粒度,对所述待切分文本进行切分。本申请实施例提供了一种文本切词方法、装置、设备和介质,实现了对文本的不同词粒度的切分。
-
公开(公告)号:CN111274353A
公开(公告)日:2020-06-12
申请号:CN202010037943.7
申请日:2020-01-14
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/33 , G06F40/289
Abstract: 本申请实施例公开了一种文本切词方法、装置、设备和介质,涉及数据处理技术领域,尤其涉及智能搜索技术。具体实现方案为:将待切分文本划分为至少两层字符片段组合;其中,任一层字符片段为上一层字符片段的子字符片段,和/或为下一层字符片段的父字符片段;基于所述至少两层字符片段组合,根据目标词粒度,对所述待切分文本进行切分。本申请实施例提供了一种文本切词方法、装置、设备和介质,实现了对文本的不同词粒度的切分。
-
公开(公告)号:CN111241124B
公开(公告)日:2023-10-03
申请号:CN202010015505.0
申请日:2020-01-07
Applicant: 百度在线网络技术(北京)有限公司 , 上海小度技术有限公司
IPC: G06F16/242 , G06F40/30
Abstract: 本申请实施例公开了一种需求模型构建方法、装置、电子设备和介质,涉及自然语言处理技术领域。具体实现方案为:依据谓词搭配语料库和同义片段改写库中的至少一个,对标注的样本需求进行同义扩展;依据同义扩展结果,以及所述样本需求的标注,构建需求模型。通过本申请实施例的技术方案,能够准确解析用户的需求,且人力成本低。
-
公开(公告)号:CN111241124A
公开(公告)日:2020-06-05
申请号:CN202010015505.0
申请日:2020-01-07
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/242 , G06F40/30
Abstract: 本申请实施例公开了一种需求模型构建方法、装置、电子设备和介质,涉及自然语言处理技术领域。具体实现方案为:依据谓词搭配语料库和同义片段改写库中的至少一个,对标注的样本需求进行同义扩展;依据同义扩展结果,以及所述样本需求的标注,构建需求模型。通过本申请实施例的技术方案,能够准确解析用户的需求,且人力成本低。
-
-
-