-
公开(公告)号:CN111881669B
公开(公告)日:2023-06-09
申请号:CN202010587761.7
申请日:2020-06-24
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F40/247 , G06F40/295 , G06F40/30 , G06F18/214
Abstract: 本申请公开了同义文本获取方法、装置、电子设备及存储介质,涉及智能搜索及深度学习领域,其中的方法可包括:针对待处理的第一文本,按照预定方式获取对应的模板形式的第一文本,所述预定方式包括:对文本进行实体识别,得到识别出的实体类型和实体值,并用识别出的实体类型作为槽位替换文本中的对应实体值;利用预先训练得到的翻译模型生成模板形式的第一文本对应的同义的模板形式的第二文本;利用识别出的待处理的第一文本的实体值替换模板形式的第二文本中的对应实体类型,得到待处理的第一文本的同义文本。应用本申请所述方案,可提升同义文本的召回能力等。
-
公开(公告)号:CN111881669A
公开(公告)日:2020-11-03
申请号:CN202010587761.7
申请日:2020-06-24
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F40/247 , G06F40/295 , G06F40/30 , G06K9/62
Abstract: 本申请公开了同义文本获取方法、装置、电子设备及存储介质,涉及智能搜索及深度学习领域,其中的方法可包括:针对待处理的第一文本,按照预定方式获取对应的模板形式的第一文本,所述预定方式包括:对文本进行实体识别,得到识别出的实体类型和实体值,并用识别出的实体类型作为槽位替换文本中的对应实体值;利用预先训练得到的翻译模型生成模板形式的第一文本对应的同义的模板形式的第二文本;利用识别出的待处理的第一文本的实体值替换模板形式的第二文本中的对应实体类型,得到待处理的第一文本的同义文本。应用本申请所述方案,可提升同义文本的召回能力等。
-