-
公开(公告)号:CN106528655A
公开(公告)日:2017-03-22
申请号:CN201610906155.0
申请日:2016-10-18
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请提出一种文本主题识别方法和装置,该文本主题识别方法包括:获取待识别的文本;获取已生成的文本主题识别模型,所述文本主题识别模型是根据训练数据生成的,所述训练数据包括收集的文本的特征和收集的文本对应的主题;根据所述文本主题识别模型对所述文本进行主题识别,识别出所述文本的主题。该方法能够提高识别出的文本主题的准确度。
-
公开(公告)号:CN111881669A
公开(公告)日:2020-11-03
申请号:CN202010587761.7
申请日:2020-06-24
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F40/247 , G06F40/295 , G06F40/30 , G06K9/62
Abstract: 本申请公开了同义文本获取方法、装置、电子设备及存储介质,涉及智能搜索及深度学习领域,其中的方法可包括:针对待处理的第一文本,按照预定方式获取对应的模板形式的第一文本,所述预定方式包括:对文本进行实体识别,得到识别出的实体类型和实体值,并用识别出的实体类型作为槽位替换文本中的对应实体值;利用预先训练得到的翻译模型生成模板形式的第一文本对应的同义的模板形式的第二文本;利用识别出的待处理的第一文本的实体值替换模板形式的第二文本中的对应实体类型,得到待处理的第一文本的同义文本。应用本申请所述方案,可提升同义文本的召回能力等。
-
公开(公告)号:CN111881669B
公开(公告)日:2023-06-09
申请号:CN202010587761.7
申请日:2020-06-24
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F40/247 , G06F40/295 , G06F40/30 , G06F18/214
Abstract: 本申请公开了同义文本获取方法、装置、电子设备及存储介质,涉及智能搜索及深度学习领域,其中的方法可包括:针对待处理的第一文本,按照预定方式获取对应的模板形式的第一文本,所述预定方式包括:对文本进行实体识别,得到识别出的实体类型和实体值,并用识别出的实体类型作为槽位替换文本中的对应实体值;利用预先训练得到的翻译模型生成模板形式的第一文本对应的同义的模板形式的第二文本;利用识别出的待处理的第一文本的实体值替换模板形式的第二文本中的对应实体类型,得到待处理的第一文本的同义文本。应用本申请所述方案,可提升同义文本的召回能力等。
-
-