-
公开(公告)号:CN113076389B
公开(公告)日:2024-06-07
申请号:CN202110281212.1
申请日:2021-03-16
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/31 , G06F16/36 , G06F40/284
Abstract: 本公开公开了文章地域识别方法、装置、电子设备及可读存储介质,涉及计算机视觉、知识图谱以及自然语言处理等人工智能领域,其中的方法可包括:针对预定地域范围,构建树状结构的地域图谱,地域图谱中的各节点分别为一个地域词,并且,对于地域图谱中从根节点开始到任一叶节点结束的任一路径,所述路径上的各非根节点分别为其父节点的下属区域;针对待识别的文章,从地域图谱中的各非根节点中筛选出与文章相匹配的节点;根据筛选出的节点所在的路径确定出文章的地域识别结果。应用本公开所述方案,可提升识别结果的准确性等。
-
公开(公告)号:CN111475618A
公开(公告)日:2020-07-31
申请号:CN202010245146.8
申请日:2020-03-31
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/33 , G06F40/205 , G06F40/253 , G06N3/08
Abstract: 本公开实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括:接收待纠错文本;将上述待纠错文本输入预先建立的文本纠错模型,得到纠错后文本,其中,上述文本纠错模型是通过以下方式训练得到的:基于从预先获取的样本集中选取的样本进行第一次前向传播,得到第一损失,其中,样本包括样本待纠错文本和与样本待纠错文件对应的样本纠错后文本;确定噪声信息;基于上述噪声信息和所选取的样本进行第二次前向传播,得到第二损失;基于上述第一损失和上述第二损失,调整文本纠错模型的模型参数。该实施方式提升了文本纠错模型的整体性能,使生成的纠错后文本更加准确。
-
公开(公告)号:CN110059163B
公开(公告)日:2022-05-13
申请号:CN201910356347.2
申请日:2019-04-29
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/33 , G06F16/35 , G06F40/186 , G06F40/30
Abstract: 本公开提供一种生成模板的方法,包括:确定多种类型的槽位以及每种类型的槽位对应的词库;模板扩展步骤:在预设的训练文本库中查找包括至少一个关键词的候选文本,用至少部分候选文本生成模板,候选文本中除关键词外的内容在由其生成的模板中转变为固定内容,候选文本中对应关键词的位置在由其生成的模板中转变为该关键词所在的词库对应的类型的槽位;关键词扩展步骤:在训练文本库中查找与模板具有匹配的固定内容的匹配文本,将匹配文本中对应模板中的槽位的词作为该类型的槽位的候选词,将至少部分候选词作为关键词加入该类型的槽位对应的词库中。本公开还提供一种生成模板的装置、电子设备、计算机可读介质。
-
公开(公告)号:CN111475618B
公开(公告)日:2023-06-13
申请号:CN202010245146.8
申请日:2020-03-31
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/33 , G06F40/205 , G06F40/253 , G06N3/084
Abstract: 本公开实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括:接收待纠错文本;将上述待纠错文本输入预先建立的文本纠错模型,得到纠错后文本,其中,上述文本纠错模型是通过以下方式训练得到的:基于从预先获取的样本集中选取的样本进行第一次前向传播,得到第一损失,其中,样本包括样本待纠错文本和与样本待纠错文件对应的样本纠错后文本;确定噪声信息;基于上述噪声信息和所选取的样本进行第二次前向传播,得到第二损失;基于上述第一损失和上述第二损失,调整文本纠错模型的模型参数。该实施方式提升了文本纠错模型的整体性能,使生成的纠错后文本更加准确。
-
公开(公告)号:CN110059163A
公开(公告)日:2019-07-26
申请号:CN201910356347.2
申请日:2019-04-29
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开提供一种生成模板的方法,包括:确定多种类型的槽位以及每种类型的槽位对应的词库;模板扩展步骤:在预设的训练文本库中查找包括至少一个关键词的候选文本,用至少部分候选文本生成模板,候选文本中除关键词外的内容在由其生成的模板中转变为固定内容,候选文本中对应关键词的位置在由其生成的模板中转变为该关键词所在的词库对应的类型的槽位;关键词扩展步骤:在训练文本库中查找与模板具有匹配的固定内容的匹配文本,将匹配文本中对应模板中的槽位的词作为该类型的槽位的候选词,将至少部分候选词作为关键词加入该类型的槽位对应的词库中。本公开还提供一种生成模板的装置、电子设备、计算机可读介质。
-
公开(公告)号:CN113076389A
公开(公告)日:2021-07-06
申请号:CN202110281212.1
申请日:2021-03-16
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/31 , G06F16/36 , G06F40/284
Abstract: 本公开公开了文章地域识别方法、装置、电子设备及可读存储介质,涉及计算机视觉、知识图谱以及自然语言处理等人工智能领域,其中的方法可包括:针对预定地域范围,构建树状结构的地域图谱,地域图谱中的各节点分别为一个地域词,并且,对于地域图谱中从根节点开始到任一叶节点结束的任一路径,所述路径上的各非根节点分别为其父节点的下属区域;针对待识别的文章,从地域图谱中的各非根节点中筛选出与文章相匹配的节点;根据筛选出的节点所在的路径确定出文章的地域识别结果。应用本公开所述方案,可提升识别结果的准确性等。
-
-
-
-
-