-
公开(公告)号:CN104462060A
公开(公告)日:2015-03-25
申请号:CN201410728432.4
申请日:2014-12-03
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提供的一种通过计算机实现的计算文本相似度和搜索处理方法及装置。所述方法包括:获取第一文本串和第二文本串;根据预先设置的短语翻译模型和依存结构模型,对所述第一文本串进行解码,获取K个翻译文本串;分别计算所述K个翻译文本串与所述第二文本串之间的第一语义相似度值,并且根据计算的K个第一语义相似度值计算所述第一文本串和第二文本串之间的第二语义相似度值。其解决了句子中长距离的依存关系问题,能够更好地表示搜索语句的语义,从而更好地将搜索语句与网页标题进行匹配,使用户得到语义匹配的搜索结果条目,增强用户搜索体验。
-
公开(公告)号:CN104298658A
公开(公告)日:2015-01-21
申请号:CN201410594905.6
申请日:2014-10-29
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提出一种获取搜索结果的方法和装置,该获取搜索结果的方法包括接收要搜索的问题;对所述问题进行句法语义分析,得到句法语义分析后的问题;获取预先建立的知识库中的知识内容,所述知识内容包括对原始文本数据进行句法语义分析后得到的文本数据;根据所述句法语义分析后的问题和所述知识内容,得到与所述问题对应的答案,并将所述答案确定为搜索结果。该方法能够提高获取的搜索结果的准确度。
-
公开(公告)号:CN111353281A
公开(公告)日:2020-06-30
申请号:CN202010112628.6
申请日:2020-02-24
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F40/16 , G06F40/211 , G06F40/30 , G06N3/08
Abstract: 本申请公开了文本转换方法、装置、电子设备及存储介质,涉及人工智能领域,其中的方法可包括:获取书面表达形式的第一文本;对第一文本进行长句切分,得到切分出的各短句;按照语义连贯性要求对切分出的各短句进行排序;根据排序后的各短句生成口语化表达形式的第二文本。应用本申请所述方案,可提升生成结果的准确性等。
-
公开(公告)号:CN104715063B
公开(公告)日:2018-11-02
申请号:CN201510149901.1
申请日:2015-03-31
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本申请公开了搜索排序方法和装置。所述搜索排序方法包括:使用查询条目样本以及相应的正例搜索条目样本和负例搜索条目样本,对以短语向量集合为参数的预设模型进行训练,确定短语向量集合;基于短语向量集合,分别计算待响应的查询条目与对应的各搜索条目的相似度;根据相似度确定对查询条目进行响应时,各搜索条目的呈现顺序。该搜索排序方法可通过短语向量确定查询条目和搜索条目的匹配程度,并据此对搜索条目进行排序,从而进一步改善了搜索排序的准确性。
-
公开(公告)号:CN104598611B
公开(公告)日:2018-03-23
申请号:CN201510047913.3
申请日:2015-01-29
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提供一种对搜索条目进行排序的方法及系统,所述方法包括:通过神经网络将查询文本按照语序表示成向量;根据所述表示出的向量通过所述神经网络计算所述查询文本与搜索条目之间的排序分数;根据所述计算出的排序分数对所述搜索条目进行排序。通过采用本发明可以兼顾一词多义与近义词的匹配以及词的语序来进行搜索排序,能够给出更为准确的排序结果。
-
公开(公告)号:CN104462323B
公开(公告)日:2018-02-27
申请号:CN201410721307.0
申请日:2014-12-02
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明实施例提供了一种语义相似度计算方法、搜索结果处理方法和装置。所述语义相似度计算方法包括:获取第一文本串和第二文本串;分别对所述第一文本串和所述第二文本串进行分词,生成分词结果;根据所述分词结果分别将所述第一文本串和所述第二文本串分得的分词生成预定多个语义层;将所述第一文本串的每个语义层都分别与所述第二文本串的所有语义层进行依存相似度计算得到N×N个依存相似度值;根据计算的N×N个依存相似度值计算所述第一文本串和所述第二文本串的语义相似度值。通过本发明实施例的语义相似度计算方法、搜索结果处理方法和装置,能够提高文本串之间语义相似度计算的准确性。
-
公开(公告)号:CN104462326A
公开(公告)日:2015-03-25
申请号:CN201410721415.8
申请日:2014-12-02
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G06F16/951 , G06F17/272
Abstract: 本发明提供一种人物关系分析方法、提供人物信息的方法及装置。该方法包括:从与人物相关的内容数据抽取多个语句;分别对所述多个语句进行依存分析,生成多个依存分析树;根据所述多个依存分析树分别对所述多个语句进行语义角色标注,生成多个语义角色标注结果;根据所述多个语义角色标注结果生成人物时间空间关系表;根据所述人物时间空间关系表生成关注人物的人物关系知识库。通过对人物内容数据进行依存分析和语义角色标注,从而准确地获取与人物相关的人物关系知识库,并且向用户提供丰富、准确的人物关系的信息。
-
公开(公告)号:CN104462323A
公开(公告)日:2015-03-25
申请号:CN201410721307.0
申请日:2014-12-02
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G06F17/30864 , G06F17/2785
Abstract: 本发明实施例提供了一种语义相似度计算方法、搜索结果处理方法和装置。所述语义相似度计算方法包括:获取第一文本串和第二文本串;分别对所述第一文本串和所述第二文本串进行分词,生成分词结果;根据所述分词结果分别将所述第一文本串和所述第二文本串分得的分词生成预定多个语义层;将所述第一文本串的每个语义层都分别与所述第二文本串的所有语义层进行依存相似度计算得到N×N个依存相似度值;根据计算的N×N个依存相似度值计算所述第一文本串和所述第二文本串的语义相似度值。通过本发明实施例的语义相似度计算方法、搜索结果处理方法和装置,能够提高文本串之间语义相似度计算的准确性。
-
公开(公告)号:CN104391836A
公开(公告)日:2015-03-04
申请号:CN201410643330.2
申请日:2014-11-07
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/27
Abstract: 本发明提供一种处理用于句法分析的特征模板的方法及装置。所述方法包括:获取第一特征模板的集合,其中,所述第一特征模板的集合包含基本模板和组合模板,每个所述组合模板包含至少两个基本模板;从所述第一特征模板的集合提取至少一个基本模板;分别使用所述至少一个基本模板对训练语料进行解码,并且分别为每个所述基本模板统计从所述训练语料抽取的第一特征值的数量;从所述第一特征模板的集合删除仅抽取出单个第一特征值的所述基本模板以及组合模板中包含的所述基本模板。通过从特征模板的集合中删除不影响测试精度的特征模板,自动地进行特征模板的筛选,获得通用性好的特征模板的集合。
-
公开(公告)号:CN111309888B
公开(公告)日:2023-10-24
申请号:CN202010116245.6
申请日:2020-02-25
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/338
Abstract: 本申请公开了人机对话方法、装置、电子设备及存储介质,涉及人工智能领域,其中的方法可包括:在对话过程中,当需要针对用户输入生成回复时,若确定用户输入中包含语义内容,则分别确定出N条回复,N为大于一的正整数,每条回复分别对应于不同的反馈意图;将N条回复按预定顺序进行拼接,将拼接结果作为生成的回复反馈给用户。应用本申请所述方案,可提升回复质量等。
-
-
-
-
-
-
-
-
-