搜索方法及装置
    1.
    发明公开

    公开(公告)号:CN104503988A

    公开(公告)日:2015-04-08

    申请号:CN201410725281.7

    申请日:2014-12-03

    CPC classification number: G06F17/30867

    Abstract: 本发明提供一种搜索方法及装置。本发明实施例通过获得所接收的搜索关键词所属的搜索类型,进而利用所述搜索类型所对应的成分分析模型,对所述搜索关键词进行识别处理,以获得搜索成分词,使得能够根据所述搜索成分词,获得搜索结果并输出,由于不再完全依赖搜索关键词执行搜索操作,而是结合搜索关键词所属的搜索类型所对应的成分分析模型,执行搜索操作,使得搜索结果能够基本满足用户的搜索意图,因此,能够避免现有技术中由于用户通过应用反复浏览搜索结果页或者反复进行搜索而导致的增加应用与搜索引擎之间的数据交互的问题,从而降低了搜索引擎的处理负担。

    搜索需求分析方法和装置

    公开(公告)号:CN104462272A

    公开(公告)日:2015-03-25

    申请号:CN201410687222.5

    申请日:2014-11-25

    CPC classification number: G06F17/30864 G06F17/2765

    Abstract: 本发明提出一种搜索需求分析方法和装置,其中,该搜索需求分析方法包括以下步骤:获取搜索词,并获取搜索词对应的多个关联词;抽取搜索词的特征并作为原始特征,并抽取多个关联词的特征并作为关联特征;以及根据原始特征和关联特征获取搜索需求。本发明的搜索需求分析方法,能够准确地获取用户的搜索需求,从而搜索引擎根据用户的搜索需求提供更符合用户需要的搜索结果,进而在提高了搜索的准确率的同时,还提高了搜索的召回率。此外,搜索需求的分析过程与语言无关,因此可方便地在多个不同语种之间进行迁移,更加方便。

    文本纠错方法及装置
    3.
    发明公开

    公开(公告)号:CN110188353A

    公开(公告)日:2019-08-30

    申请号:CN201910452219.8

    申请日:2019-05-28

    Abstract: 本申请提出一种文本纠错方法及装置,其中方法包括:将待纠错的文本对应的词向量数组输入预设的编码模块,获取第一隐状态向量数组并输入至解码模块,针对每个解码位置,根据该解码位置对应的第二隐状态向量、注意力向量和第一隐状态向量数组确定解码向量;根据解码位置的解码向量、全局性词表、以及解码位置的字词对应的受限词表,确定解码位置的解码结果,进而确定文本对应的纠错后文本,该方法中确定解码向量时,采用了第一隐状态向量数组,从而考虑到了文本的字词顺序,确保了纠错结果的准确度;另外,受限词表的采用,限制了解空间的大小,降低了纠错模型的复杂度,提升了模型收敛速度。

    文法错误识别方法、装置、计算机设备及存储介质

    公开(公告)号:CN110046350A

    公开(公告)日:2019-07-23

    申请号:CN201910293504.X

    申请日:2019-04-12

    Abstract: 本申请提出一种文法错误识别方法、装置和计算机设备,其中,方法包括:通过获取文本序列和候选字集合,根据文本序列和候选字集合生成第一词向量数组表示、第二词向量数组表示和第三词向量数组表示,根据文本序列和候选字集合生成N-gram统计特征和PT特征,根据第一词向量数组表示和第二词向量数组表示和N-gram统计特征通过基于候选排序的语言模型生成候选字集合的语言模型特征,根据第一词向量数组表示、第三词向量数组表示、N-gram统计特征和PT特征通过文法特征提取模块生成文法错误特征信息,根据候选字集合的语言模型特征和文法错误特征信息通过排序校对模型生成错误输出几率打分。由此,能够准确识别出文本序列中的错误序列,提高了文法错误识别的准确率。

    搜索方法及装置
    5.
    发明授权

    公开(公告)号:CN104503988B

    公开(公告)日:2018-10-16

    申请号:CN201410725281.7

    申请日:2014-12-03

    Abstract: 本发明提供一种搜索方法及装置。本发明实施例通过获得所接收的搜索关键词所属的搜索类型,进而利用所述搜索类型所对应的成分分析模型,对所述搜索关键词进行识别处理,以获得搜索成分词,使得能够根据所述搜索成分词,获得搜索结果并输出,由于不再完全依赖搜索关键词执行搜索操作,而是结合搜索关键词所属的搜索类型所对应的成分分析模型,执行搜索操作,使得搜索结果能够基本满足用户的搜索意图,因此,能够避免现有技术中由于用户通过应用反复浏览搜索结果页或者反复进行搜索而导致的增加应用与搜索引擎之间的数据交互的问题,从而降低了搜索引擎的处理负担。

    文法错误识别方法、装置、计算机设备及存储介质

    公开(公告)号:CN110046350B

    公开(公告)日:2023-04-07

    申请号:CN201910293504.X

    申请日:2019-04-12

    Abstract: 本申请提出一种文法错误识别方法、装置和计算机设备,其中,方法包括:通过获取文本序列和候选字集合,根据文本序列和候选字集合生成第一词向量数组表示、第二词向量数组表示和第三词向量数组表示,根据文本序列和候选字集合生成N‑gram统计特征和PT特征,根据第一词向量数组表示和第二词向量数组表示和N‑gram统计特征通过基于候选排序的语言模型生成候选字集合的语言模型特征,根据第一词向量数组表示、第三词向量数组表示、N‑gram统计特征和PT特征通过文法特征提取模块生成文法错误特征信息,根据候选字集合的语言模型特征和文法错误特征信息通过排序校对模型生成错误输出几率打分。由此,能够准确识别出文本序列中的错误序列,提高了文法错误识别的准确率。

    文本纠错方法及装置
    7.
    发明授权

    公开(公告)号:CN110188353B

    公开(公告)日:2021-02-05

    申请号:CN201910452219.8

    申请日:2019-05-28

    Abstract: 本申请提出一种文本纠错方法及装置,其中方法包括:将待纠错的文本对应的词向量数组输入预设的编码模块,获取第一隐状态向量数组并输入至解码模块,针对每个解码位置,根据该解码位置对应的第二隐状态向量、注意力向量和第一隐状态向量数组确定解码向量;根据解码位置的解码向量、全局性词表、以及解码位置的字词对应的受限词表,确定解码位置的解码结果,进而确定文本对应的纠错后文本,该方法中确定解码向量时,采用了第一隐状态向量数组,从而考虑到了文本的字词顺序,确保了纠错结果的准确度;另外,受限词表的采用,限制了解空间的大小,降低了纠错模型的复杂度,提升了模型收敛速度。

    搜索需求分析方法和装置

    公开(公告)号:CN104462272B

    公开(公告)日:2018-05-04

    申请号:CN201410687222.5

    申请日:2014-11-25

    Abstract: 本发明提出一种搜索需求分析方法和装置,其中,该搜索需求分析方法包括以下步骤:获取搜索词,并获取搜索词对应的多个关联词;抽取搜索词的特征并作为原始特征,并抽取多个关联词的特征并作为关联特征;以及根据原始特征和关联特征获取搜索需求。本发明的搜索需求分析方法,能够准确地获取用户的搜索需求,从而搜索引擎根据用户的搜索需求提供更符合用户需要的搜索结果,进而在提高了搜索的准确率的同时,还提高了搜索的召回率。此外,搜索需求的分析过程与语言无关,因此可方便地在多个不同语种之间进行迁移,更加方便。

Patent Agency Ranking