一种数据库相似语句筛选的方法和装置

    公开(公告)号:CN109829051A

    公开(公告)日:2019-05-31

    申请号:CN201910092111.2

    申请日:2019-01-30

    Abstract: 本申请公开了一种数据库相似语句筛选的方法和装置,该方法包括:利用目标标准语句的多个目标扩展语句的语义向量和语义向量预期筛选各个目标扩展语句得到待质检扩展语句;计算每个待质检扩展语句的语义向量与数据库中每个其他扩展语句的语义向量的相似度;其中,语义向量是通过语义度量模型得到的;基于相似度和第一预设筛选条件筛选各个待质检扩展语句和各个其他扩展语句,得到相似待质检扩展语句和对应的相似其他扩展语句。可见,仅筛选需质检的目标扩展语句作为待质检扩展语句,减小待质检扩展语句数量;该自动相似语句筛选相较于人工筛选得到的筛选结果更加完善、准确,且节省人力、节约时间,提高筛选效率。

    知识库构建方法和装置
    2.
    发明公开

    公开(公告)号:CN109800879A

    公开(公告)日:2019-05-24

    申请号:CN201811574181.3

    申请日:2018-12-21

    Abstract: 本发明提供了一种知识库构建方法和装置,该方法包括:获取待构建知识库中已有的标准问以及与所述标准问关联的第一扩展问;根据所述标准问和所述第一扩展问,从待挖掘语料库中挖掘与所述标准问和所述第一扩展问语义匹配的第二扩展问;将所述第二扩展问从所述待挖掘语料库中转移存储至所述待构建知识库中,并将所述第二扩展问及与该第二扩展问语义匹配的所述标准问相关联,其中,存储至所述待构建知识库中的所述第二扩展问记为第一扩展问。本发明在构建知识库时,不需要人工标注,实现了知识库的自动构建,并节省了人力和财力,以及提升了知识库的构建效率、缩短了知识库的构建周期。

    一种数据库相似语句筛选的方法和装置

    公开(公告)号:CN109829051B

    公开(公告)日:2023-01-17

    申请号:CN201910092111.2

    申请日:2019-01-30

    Abstract: 本申请公开了一种数据库相似语句筛选的方法和装置,该方法包括:利用目标标准语句的多个目标扩展语句的语义向量和语义向量预期筛选各个目标扩展语句得到待质检扩展语句;计算每个待质检扩展语句的语义向量与数据库中每个其他扩展语句的语义向量的相似度;其中,语义向量是通过语义度量模型得到的;基于相似度和第一预设筛选条件筛选各个待质检扩展语句和各个其他扩展语句,得到相似待质检扩展语句和对应的相似其他扩展语句。可见,仅筛选需质检的目标扩展语句作为待质检扩展语句,减小待质检扩展语句数量;该自动相似语句筛选相较于人工筛选得到的筛选结果更加完善、准确,且节省人力、节约时间,提高筛选效率。

    知识库构建方法和装置
    4.
    发明授权

    公开(公告)号:CN109800879B

    公开(公告)日:2022-02-01

    申请号:CN201811574181.3

    申请日:2018-12-21

    Abstract: 本发明提供了一种知识库构建方法和装置,该方法包括:获取待构建知识库中已有的标准问以及与所述标准问关联的第一扩展问;根据所述标准问和所述第一扩展问,从待挖掘语料库中挖掘与所述标准问和所述第一扩展问语义匹配的第二扩展问;将所述第二扩展问从所述待挖掘语料库中转移存储至所述待构建知识库中,并将所述第二扩展问及与该第二扩展问语义匹配的所述标准问相关联,其中,存储至所述待构建知识库中的所述第二扩展问记为第一扩展问。本发明在构建知识库时,不需要人工标注,实现了知识库的自动构建,并节省了人力和财力,以及提升了知识库的构建效率、缩短了知识库的构建周期。

Patent Agency Ranking