语料泛化方法、装置、电子设备及可读存储介质

    公开(公告)号:CN108460017B

    公开(公告)日:2019-07-30

    申请号:CN201810165781.8

    申请日:2018-02-28

    Inventor: 王武生 石磊

    Abstract: 本发明提供一种语料泛化方法、装置、电子设备及可读存储介质,通过接收用户输入的初始语料,将初始语料切分为语料组分;合并相同的语料组分,形成多个语料组分节点;根据每个初始语料中各语料组分的连接顺序,在多个语料组分节点中确定每个初始语料中各语料组分之间的转移路径;遍历转移路径,建立路径可达的语料组分之间的转移关系,形成泛化后的语料。从而实现了基于已有的语料组分之间转移关系泛化生成大量的衍生语料,且该泛化的语料是基于初始语料的语料组分转移顺序生成的,符合人们的自然语言表达,增加了用于模型训练的语料数量,提升了语料质量,使得采用该泛化后的语料训练出的模型的识别效果得以提升。

    语料泛化方法、装置、电子设备及可读存储介质

    公开(公告)号:CN108460017A

    公开(公告)日:2018-08-28

    申请号:CN201810165781.8

    申请日:2018-02-28

    Inventor: 王武生 石磊

    CPC classification number: G06F17/2765 G06F17/2785

    Abstract: 本发明提供一种语料泛化方法、装置、电子设备及可读存储介质,通过接收用户输入的初始语料,将初始语料切分为语料组分;合并相同的语料组分,形成多个语料组分节点;根据每个初始语料中各语料组分的连接顺序,在多个语料组分节点中确定每个初始语料中各语料组分之间的转移路径;遍历转移路径,建立路径可达的语料组分之间的转移关系,形成泛化后的语料。从而实现了基于已有的语料组分之间转移关系泛化生成大量的衍生语料,且该泛化的语料是基于初始语料的语料组分转移顺序生成的,符合人们的自然语言表达,增加了用于模型训练的语料数量,提升了语料质量,使得采用该泛化后的语料训练出的模型的识别效果得以提升。

Patent Agency Ranking