-
公开(公告)号:CN112052664A
公开(公告)日:2020-12-08
申请号:CN202010922524.1
申请日:2020-09-04
申请人: 恒睿(重庆)人工智能技术研究院有限公司
IPC分类号: G06F40/211 , G06F40/126 , G06F16/35
摘要: 本发明提供一种成分句法分析方法、装置、设备及介质,所述的方法包括:包括:原始文本进行编码处理获取映射编码,并从所述映射编码中获取一种或者多种候选短语片段;对所述候选短语片段进行成分句法处理获取成分句法树,所述成分句法树的每个节点至少承载一个所述候选短语片段。将原始文本进行编码处理获取映射编码,并获取候选短语片段,该候选短语片段的形式包括一种或者多种,通过任意截取映射编码获取候选短语片段,判断候选短语片段是否为有成分,获取成分句法树,从而实现成分句法分析,避免截取每个字(或单词)或者字符需要相互独立预测,进而避免产生合并短语出现矛盾的问题。