发明公开
CN112052664A 一种成分句法分析方法、装置、设备及介质
无效 - 驳回
- 专利标题: 一种成分句法分析方法、装置、设备及介质
-
申请号: CN202010922524.1申请日: 2020-09-04
-
公开(公告)号: CN112052664A公开(公告)日: 2020-12-08
- 发明人: 姚志强 , 周曦 , 袁哲 , 郝东 , 温喆
- 申请人: 恒睿(重庆)人工智能技术研究院有限公司
- 申请人地址: 重庆市渝北区金开大道西段106号5-1、5-2
- 专利权人: 恒睿(重庆)人工智能技术研究院有限公司
- 当前专利权人: 恒睿(重庆)人工智能技术研究院有限公司
- 当前专利权人地址: 重庆市渝北区金开大道西段106号5-1、5-2
- 代理机构: 上海光华专利事务所
- 代理商 代玲
- 主分类号: G06F40/211
- IPC分类号: G06F40/211 ; G06F40/126 ; G06F16/35
摘要:
本发明提供一种成分句法分析方法、装置、设备及介质,所述的方法包括:包括:原始文本进行编码处理获取映射编码,并从所述映射编码中获取一种或者多种候选短语片段;对所述候选短语片段进行成分句法处理获取成分句法树,所述成分句法树的每个节点至少承载一个所述候选短语片段。将原始文本进行编码处理获取映射编码,并获取候选短语片段,该候选短语片段的形式包括一种或者多种,通过任意截取映射编码获取候选短语片段,判断候选短语片段是否为有成分,获取成分句法树,从而实现成分句法分析,避免截取每个字(或单词)或者字符需要相互独立预测,进而避免产生合并短语出现矛盾的问题。