-
公开(公告)号:CN118036603A
公开(公告)日:2024-05-14
申请号:CN202410140184.5
申请日:2024-01-31
Applicant: 中国电信股份有限公司
IPC: G06F40/289 , G06F40/284 , G06F40/268 , G06F40/237 , G06F18/22
Abstract: 本发明公开了一种分词方法、装置、非易失性存储介质及电子设备。其中,该方法包括:获取包括多个目标单词的待分词文本;根据预设词表为每个目标单词添加对应的目标标签,得到目标标签队列,其中,目标标签队列包括:按照目标顺序排列的多个目标标签,目标顺序为每个目标标签对应的目标单词在待分词文本中的排列顺序;根据预设标签字典中预先配置的目标分词规则,将目标标签队列拆分为多个目标子标签队列;将每个目标子标签队列中的目标标签转换为对应的目标单词,得到目标分词文本。本发明解决了现有技术无法将复杂句式进行准确分词的技术问题。