发明授权
- 专利标题: 文本切分方法、装置及计算机设备
-
申请号: CN202110895881.8申请日: 2021-08-05
-
公开(公告)号: CN113609860B公开(公告)日: 2023-09-19
- 发明人: 刘勃 , 黄云峰 , 周冬梅 , 肖德凡
- 申请人: 湖南特能博世科技有限公司
- 申请人地址: 湖南省长沙市高新开发区麓谷大道662号软件大楼135号
- 专利权人: 湖南特能博世科技有限公司
- 当前专利权人: 湖南特能博世科技有限公司
- 当前专利权人地址: 湖南省长沙市高新开发区麓谷大道662号软件大楼135号
- 代理机构: 北京超凡宏宇知识产权代理有限公司
- 代理商 梁韬
- 主分类号: G06F40/295
- IPC分类号: G06F40/295 ; G06F40/284 ; G06F40/205 ; G06F16/35 ; G06N20/00
摘要:
本发明实施例公开了一种文本切分方法、装置及计算机设备,所述方法包括:接收待切分的文本;将所述文本输入文本单元切分模型,输出文本单元;判断各文本单元的末尾字符类型;若文本单元的末尾字符类型为数词,则将所述文本单元输入量词添加模型,在所述文本单元的末尾字符后添加量词后作为一文本切分结果输出;若文本单元的末尾字符类型不是数词,则直接将所述文本单元作为一文本切分结果输出。通过上述方法,能够实现对文本单元的精准切分,对于省略量词的文本单元也能进行精准识别;仅需要训练模型使其自动进行文本单元识别切分,无需设置复杂的规则对文本单元进行切分,简化了操作流程。
公开/授权文献
- CN113609860A 文本切分方法、装置及计算机设备 公开/授权日:2021-11-05