- 专利标题: 一种基于机器识别的word文档转换方法、装置及存储介质
-
申请号: CN202310639865.1申请日: 2023-06-01
-
公开(公告)号: CN116340263B公开(公告)日: 2023-08-29
- 发明人: 陈德勇 , 李元海
- 申请人: 北京无忧创想信息技术有限公司
- 申请人地址: 北京市海淀区中关村南一条甲一号2号楼602A
- 专利权人: 北京无忧创想信息技术有限公司
- 当前专利权人: 北京无忧创想信息技术有限公司
- 当前专利权人地址: 北京市海淀区中关村南一条甲一号2号楼602A
- 代理机构: 成都顶峰专利事务所
- 代理商 王袁辉
- 主分类号: G06F16/11
- IPC分类号: G06F16/11 ; G06F16/16 ; G06F8/73
摘要:
本发明公开了一种基于机器识别的word文档转换方法、装置及存储介质,本发明在进行文档转换时,对格式转换后的文档进行了样式修正处理,如此,可保留原word文档中的文本样式;同时,利用机器识别技术,来对样式修正后的各个文本段落进行代码种类识别,以基于各个文本段落的代码种类,来进行编程语言标识;由此,本发明在文档转换时,可保留原文本中的文本样式,且能够准确识别出文档中的代码块文本,以及所属的编程语言,由此,使得用户不用重复的复制粘贴、重新编写代码以及重新设置文本样式,可实现各类技术文章的快速发布,适用于在文档转换领域的广泛应用与推广。
公开/授权文献
- CN116340263A 一种基于机器识别的word文档转换方法、装置及存储介质 公开/授权日:2023-06-27