一种面向医疗文本的实体及关系标注系统
摘要:
本发明公开了一种面向医疗文本的实体及关系标注平台,平台集成了多种预处理算法对待标注文本进行预处理。同时,通过基于规则和基于深度学习的方法,进行命名实体识别,对待标注文本进行预标注。平台可以对标注任务进行进度把控,实时显示多轮标注进度。标注完成的文件以JSON格式存储其实体及关系偏移量和原始文本,并生成标注对比报告来对任务进行质量控制。本标注平台融合多种算法,拥有进度控制和质量把控功能,使人工的标注效率得到了有效提升,保证了构建完成的语料库质量。
公开/授权文献
0/0