一种基于人工智能的公文文档校验方法及系统

    公开(公告)号:CN118709682A

    公开(公告)日:2024-09-27

    申请号:CN202411198857.9

    申请日:2024-08-29

    发明人: 陆文捷

    摘要: 本发明公开了一种基于人工智能的公文文档校验方法及系统,涉及文档校验技术领域,该方法通过解析并转换不同格式的文档为统一文本格式,利用自然语言处理技术对文本分块,人工智能识别模型捕捉上下文关系,生成文本特征向量H,并结合源数据Metadata,获取源数据特征向量M,随后,结合文本和源数据特征向量生成综合特征向量F,使用孤立森林算法法进行异常检测,获取异常得分A,提高了敏感信息识别的准确性。通过综合计算获取文档敏感风险评分R,并根据文本序列计算动态调整的风险阈值O,确保识别的精确性和实时性。最终,通过对比评估生成校验报告,完成敏感信息检测和风险评估,提供详细的报告和处理建议,实现文档的全方位管理。