-
公开(公告)号:CN118709682A
公开(公告)日:2024-09-27
申请号:CN202411198857.9
申请日:2024-08-29
申请人: 上海银行股份有限公司
发明人: 陆文捷
IPC分类号: G06F40/226 , G06F40/151 , G06F16/35 , G06F16/33 , G06F18/213 , G06F18/245 , G06F18/243 , G06N20/20 , G06N3/0455 , G06N3/0442 , G06N3/08 , G06N3/0499
摘要: 本发明公开了一种基于人工智能的公文文档校验方法及系统,涉及文档校验技术领域,该方法通过解析并转换不同格式的文档为统一文本格式,利用自然语言处理技术对文本分块,人工智能识别模型捕捉上下文关系,生成文本特征向量H,并结合源数据Metadata,获取源数据特征向量M,随后,结合文本和源数据特征向量生成综合特征向量F,使用孤立森林算法法进行异常检测,获取异常得分A,提高了敏感信息识别的准确性。通过综合计算获取文档敏感风险评分R,并根据文本序列计算动态调整的风险阈值O,确保识别的精确性和实时性。最终,通过对比评估生成校验报告,完成敏感信息检测和风险评估,提供详细的报告和处理建议,实现文档的全方位管理。