-
公开(公告)号:CN107391671A
公开(公告)日:2017-11-24
申请号:CN201710600710.1
申请日:2017-07-21
Applicant: 华中科技大学
IPC: G06F17/30
Abstract: 本发明公开了一种文档泄露检测方法及系统,将企业内部文档构建倒排索引文件,通过相同词语检索可能存在相似的句子,然后对这些句子中的词语进行word2vec词向量的映射,通过词向量之间的相似度计算句子之间的相似度,从而判定文档是否属于泄露信息。本发明通过对企业内部的文本进行倒排索引,提高文本检索效率;通过对文档中的词语进行词向量映射,能够更加准确的计算两个句子之间相似度,从而更加准确的判定是否属于泄露文档,从而可以帮助管理员控制那些企业内部员工可以发送的文档,同时也可以帮助企业保护内部机密文档的安全,提高企业竞争力,避免因内部机密文档泄漏给企业带来的重大损失。
-
公开(公告)号:CN107391671B
公开(公告)日:2019-11-26
申请号:CN201710600710.1
申请日:2017-07-21
Applicant: 华中科技大学
Abstract: 本发明公开了一种文档泄露检测方法及系统,将企业内部文档构建倒排索引文件,通过相同词语检索可能存在相似的句子,然后对这些句子中的词语进行word2vec词向量的映射,通过词向量之间的相似度计算句子之间的相似度,从而判定文档是否属于泄露信息。本发明通过对企业内部的文本进行倒排索引,提高文本检索效率;通过对文档中的词语进行词向量映射,能够更加准确的计算两个句子之间相似度,从而更加准确的判定是否属于泄露文档,从而可以帮助管理员控制那些企业内部员工可以发送的文档,同时也可以帮助企业保护内部机密文档的安全,提高企业竞争力,避免因内部机密文档泄漏给企业带来的重大损失。
-