-
公开(公告)号:CN119538082A
公开(公告)日:2025-02-28
申请号:CN202411326340.3
申请日:2024-09-23
Applicant: 淮阴工学院
IPC: G06F18/2415 , G06F18/22 , G06F18/214 , G06F40/216 , G06F40/284 , G06N3/0464
Abstract: 本专利公开发明了一种基于用户历史数据的多维度生成文本检测方法。首先,对已分类的用户历史文本数据进行分词和合并连续词处理,并应用N‑gram算法来计算各个文本类别的频次概率分布数据集。接着,利用卷积神经网络算法对待检测的文本进行文本分类和相似性计算,设定相似度阈值以获得不同类型文本的相似度数据,并确定待检测内容的文本类型分类结果。最后,基于不同文本类型下的N‑gram模型预测结果,对待检测文本在提交时的多维度数据进行处理,将其加权计算,从而获得最终的文本生成概率结果。本发明方法有效评估待检测文本的生成概率,提供了一种用于衡量用户文本内容原创性的方法,显著提升了文本生成检测的效率和准确性。