用于特殊公文的大模型生成数据可靠性检测方法及系统
摘要:
本发明涉及数据处理技术领域,具体涉及用于特殊公文的大模型生成数据可靠性检测方法及系统。方法包括:获取会议内容和利用大模型生成的会议记录,并获取对应的词向量;分析会议内容的词向量与语料库中的词向量的相似情况,筛选直接相关词向量;结合直接相关词向量与非直接相关词向量之间的相似情况以及位置分布特征,筛选间接相关词向量;基于每种特征词向量对应的词语在文章中的相对位置关系以及出现的次数,得到每种特征词向量的核心程度值,特征词向量包括直接相关词向量和间接相关词向量;融合会议记录的每个词向量在语料库中出现的次数和核心程度值,对会议记录的可靠性进行评价。本发明提高了大模型生成数据可靠性检测结果的准确度。
0/0