发明公开
- 专利标题: 用于特殊公文的大模型生成数据可靠性检测方法及系统
-
申请号: CN202411105833.4申请日: 2024-08-13
-
公开(公告)号: CN118643803A公开(公告)日: 2024-09-13
- 发明人: 韩涵 , 王甫宁 , 何江 , 谢开浪 , 马文龙 , 陈善君 , 夏暄
- 申请人: 北京中数睿智科技有限公司
- 申请人地址: 北京市海淀区知春路23号10层1014室
- 专利权人: 北京中数睿智科技有限公司
- 当前专利权人: 北京中数睿智科技有限公司
- 当前专利权人地址: 北京市海淀区知春路23号10层1014室
- 代理机构: 北京艾格律诗专利代理有限公司
- 代理商 宋杰
- 主分类号: G06F40/16
- IPC分类号: G06F40/16 ; G06F40/194 ; G06N5/04 ; G06F18/21 ; G06N3/045 ; G06N3/0475
摘要:
本发明涉及数据处理技术领域,具体涉及用于特殊公文的大模型生成数据可靠性检测方法及系统。方法包括:获取会议内容和利用大模型生成的会议记录,并获取对应的词向量;分析会议内容的词向量与语料库中的词向量的相似情况,筛选直接相关词向量;结合直接相关词向量与非直接相关词向量之间的相似情况以及位置分布特征,筛选间接相关词向量;基于每种特征词向量对应的词语在文章中的相对位置关系以及出现的次数,得到每种特征词向量的核心程度值,特征词向量包括直接相关词向量和间接相关词向量;融合会议记录的每个词向量在语料库中出现的次数和核心程度值,对会议记录的可靠性进行评价。本发明提高了大模型生成数据可靠性检测结果的准确度。