-
公开(公告)号:CN113051886B
公开(公告)日:2023-12-01
申请号:CN202110319525.1
申请日:2021-03-25
Applicant: 科大讯飞股份有限公司
IPC: G06F40/194 , G06F40/284 , G06F40/30 , G06F16/31 , G06F16/33 , G06F16/332 , G06Q50/20
Abstract: 本申请公开了一种试题查重方法、装置、存储介质及设备,该方法包括:首先,获取待查重的目标试题的隐向量;其中,隐向量用于表征目标试题的语义信息,然后,利用预先构建的HNSW试题查重模型,根据目标试题的隐向量,从试题库中选取满足预设初选条件的试题,组成目标试题的初选重复试题集合;接着,根据初选重复试题集合中的试题与目标试题的相似度,从初选重复试题集合中确定目标试题对应的重复试题。可见,由于本申请是基于表征试题语义信息的隐向量进行查重,不仅能够支持部分文档更新后的查重,还能够提高查重结果的准确性。同时,利用HNSW试题查重模型进行查重,也能够进一步提高试题查重速度和效率,得到准确性更高的试题查重结果。
-
公开(公告)号:CN113051886A
公开(公告)日:2021-06-29
申请号:CN202110319525.1
申请日:2021-03-25
Applicant: 科大讯飞股份有限公司
IPC: G06F40/194 , G06F40/284 , G06F40/30 , G06F16/31 , G06F16/33 , G06F16/332 , G06Q50/20
Abstract: 本申请公开了一种试题查重方法、装置、存储介质及设备,该方法包括:首先,获取待查重的目标试题的隐向量;其中,隐向量用于表征目标试题的语义信息,然后,利用预先构建的HNSW试题查重模型,根据目标试题的隐向量,从试题库中选取满足预设初选条件的试题,组成目标试题的初选重复试题集合;接着,根据初选重复试题集合中的试题与目标试题的相似度,从初选重复试题集合中确定目标试题对应的重复试题。可见,由于本申请是基于表征试题语义信息的隐向量进行查重,不仅能够支持部分文档更新后的查重,还能够提高查重结果的准确性。同时,利用HNSW试题查重模型进行查重,也能够进一步提高试题查重速度和效率,得到准确性更高的试题查重结果。
-