数据集生成、语义匹配和语义匹配模型训练方法和装置

    公开(公告)号:CN117274745A

    公开(公告)日:2023-12-22

    申请号:CN202311258876.1

    申请日:2023-09-26

    Applicant: 复旦大学

    Abstract: 本申请公开了一种数据集生成、语义匹配和语义匹配模型训练方法和装置,应用于客户端,其中,数据集生成方法包括:确定第一数据集,第一数据集包括多个第一图像对,各第一图像对具有对应的类别信息;将第一数据集输入至数据集处理模型,由数据集处理模型根据第一数据集进行数据集生成处理,得到第二数据集,第二数据集包括多个第二图像对,各第二图像对具有对应的像素级标签,像素级标签基于第一图像对的类别信息得到,并且像素级标签用于表示第二图像对的像素级匹配关系。由此,有效地简化了对数据集进行大量标注以得到满足要求的数据集的处理过程,节省了人工成本,并且使得基于数据集训练得到的语义匹配模型具有更强的泛化能力和准确性。

Patent Agency Ranking