数据生成方法及装置、电子设备和介质

    公开(公告)号:CN116992112A

    公开(公告)日:2023-11-03

    申请号:CN202310804597.4

    申请日:2023-06-30

    Abstract: 本公开提供了一种数据生成方法、装置、电子设备、计算机可读存储介质和计算机程序产品,涉及人工智能领域,尤其涉及深度学习、自然语言处理技术领域。实现方案为:获取与第一文档类型相对应的多个网页内容,第一文档类型与目标生成任务相对应;获取多个网页内容中每个网页内容的得分,以用于评价相应的网页内容的内容质量、时效性、权威性中的至少一者;基于得分对多个网页内容进行过滤,以获得得分超过预设阈值的至少一个网页内容;对于至少一个网页内容中的每一个:确定该网页内容对应的第二文档类型,第二文档类型为第一文档类型的子类型;以及基于第二文档类型,生成与该网页内容相对应的问题指令,该网页内容作为问题指令所对应的回答信息。

Patent Agency Ranking