-
公开(公告)号:CN118796966A
公开(公告)日:2024-10-18
申请号:CN202411096264.1
申请日:2024-08-12
Applicant: 清华大学深圳国际研究生院 , 北京三快在线科技有限公司
IPC: G06F16/29 , G06F18/241 , G06N3/04 , G06N3/08
Abstract: 本发明提出一种用于神经网络训练的大规模POI数据处理和加载方法,包括以下步骤:S1:定义基本参数;S2:辅助文件构建;S3:数据加载,即为系统实际使用时的工作过程,对步骤S1中的辅助文件进行逐步解析以得到结果。采用本方法,POI相关数据的处理高效且磁盘和内存占用低;随机读取高效,复杂度为O(1),内存占用低;分割为训练、验证和测试集的过程高效、计算资源消耗低。
-
公开(公告)号:CN117609542A
公开(公告)日:2024-02-27
申请号:CN202311642680.2
申请日:2023-12-04
Applicant: 清华大学深圳国际研究生院 , 美团科技有限公司
IPC: G06F16/583 , G06N3/0442 , G06N3/08
Abstract: 本发明公开了一种视觉叙事文本生成方法及设备,该方法包括步骤:S1:使用构建好的视觉叙事模型提取图像序列中的图像特征;S2:建模所述图像序列间的关系并得到隐状态表示向量;S3:将所述图像特征和隐状态向量表示联合表示为图像序列背景信息;S4:所述视觉叙事模型根据所述图像序列背景信息和图像序列语言信息预测视觉叙事词语,生成视觉叙事文本。本发明能够提高视觉叙事词语的预测效果,从而使文本的句子之间具有较好的衔接性,能够构成一个流畅的故事,语言上期望生成的句子有更丰富的用词和更好的可读性。
-