-
公开(公告)号:CN113673241B
公开(公告)日:2024-04-09
申请号:CN202110885791.0
申请日:2021-08-03
IPC: G06F40/289 , G06F40/211 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于范例学习的文本摘要生成框架及方法,允许在摘要生成的过程中参考一些写作范例,框架包括检索和生成两个阶段,检索阶段,给定一个文本,使用对比学习去数据库中检索一些范例,假定越好的摘要在语义空间应该和原文离得更近,检索器的模型使用了孪生网络的结构;生成阶段,提出了一种结合范例进行摘要生成的方法,可以方便的加在目前所有主流的条件生成模型上,为了更好的学习范例,将待生成的摘要和范例摘要按照句子对齐;通过训练好的模型进行预测,即解码阶段,使用集束搜索算法并鼓励那些和范例更相似的束。
-
公开(公告)号:CN116451808A
公开(公告)日:2023-07-18
申请号:CN202310451948.8
申请日:2023-04-23
IPC: G06N20/00 , G06V10/40 , G06F40/226 , G06F40/194
Abstract: 本说明书公开了一种模型训练的方法、装置、存储介质及电子设备,获取图文对和翻译文本对,将图文对中的描述文本和翻译文本对包含的两种语言文本输入到预设的视觉语言模型中的文本特征提取层中,以通过文本特征提取层得到描述文本和两种语言文本的文本特征,并将图文对中的图像输入到视觉语言模型中的图像特征提取层中,以通过图像特征提取层得到图像的图像特征。根据图文对中图像的图像特征与描述文本的文本特征,以及翻译文本对中包含的两种语言文本的文本特征,确定目标损失;根据目标损失,对视觉语言模型进行训练。
-
公开(公告)号:CN113673241A
公开(公告)日:2021-11-19
申请号:CN202110885791.0
申请日:2021-08-03
IPC: G06F40/289 , G06F40/211 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于范例学习的文本摘要生成框架及方法,允许在摘要生成的过程中参考一些写作范例,框架包括检索和生成两个阶段,检索阶段,给定一个文本,使用对比学习去数据库中检索一些范例,假定越好的摘要在语义空间应该和原文离得更近,检索器的模型使用了孪生网络的结构;生成阶段,提出了一种结合范例进行摘要生成的方法,可以方便的加在目前所有主流的条件生成模型上,为了更好的学习范例,将待生成的摘要和范例摘要按照句子对齐;通过训练好的模型进行预测,即解码阶段,使用集束搜索算法并鼓励那些和范例更相似的束。
-
公开(公告)号:CN116468096A
公开(公告)日:2023-07-21
申请号:CN202310362160.X
申请日:2023-03-30
IPC: G06N3/08 , G06F18/214 , G06F18/22 , G06Q30/0601
Abstract: 本说明书公开了一种模型训练方法、装置、设备及可读存储介质,基于共同发起业务的关系构建第一训练样本组,基于各用户针对各业务的指定行为构建第二训练样本组。根据各用户的言论文本、各业务、第一训练样本组和第二训练样本组训练特征提取模型,之后,根据训练完成的特征提取模型、所述第三训练样本和所述第三训练样本的标注,训练待训练的预测模型。可见,通过构建第一训练样本组和第二训练样本组,结合用户的言论文本以训练特征提取模型的方案,针对用户从未执行过的业务,也可以有效地从用户的言论文本中提取得到用于表征用户对于执行不同类型的业务的态度和立场的用户特征,从而提高预测准确率。
-
公开(公告)号:CN116451808B
公开(公告)日:2024-02-13
申请号:CN202310451948.8
申请日:2023-04-23
IPC: G06N20/00 , G06V10/40 , G06F40/226 , G06F40/194
Abstract: 本说明书公开了一种模型训练的方法、装置、存储介质及电子设备,获取图文对和翻译文本对,将图文对中的描述文本和翻译文本对包含的两种语言文本输入到预设的视觉语言模型中的文本特征提取层中,以通过文本特征提取层得到描述文本和两种语言文本的文本特征,并将图文对中的图像输入到视觉语言模型中的图像特征提取层中,以通过图像特征提取层得到图像的图像特征。根据图文对中图像的图像特征与描述文本的文本特征,以及翻译文本对中包含的两种语言文本的文本特征,确定目标损失;根据目标损失,对视觉语言模型进行训练。
-
-
公开(公告)号:CN116028069A
公开(公告)日:2023-04-28
申请号:CN202310111355.7
申请日:2023-02-07
Applicant: 之江实验室
Abstract: 本说明书公开了一种模型部署的方法、装置、存储介质及电子设备。所述模型部署的方法包括:获取目标模型以及目标模型对应的配置文件,确定用于部署所述目标模型的目标设备,并在所述目标设备中创建用于部署所述目标模型的目标系统,根据所述配置文件,从指定的环境信息库中获取所述目标模型所需运行环境的数据包,基于所述数据包,在所述目标系统中创建所述目标模型所需的运行环境,根据所述目标系统中创建所述目标模型所需的运行环境,在所述目标系统中部署所述目标模型,以通过部署后的目标模型执行业务。
-
公开(公告)号:CN115311608B
公开(公告)日:2023-03-21
申请号:CN202211238639.4
申请日:2022-10-11
Applicant: 之江实验室
Abstract: 本发明公开一种多任务多目标关联追踪的方法及装置,该方法包括:步骤一,通过系统后台加载视频流地址或采用摄像头实时采集场景的视频流数据,并对视频进行编解码、抽帧、预处理操作;步骤二,利用目标检测模型对视频的图像数据进行实时推理,获取场景中人员和目标物体的检测结果数据;步骤三,通过人员目标追踪方法,对人员检测结果进行跟踪,获取人员进入场景和离开场景的时间,确定检测单位时间段;步骤四,判断人员停留在场景的时间段内,是否检测到目标物体,如果未检测到目标物体,将返回报警信息给平台端。本发明实现了在多人员和多目标的复杂场景,使用人工智能的方式进行智能检测,减少了人为因素的干扰,并且节约了人工成本。
-
公开(公告)号:CN112241455A
公开(公告)日:2021-01-19
申请号:CN202011498328.2
申请日:2020-12-17
Applicant: 之江实验室
Abstract: 本发明公开了一种基于多层级知识蒸馏的预训练语言模型自动压缩方法及平台,所述方法包括如下步骤:步骤一、构建多层级知识蒸馏,在自注意力单元、隐藏层状态、嵌入层三个不同层级上蒸馏大模型的知识结构;步骤二、训练元学习的知识蒸馏网络,生成多种预训练语言模型的通用压缩架构;步骤三、基于进化算法搜索最佳压缩结构。首先,研究基于元学习的知识蒸馏生成多种预训练语言模型的通用压缩架构;其次,在已训练好的元学习网络基础上,通过进化算法搜索最佳压缩结构,由此得到与任务无关的预训练语言模型的最优通用压缩架构。
-
公开(公告)号:CN117219055A
公开(公告)日:2023-12-12
申请号:CN202311423804.8
申请日:2023-10-27
Applicant: 之江实验室
IPC: G10L13/10 , G10L13/027 , G10L25/03 , G10L25/90
Abstract: 本说明书公开了一种基于音色分离的语音生成方法、装置、介质及设备。所述方法包括:获取目标文本以及目标对象的参考语音;将目标文本输入预先训练的语义特征提取模型,以通过语义表征模型,确定目标文本对应的语义特征,以及,将参考语音输入预先训练的语音风格提取模型,以通过语音风格提取模型,确定参考语音对应的语音风格特征;将语义特征以及语音风格特征输入预先训练的语音生成模型,以通过语音生成模型,根据语义特征,将目标文本转换为具有语音风格特征所对应的语音风格信息的目标语音。
-
-
-
-
-
-
-
-
-