-
公开(公告)号:CN116795972A
公开(公告)日:2023-09-22
申请号:CN202311010097.X
申请日:2023-08-11
Applicant: 之江实验室
IPC: G06F16/332 , G06F40/211 , G06F40/289 , G06F18/214 , G06F40/30 , G06F18/25 , G06N3/0499 , G06N3/084
Abstract: 本说明书公开了一种模型训练的方法、装置、存储介质及电子设备,将若干个独立表达句输入该模型的生成器,以得到融合句,并将该融合句加入训练数据集,将该训练数据集中的待判别句输入该模型的来源判别器,以确定待判别句是否为原始句的判别结果,根据该判别结果分别确定该来源判别器的来源判别损失及生成器的来源生成损失,根据该来源生成损失及该来源判别损失,对该模型进行训练,其中,该模型的生成器用于将回复用户的若干独立表达句进行融合。本方法通过对模型中的生成器和来源判别器进行对抗训练,以使生成器生成接近原始句的融合句,获得语序正常、内容衔接自然不生硬的句子,来源判别器更精准判断输入的句子是否为原始句。
-
公开(公告)号:CN115512003B
公开(公告)日:2023-04-28
申请号:CN202211430055.7
申请日:2022-11-16
Applicant: 之江实验室
IPC: G06T11/20 , G06V10/774 , G06V10/764 , G06V10/74 , G06T7/73
Abstract: 本发明属于计算机视觉领域,涉及一种独立关系检测的场景图生成方法和系统,该方法包括:步骤一,建立独立关系检测模型;步骤二,利用图像、图像对应的关系标签以及预定义方向锚训练所述独立关系检测模型,得到训练好的独立关系检测模型;步骤三,使用训练好的独立关系检测模型,输入图像和预定义方向锚,输出图像中存在的关系,对其中相似的关系采用相似关系抑制算法进行抑制;步骤四,同时将通过目标检测算法检测得到的物体包围框与所述输出图像中存在的关系的关系起始点和关系末端点进行位置匹配,得到 的三元组,构成场景图。本发明在不依靠目标检测结果的情况下就能对图像中的关系进行检测,提升了场景图生成的运算速度。
-
公开(公告)号:CN115329784B
公开(公告)日:2023-04-07
申请号:CN202211245822.7
申请日:2022-10-12
Applicant: 之江实验室
IPC: G06F40/58 , G06F40/30 , G06F40/247 , G06F40/205 , G06F16/35 , G06F18/22
Abstract: 本发明公开了基于预训练模型的句子复述生成系统,包括复述生成模块、流利度过滤模块和语义过滤模块,复述生成模块用于生成复述,复述生成模块包括翻译生成、模型生成和同义词替换生成模块,翻译生成模块通过直译和回译两种方法生成复述,模型生成模块通过直接训练中文复述生成模型生成复述和利用英文复述生成模型间接生成中文复述,同义词生成模块通过替换原句中的同义词生成复述,本发明充分利用开源的预训练模型资源,利用翻译模型进行直接翻译生成复述和回译生成复述,提高生成复述的效率和多样性,利用预训练的语言模型将英语复述生成模型应用到中文复述生成中,使用多项措施确保生成高质量复述。
-
公开(公告)号:CN115329784A
公开(公告)日:2022-11-11
申请号:CN202211245822.7
申请日:2022-10-12
Applicant: 之江实验室
IPC: G06F40/58 , G06F40/30 , G06F40/247 , G06F40/205 , G06F16/35 , G06K9/62
Abstract: 本发明公开了基于预训练模型的句子复述生成系统,包括复述生成模块、流利度过滤模块和语义过滤模块,复述生成模块用于生成复述,复述生成模块包括翻译生成、模型生成和同义词替换生成模块,翻译生成模块通过直译和回译两种方法生成复述,模型生成模块通过直接训练中文复述生成模型生成复述和利用英文复述生成模型间接生成中文复述,同义词生成模块通过替换原句中的同义词生成复述,本发明充分利用开源的预训练模型资源,利用翻译模型进行直接翻译生成复述和回译生成复述,提高生成复述的效率和多样性,利用预训练的语言模型将英语复述生成模型应用到中文复述生成中,使用多项措施确保生成高质量复述。
-
公开(公告)号:CN112712824A
公开(公告)日:2021-04-27
申请号:CN202110322720.X
申请日:2021-03-26
Applicant: 之江实验室
Abstract: 本发明属于人工智能领域,具体涉及一种融合人群信息的语音情感识别方法和系统,该方法包括以下步骤:S1、采集用户语音信号;S2、预处理语音信号,获取梅尔谱;S3、切除梅尔谱前后静音段;S4、通过人群分类网络获取深度人群信息;S5、通过梅尔谱预处理网络获取梅尔谱深度信息;S6、通过SENet融合特征,获取融合信息;S7、通过分类网络,得到情感识别结构。本发明融合人群信息特征,使情感特征提取更加准确,通过SENet的通道注意力机制进行信息融合,能够有效的进行深度特征的提取,提高整体识别精度。
-
公开(公告)号:CN117076650A
公开(公告)日:2023-11-17
申请号:CN202311328288.0
申请日:2023-10-13
Applicant: 之江实验室
IPC: G06F16/332 , G06F16/35 , G06F16/36 , G06N5/022 , G06N5/04
Abstract: 在本说明书提供的基于大语言模型的智能对话方法,根据用户输入的第一文本的分类结果,确定不同的对话方法,当用户输入的第一文本为非知识类文本时,将第一文本输入第三方大语言模型确定返回用户的目标文本。当用户输入的第一文本为知识类文本时,对第一文本进行本地搜索和线上搜索,再将第一文本和所有的搜索结果输入本地大语言模型,确定返回用户的目标文本,若不存在关联度大于预设值的检索结果,则将第一文本输入第三方大语言模型,将第三方大语言模型的输出结果作为返回用户的目标文本。通过在系统中融合若干个本地模型,减少了对第三方大语言模型的调用,降低了智能对话系统的使用成本的同时,也降低了智能对话过程的时延。
-
公开(公告)号:CN117034942A
公开(公告)日:2023-11-10
申请号:CN202311286040.2
申请日:2023-10-07
Applicant: 之江实验室
IPC: G06F40/295 , G06F40/216 , G06N3/0464 , G06N3/08
Abstract: 本说明书公开了一种命名实体识别方法、装置、设备及可读存储介质,将待识别文本输入预先训练的命名实体识别模型,通过字符特征提取模块确定待识别文本中各字符的字符特征向量,通过字符片段特征提取模块得到待识别文本中各字符片段的字符片段特征向量,根据所述待识别文本中各字符片段分别对应的字符片段特征向量,以及所述命名实体识别模型中二维条件随机场实体标签预测模块,确定所述待识别文本对应于各预设实体类别组合的条件概率,从而确定所述待识别文本包含的命名实体信息。可见,上述方案中,通过命名实体识别模型中二维条件随机场实体标签预测模块,能够有效识别待识别文本中的嵌套实体,从而提高实体识别的准确性。
-
公开(公告)号:CN116562303A
公开(公告)日:2023-08-08
申请号:CN202310810661.X
申请日:2023-07-04
Applicant: 之江实验室
IPC: G06F40/30 , G06F18/214 , G06F18/24 , G06N3/0499
Abstract: 本发明公开了一种参考外部知识的指代消解方法及装置,该方法首先输入句子训练提及识别模型,该模型标记出句子中的提及;输入指定两个或三个提及的句子拼接上提及对应的知识,训练关系分类模型判断指定提及中是否有共指关系,并标记出存在共指关系的提及。训练好模型后用于指代消解。本发明方法在参考外部知识进行指代消解的过程中,考虑了句子整体的语义信息。关系分类模型训练过程中,训练模型判断提及间是否存在共指关系,以及训练模型标记出存在共指关系的提及,并且输入有指代三个提及时,这种训练方法使得模型对提及和共指关系的理解更深刻,使模型有更强的指代消解能力。
-
公开(公告)号:CN115292469B
公开(公告)日:2023-02-07
申请号:CN202211186444.X
申请日:2022-09-28
Applicant: 之江实验室
IPC: G06F16/332 , G06F16/33 , G06F16/31 , G06F40/247 , G06F40/284 , G06F40/289
Abstract: 本发明属于自然语言处理领域,涉及一种结合段落搜索和机器阅读理解的问答方法,包括:步骤一,收集作为答案来源的文章,对文章进行文本段落切分,对切分后的文本段落做分词操作后再进行词扩展,得到新的文本段落,再对新的文本段落进行倒排索引的构建;步骤二,收集阅读理解模型的训练数据,训练阅读理解模型;步骤三,采用训练好的阅读理解模型接受用户输入的问句,将问句转换为倒排索引检索语句,并检索出候选段落,在每一个候选段落中找出若干小段文本作为候选答案,再通过判断所有候选答案和输入问句的相关性,选择最优答案。本发明可有效的提升在限定域中问句的回复率,同时提升回答所需数据集构建的效率,具有较好的实用性。
-
公开(公告)号:CN114625861B
公开(公告)日:2022-09-06
申请号:CN202210508811.7
申请日:2022-05-11
Applicant: 之江实验室
IPC: G06F16/332 , G06F16/31 , G06F16/215 , G06F40/205
Abstract: 本发明公开了改进Transformer融入知识的端到端对话方法,首先收集以对话和知识组成的二元组,将该二元组作为训练数据;对训练数据进行清洗,将训练数据组成包括对话、知识和回复的三元组形式,并对该三元组进行预处理;构建由编码运算模块、知识解码器运算模块和解码器运算模块组成的改进的Transformer模型;利用训练数据与三元组训练改进的Transformer模型,并保存;将以对话和知识组成的二元组输入训练好的改进的Transformer模型中,模型预测输出回复结果;用户对模型输出的回复结果进行回复后,将模型输出的回复结果和用户回复拼接到对话记录串中,并选取新的知识输入训练好的改进的Transformer模型中持续进行端到端对话。该方法充分利用Transformer模型结构将知识细致融合用于生成对话。
-
-
-
-
-
-
-
-
-