-
公开(公告)号:CN117076650B
公开(公告)日:2024-02-23
申请号:CN202311328288.0
申请日:2023-10-13
Applicant: 之江实验室
IPC: G06F16/332 , G06F16/35 , G06F16/36 , G06N5/022 , G06N5/04
Abstract: 在本说明书提供的基于大语言模型的智能对话方法,根据用户输入的第一文本的分类结果,确定不同的对话方法,当用户输入的第一文本为非知识类文本时,将第一文本输入第三方大语言模型确定返回用户的目标文本。当用户输入的第一文本为知识类文本时,对第一文本进行本地搜索和线上搜索,再将第一文本和所有的搜索结果输入本地大语言模型,确定返回用户的目标文本,若不存在关联度大于预设值的检索结果,则将第一文本输入第三方大语言模型,将第三方大语言模型的输出结果作为返回用户的目标文本。通过在系统中融合若干个本地模型,减少了对第三方大语言模型的调用,降低了智能对话系统的使用成本的同时,也降低了智能对话过程的时延。
-
公开(公告)号:CN117573845A
公开(公告)日:2024-02-20
申请号:CN202410054169.9
申请日:2024-01-15
Applicant: 之江实验室
IPC: G06F16/332 , G06F40/30 , G06F40/289 , G06F18/213 , G06F18/25
Abstract: 本发明公开了一种面向跨领域人机协同作业的机器人自然语言理解方法。该方法包括人机协同作业领域/意图/槽位标签及关系定义、数据集构建、自然语言通用理解模型构建和参数学习、自然语言理解场景模型构建和参数学习、利用模型进行在线预测等过程。通过定义具体领域中通用槽位标签与专用槽位标签之间的对应关系,以及场景特征描述和人物特征描述,实现对用户意图的识别和对应槽位信息的识别,增强了自然语言理解模型的跨领域泛化能力。本发明所构建的机器人自然语言理解场景模型具备处理多模态输入数据的能力,且在模型参数学习过程中,增加了对模型稳定性的度量,有效提高了自然语言理解的准确率、降低了误识别率。
-
公开(公告)号:CN116884000A
公开(公告)日:2023-10-13
申请号:CN202310837433.1
申请日:2023-07-10
Applicant: 之江实验室
IPC: G06V20/70 , G06V10/74 , G06V10/764 , G06V10/25
Abstract: 本发明公开了一种基于视觉语言与关系检测的关系指代表达理解方法和装置,包括:将关系指代表达分解为参考物体、参考关系和指代物体;利用目标检测算法得到场景图像中的候选实体;利用视觉语言模型分别计算参考物体和指代物体的语言特征与候选实体的视觉特征之间的相似度,得到参考物体相似度和指代物体相似度;利用关系检测算法计算候选实体之间的在参考关系的关系类别上的参考关系概率;由参考物体相似度、指代物体相似度和参考关系概率建立邻接表;依据邻接表计算参考物体相似度、指代物体相似度和参考关系概率的综合概率,由综合概率最高值确定关系指代表达理解的实体。本发明适用于提高服务机器人在关系指代表达理解方面的人机交互能力。
-
公开(公告)号:CN115858811A
公开(公告)日:2023-03-28
申请号:CN202211609449.9
申请日:2022-12-14
Applicant: 之江实验室
IPC: G06F16/36 , G06F18/22 , G06F18/214 , G06F40/295 , G06F40/30 , G06F16/35 , G06F18/25 , G06F16/31 , G06N3/0455 , G06N3/0464
Abstract: 本发明公开了一种基于知识图谱的中文易混词生成方法。该方法包括中文词知识图谱的本体设计、中文文本数据的预处理过程、中文词对在语义/字音/字形等方面的相似性计算过程、知识图谱实例化过程、用户输入文本的预处理过程、与用户输入文本相对应的知识图谱子图抽取过程以及以多源异构数据为输入的中文易混词生成过程等。本发明可从发音、字形、语义等多方面刻画中文词对的相似性,并能结合文本的领域和主题信息,实现跨领域中文易混淆词的准确生成。
-
公开(公告)号:CN115292469A
公开(公告)日:2022-11-04
申请号:CN202211186444.X
申请日:2022-09-28
Applicant: 之江实验室
IPC: G06F16/332 , G06F16/33 , G06F16/31 , G06F40/247 , G06F40/284 , G06F40/289
Abstract: 本发明属于自然语言处理领域,涉及一种结合段落搜索和机器阅读理解的问答方法,包括:步骤一,收集作为答案来源的文章,对文章进行文本段落切分,对切分后的文本段落做分词操作后再进行词扩展,得到新的文本段落,再对新的文本段落进行倒排索引的构建;步骤二,收集阅读理解模型的训练数据,训练阅读理解模型;步骤三,采用训练好的阅读理解模型接受用户输入的问句,将问句转换为倒排索引检索语句,并检索出候选段落,在每一个候选段落中找出若干小段文本作为候选答案,再通过判断所有候选答案和输入问句的相关性,选择最优答案。本发明可有效的提升在限定域中问句的回复率,同时提升回答所需数据集构建的效率,具有较好的实用性。
-
公开(公告)号:CN114610861B
公开(公告)日:2022-08-26
申请号:CN202210508804.7
申请日:2022-05-11
Applicant: 之江实验室
IPC: G06F16/332 , G06F16/33 , G06F16/35 , G06F40/30 , G06N3/04
Abstract: 本发明公开了基于变分自编码器的融入知识和感情的端到端对话方法,所述方法包括:采集情感标签、对话、知识和回复,并进行预处理作为训练数据;搭建由变分自编码器模块和拷贝模块组成的模型,并进行训练;预处理测试数据,将测试数据输入训练好的模型中进行预测,得到回复,持续进行端到端对话。变分自编码器模块的编码模块编码情感标签和输入对话的语义信息。变分自编码器模块的解码模块融入知识和情感用于生成内容。拷贝模块结合解码器生成的内容、输入的对话和知识生成回复输出。本发明方法采用变分自编码器结构以生成丰富的回复;引入情感标签用于控制回复的情感类型;从输入对话和知识中拷贝信息,使生成回复兼具丰富性和可控性。
-
公开(公告)号:CN112712824B
公开(公告)日:2021-06-29
申请号:CN202110322720.X
申请日:2021-03-26
Applicant: 之江实验室
Abstract: 本发明属于人工智能领域,具体涉及一种融合人群信息的语音情感识别方法和系统,该方法包括以下步骤:S1、采集用户语音信号;S2、预处理语音信号,获取梅尔谱;S3、切除梅尔谱前后静音段;S4、通过人群分类网络获取深度人群信息;S5、通过梅尔谱预处理网络获取梅尔谱深度信息;S6、通过SENet融合特征,获取融合信息;S7、通过分类网络,得到情感识别结构。本发明融合人群信息特征,使情感特征提取更加准确,通过SENet的通道注意力机制进行信息融合,能够有效的进行深度特征的提取,提高整体识别精度。
-
公开(公告)号:CN117573845B
公开(公告)日:2024-05-24
申请号:CN202410054169.9
申请日:2024-01-15
Applicant: 之江实验室
IPC: G06F16/332 , G06F40/30 , G06F40/289 , G06F18/213 , G06F18/25
Abstract: 本发明公开了一种面向跨领域人机协同作业的机器人自然语言理解方法。该方法包括人机协同作业领域/意图/槽位标签及关系定义、数据集构建、自然语言通用理解模型构建和参数学习、自然语言理解场景模型构建和参数学习、利用模型进行在线预测等过程。通过定义具体领域中通用槽位标签与专用槽位标签之间的对应关系,以及场景特征描述和人物特征描述,实现对用户意图的识别和对应槽位信息的识别,增强了自然语言理解模型的跨领域泛化能力。本发明所构建的机器人自然语言理解场景模型具备处理多模态输入数据的能力,且在模型参数学习过程中,增加了对模型稳定性的度量,有效提高了自然语言理解的准确率、降低了误识别率。
-
公开(公告)号:CN117034942B
公开(公告)日:2024-01-09
申请号:CN202311286040.2
申请日:2023-10-07
Applicant: 之江实验室
IPC: G06F40/295 , G06F40/216 , G06N3/0464 , G06N3/08
Abstract: 本说明书公开了一种命名实体识别方法、装置、设备及可读存储介质,将待识别文本输入预先训练的命名实体识别模型,通过字符特征提取模块确定待识别文本中各字符的字符特征向量,通过字符片段特征提取模块得到待识别文本中各字符片段的字符片段特征向量,根据所述待识别文本中各字符片段分别对应的字符片段特征向量,以及所述命名实体识别模型中二维条件随机场实体标签预测模块,确定所述待识别文本对应于各预设实体类别组合的条件概率,从而确定所述待识别文本包含的命名实体信息。可见,上述方案中,通过命名实体识别模型中二维条件随机场实体标签预测模块,能够有效识别待识别文本中的嵌套实体,从而提高实体识别的准确性。
-
公开(公告)号:CN117171346A
公开(公告)日:2023-12-05
申请号:CN202311153257.6
申请日:2023-09-07
Applicant: 之江实验室
IPC: G06F16/35 , G06F16/33 , G06F40/295 , G06F40/30
Abstract: 本说明书公开了一种实体链接方法、装置、存储介质及电子设备。所述实体链接方法包括:获取待链接文本、待链接文本中包含的各实体提及,根据预先确定的实体提及与实体之间的映射关系表,确定待链接文本中包含的每个实体提及对应的候选实体,将待链接文本、待链接文本中包含的各实体提及、预设的候选实体的描述文本输入到预先训练的实体链接模型中,以通过实体链接模型确定每个候选实体的描述文本的特征表示与待链接文本的特征表示之间的细粒度交互特征表示,并确定每个候选实体为目标链接实体的概率,以根据概率,从各候选实体中确定出待链接文本对应的目标链接实体,并根据目标链接实体进行任务执行。
-
-
-
-
-
-
-
-
-