-
公开(公告)号:CN119903190A
公开(公告)日:2025-04-29
申请号:CN202411728000.3
申请日:2024-11-28
Applicant: 哈尔滨工业大学
IPC: G06F16/36 , G06F16/334 , G06F40/284 , G06F40/166 , G06F40/216 , G06N3/0455 , G06N3/0895
Abstract: 本发明公开了一种结合生成式语言模型与语义文档图谱的多文档问答检索方法,所述方法进一步完善和优化了文档知识图谱的构建与遍历方式,分别设计基于bert类模型去构建图谱构建,设计KGP3算法优化检索遍历方式。在图谱遍历过程中,结合主问题及已获得节点,生成涉及下一个需要节点信息的子问题,从邻居节点中精确挑选出最合适的文档节点,并判断该节点与初始问题的相关性,若不相关,则不列入后续检索列表。这种方法不仅高效且具备可追溯性和可解释性,同时抽象概括了模型在图谱遍历中选择下一跳节点的整体过程。为了降低成本,还对小型编码器‑解码器T5模型进行了改进,并在该模型中引入对比学习机制,进一步提升了小型模型的检索性能。
-
公开(公告)号:CN119669755A
公开(公告)日:2025-03-21
申请号:CN202411728003.7
申请日:2024-11-28
Applicant: 哈尔滨工业大学(威海)
IPC: G06F18/214 , G06F18/22 , G06F40/30 , G06F16/3329 , G06N3/045 , G06N3/0985 , G06N5/022 , G06N5/04
Abstract: 本发明公开了一种用于多跳问答检索模型的数据增强及训练方法,包括如下步骤:步骤1、获取一个多跳问答数据集,该数据集由多跳问题及其对应的文档集合组成,文档集合包括第一跳检索文档、第二跳检索文档以及其他相关文档;步骤2、对文档集合中的第一跳文档、第二跳文档进行正例去噪,得到去噪后的文档用作模型训练的新正例,文档其他残余部分作为训练补充负例;步骤3、将得到的数据输入到多跳问答预训练语言模型进行训练。本发明提出了一种基于命题子句的正例去噪策略,通过将命题子句作为中间步骤,显著减少文档段落中与问题无关的信息干扰,从而提高模型对相关信息的捕获精度和效率。这一策略增强了模型在多跳推理任务中的准确性和鲁棒性。
-
公开(公告)号:CN111898014A
公开(公告)日:2020-11-06
申请号:CN202010808728.2
申请日:2020-08-12
Applicant: 哈尔滨工业大学
IPC: G06F16/951 , G06F16/215 , G06F16/2458 , G06F16/26 , G06F40/126 , G06F40/289 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种面向认知服务的用户意图识别方法及系统,所述方法包括如下步骤:步骤S1、收集并标注大规模语料库;步骤S2、挖掘概念共现模式;步骤S3、构建概念共现增强语义模型;步骤S4、实施意图识别方案。本发明提出了医疗查询文本中存在“概念共现模式”这一概念,从医疗查询记录中挖掘频繁共现模式并利用这种共现模式进行用户意图识别,揭示了概念共现与用户意图的潜在关联,并揭示了它们对多意图和隐式意图识别问题的重大影响。本发明充分考虑到了用户查询文本表达的复杂性和模糊性,从语义特征和概念共现特征两个维度进行特征提取用于意图识别,解决多意图和隐式意图等复杂意图识别问题并在多意图识别问题上具备良好的迁移性。
-
公开(公告)号:CN112000793B
公开(公告)日:2022-08-09
申请号:CN202010888963.5
申请日:2020-08-28
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种面向人机交互的对话目标规划方法,所述方法如下:步骤S1、收集并标注大规模语料库;步骤S2、计算目标转移向量矩阵;步骤S3、构建目标规划联合学习模型;步骤S4、实施目标规划方案。本发明将对话目标规划问题拆分成目标预测和目标完成两个子任务,并揭示了两个子任务之间内生的潜在关联,从而阐明了这两个子任务能够进行联合学习的本质原因。本发明提供了一系列方法来构建对话目标转移图并将其进行向量化表示。本发明提出了一种新颖的多任务联合学习神经网络模型,通过设计目标预测和目标完成两个子网络来建模两个子任务之间内在的关联性,并采用循环增强机制来提高各网络特征表示的性能,从而提高目标规划模型的效果。
-
公开(公告)号:CN119179495B
公开(公告)日:2025-03-25
申请号:CN202411191319.7
申请日:2024-08-28
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明公开了一种面向跨领域多任务的大模型适配器高效部署方法及系统,所述方法包括如下步骤:步骤S1、构造模型adapter索引;步骤S2、构造用于训练selector的混合表征数据集;步骤S3、训练selector;步骤S4、基于selector的适配器联合部署。本发明提出了大语言模型部署中适配器选择器selector这一概念,可以根据模型的输入精准判断输入对应的领域和任务,从而引导系统精准将大模型与这一领域与任务的模型适配器精准匹配并重组,提高了多任务推理的准确度;同时提出了selector的训练方法和携带selector的大模型的推理流程和部署方法,提高了有限资源的资源利用率。
-
公开(公告)号:CN111898014B
公开(公告)日:2021-07-13
申请号:CN202010808728.2
申请日:2020-08-12
Applicant: 哈尔滨工业大学
IPC: G06F16/951 , G06F16/215 , G06F16/2458 , G06F16/26 , G06F40/126 , G06F40/289 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种面向认知服务的用户意图识别方法及系统,所述方法包括如下步骤:步骤S1、收集并标注大规模语料库;步骤S2、挖掘概念共现模式;步骤S3、构建概念共现增强语义模型;步骤S4、实施意图识别方案。本发明提出了医疗查询文本中存在“概念共现模式”这一概念,从医疗查询记录中挖掘频繁共现模式并利用这种共现模式进行用户意图识别,揭示了概念共现与用户意图的潜在关联,并揭示了它们对多意图和隐式意图识别问题的重大影响。本发明充分考虑到了用户查询文本表达的复杂性和模糊性,从语义特征和概念共现特征两个维度进行特征提取用于意图识别,解决多意图和隐式意图等复杂意图识别问题并在多意图识别问题上具备良好的迁移性。
-
公开(公告)号:CN119179495A
公开(公告)日:2024-12-24
申请号:CN202411191319.7
申请日:2024-08-28
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明公开了一种面向跨领域多任务的大模型适配器高效部署方法及系统,所述方法包括如下步骤:步骤S1、构造模型adapter索引;步骤S2、构造用于训练selector的混合表征数据集;步骤S3、训练selector;步骤S4、基于selector的适配器联合部署。本发明提出了大语言模型部署中适配器选择器selector这一概念,可以根据模型的输入精准判断输入对应的领域和任务,从而引导系统精准将大模型与这一领域与任务的模型适配器精准匹配并重组,提高了多任务推理的准确度;同时提出了selector的训练方法和携带selector的大模型的推理流程和部署方法,提高了有限资源的资源利用率。
-
公开(公告)号:CN112000793A
公开(公告)日:2020-11-27
申请号:CN202010888963.5
申请日:2020-08-28
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种面向人机交互的对话目标规划方法,所述方法如下:步骤S1、收集并标注大规模语料库;步骤S2、计算目标转移向量矩阵;步骤S3、构建目标规划联合学习模型;步骤S4、实施目标规划方案。本发明将对话目标规划问题拆分成目标预测和目标完成两个子任务,并揭示了两个子任务之间内生的潜在关联,从而阐明了这两个子任务能够进行联合学习的本质原因。本发明提供了一系列方法来构建对话目标转移图并将其进行向量化表示。本发明提出了一种新颖的多任务联合学习神经网络模型,通过设计目标预测和目标完成两个子网络来建模两个子任务之间内在的关联性,并采用循环增强机制来提高各网络特征表示的性能,从而提高目标规划模型的效果。
-
-
-
-
-
-
-