-
公开(公告)号:CN114398500A
公开(公告)日:2022-04-26
申请号:CN202210112341.2
申请日:2022-01-29
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种基于图增强预训练模型的事件预测方法,包括:获取事件序列,对事件序列进行预训练获得若干个编码向量,并对若干个编码向量进行聚合,获得事件序列的表示向量;基于事件序列的表示向量,获取事件序列中任两个事件的邻接关系;获取事理图谱,基于事理图谱获取事件的逻辑关系;基于任两个事件的邻接关系和事件的逻辑关系完成事件预测。采用事理图谱作为模型学习事件间关系模式的知识库,事理图谱是描述事件及其逻辑关系的图谱,其知识将为事件预测任务提供有力支撑,将预训练语言模型与图结构信息预测进行融合,既能利用预训练模型中的丰富语言学知识,充分理解各个事件的语义,能通过学习事理图谱结构变量实现图结构信息的预测。
-
公开(公告)号:CN110738026B
公开(公告)日:2022-04-19
申请号:CN201911012473.2
申请日:2019-10-23
Applicant: 腾讯科技(深圳)有限公司 , 哈尔滨工业大学
IPC: G06F40/166 , G06F40/126 , G06F40/289 , G06N3/04
Abstract: 本文描述了一种用于生成描述文本的方法和设备。所述方法包括:将关键词序列以及具有预定风格的参考文本输入经训练的神经网络,其中所述神经网络包括关键词编码器、文本编码器、互注意力编码器以及解码器;利用关键词编码器对关键词序列进行编码以得到关键词序列的隐层状态序列;利用文本编码器对参考文本进行编码以得到参考文本的隐层状态序列;利用互注意力编码器对关键词序列的隐层状态序列和参考文本的隐层状态序列进行编码以得到融合了预定风格的关键词序列的隐层状态序列;利用解码器对融合了预定风格的关键词序列的隐层状态序列进行解码以输出具有所述预定风格的描述文本。
-
公开(公告)号:CN113312530A
公开(公告)日:2021-08-27
申请号:CN202110652703.2
申请日:2021-06-09
Applicant: 哈尔滨工业大学
IPC: G06F16/906 , G06K9/62 , G06F16/35 , G06F16/55 , G06F16/75
Abstract: 一种以文本为核心的多模态情感分类方法,涉及自然语言处理技术领域,针对现有技术中将每个模态的语义信息看作一个整体,缺乏探索不同模态交互的能力,进而导致情感分类不准确的问题,包含两部分,一部分是跨模态预测模型,该模型以文本模态特征为输入,输出为语音/图像模态特征。利用该模型我们设计了共享特征与私有特征的判定规则,进而利用规则分辨出共享和私有特征。另一部分是情感预测模型,该模型利用跨模态注意力机制将文本模态特征与语音/图像的共享和私有特征进行融合,最后得到多模态融合特征进行情感分类。
-
公开(公告)号:CN113095088A
公开(公告)日:2021-07-09
申请号:CN202110485144.0
申请日:2021-04-30
Applicant: 哈尔滨工业大学
IPC: G06F40/30 , G06F40/216 , G06N20/00
Abstract: 一种基于文本的消费意图分析方法,它属于消费意图分析技术领域。本发明解决了由于现有方法忽略了彼此相距较远的节点的结构相似性,导致对消费意图分析的准确度低的问题。本发明提出的技术将任务描述为一个异构图推理任务,以充分利用全局连接信息,使用节点聚合机制来捕获语义特征,使用元结构来显式地建模远距离节点之间的拓扑结构相似性,考虑了远距离节点之间的拓扑结构相似性后,可以大幅提高消费意图分析结果的准确度。本发明可以应用于消费意图分析。
-
公开(公告)号:CN112148863A
公开(公告)日:2020-12-29
申请号:CN202011104023.9
申请日:2020-10-15
Applicant: 哈尔滨工业大学
IPC: G06F16/332 , G06F40/295 , G06N3/04
Abstract: 一种融入常识知识的生成式对话摘要方法,属于自然语言处理领域。本发明解决了现有生成式对话摘要方法未利用常识知识而导致生成的对话摘要不准确,抽象性低的问题。本发明方法包括:获取常识知识库ConceptNet与对话摘要数据集SAMSum;利用获取的常识知识库ConceptNet为对话摘要数据集SAMSum引入元组知识,构建异构对话图;练步骤三中构造的对话异构神经网络模型,通过训练的对话异构神经网络模型从一段对话中生成最终对话摘要。本发明应用于对话摘要的生成。
-
公开(公告)号:CN111651983A
公开(公告)日:2020-09-11
申请号:CN202010397785.6
申请日:2020-05-12
Applicant: 哈尔滨工业大学
IPC: G06F40/284 , G06N3/04 , G06N3/08
Abstract: 一种基于自训练与噪声模型的因果事件抽取方法,本发明涉及因果事件抽取的方法。本发明的目的是解决现有基于深度学习模型的因果事件抽取方法在有标注数据不足的领域或场景中效果有限的问题。过程为:一、收集已标注的目标领域文本;二、计算一个向量表示;三、计算出概率最大的标签序列;四、训练三中的模型,并对二中的模型进行微调;五、得到大量自标注数据;六、为每个单词计算一个向量表示,计算单词序列生成每个可能的标签序列的概率;七、计算自标注文本中每个单词的噪声矩阵;八、得到由单词序列生成自标注标签序列的概率;九、使用一中有标注数据与五中自标注数据共同训练二、三、六、七中的整体模型。本发明用于因果事件抽取领域。
-
公开(公告)号:CN110516213A
公开(公告)日:2019-11-29
申请号:CN201910828514.9
申请日:2019-09-03
Applicant: 哈尔滨工业大学
Abstract: 一种基于表格层次化建模的结构化数据生成文本方法,本发明涉及结构化数据生成文本方法。本发明的目的是为了解决现有结构化数据生成文本只利用了数据本身单一信息,无法衡量实体数据整体情况以及同类型数据的表现差异和多表格数据之间的利用不充分问题。一、将数据集的记录用三元组表示,分别对每条记录所属的行、列维度建模得到该记录的行向量、列向量,并引入时间轴,对不同日期的同类型数据建模得到该记录的时间向量;二、融合行向量、列向量和时间向量得到该记录新的向量表示;三、对每行记录的新向量进行均值池化得到新行向量;四、每个解码时刻,对三得到的向量进行解码,得到当前时刻每条记录的权重。本发明用于表格数据生成文本方法。
-
公开(公告)号:CN119649979A
公开(公告)日:2025-03-18
申请号:CN202411672341.3
申请日:2024-11-21
Applicant: 哈尔滨工业大学
IPC: G16H15/00 , G06N5/04 , G06F18/214
Abstract: 基于分段提取推理学习的PET报告生成系统,本发明涉及医学影像分析和自然语言处理领域。本发明的目的是为了解决现有技术中语言模型难以高效生成高质量报告的问题。基于分段提取推理学习的PET报告生成系统包括:训练数据集获取模块、模型获取模块、待测PET报告生成模块;训练数据集获取模块用于获取PET报告,基于PET报告构建SERI训练数据集;SERI为分段提取推理;模型获取模块用于基于SERI训练数据集对模型进行训练,获得训练好的模型;待测PET报告生成模块用于将待测PET报告输入训练好的模型,训练好的模型输出PET报告的提取信息和推理结论;所述PET为正电子发射断层扫描。
-
公开(公告)号:CN119446378A
公开(公告)日:2025-02-14
申请号:CN202411559178.X
申请日:2024-11-04
Applicant: 哈尔滨工业大学
Abstract: 基于心理学量表的社交媒体用户异常心理状态识别方法及系统,涉及人工智能技术领域,针对现有异常心理识别方法,仅通过对帖子和异常心理状态的基本理解进行异常心理识别,其未能深入挖掘与异常心理状态密切相关的帖子。进而导致了异常心理状态识别的准确率低的问题,本申请通过引入心理学量表为异常心理识别提供了丰富的量表项信息,使得识别方法能够对用户的帖子有更详细和深入的理解,从而能够做出更准确的识别,进而提升了异常心理状态识别的准确率。
-
公开(公告)号:CN119361126A
公开(公告)日:2025-01-24
申请号:CN202411492394.7
申请日:2024-10-24
Applicant: 哈尔滨工业大学
Abstract: 一种利用病历信息进行肝胆胰疾病智能化辅助诊疗的病历智能体系统,本发明涉及病历智能体系统,属于医学信息处理领域。本发明的目的是为了解决现有技术系统对病历信息挖掘不够充分,没有利用好各个类型的数据,以及整体推理过程的不可见使得系统可解释性差的问题。系统包括:数据处理模块、数值类型肝胆胰疾病分类模块、自然语言类型肝胆胰疾病分类模块、影像检查数据类型肝胆胰疾病分类模块、整合模块、证据判断模块;数值类型肝胆胰疾病分类模块用于获取数值类型肝胆胰疾病分类结果;自然语言类型肝胆胰疾病分类模块用于获取自然语言类型肝胆胰疾病分类结果;影像检查数据类型肝胆胰疾病分类模块用于获取影像检查类型肝胆胰疾病分类结果。
-
-
-
-
-
-
-
-
-