-
公开(公告)号:CN114861668B
公开(公告)日:2025-05-02
申请号:CN202210589675.9
申请日:2022-05-26
Applicant: 浙江工业大学
IPC: G06F16/36 , G06F16/353 , G06F40/295 , G06F18/2415 , G06F18/243 , G06N3/045 , G06N3/08
Abstract: 一种基于管道式方案的政务三元组抽取方法,包括以下步骤:1)获取某个问政平台在数据库中的社情民意描述文本,预先确定好实体的schema和关系的schema;2)将文本转化为向量放入BERT模型里进行实体起始边界的预测;3)预先设定好span的最大宽度,从预测出来的起始边界开始,逐一生成实体span,直到span的宽度等于设定的最大宽度;4)对生成的span进行实体类型的预测;5)将识别出的实体两两配对,构成若干条句子,每种实体类型用特殊的token字符表示;6)将文本中的实体替换为对应的token字符,得到新的句子;7)将新句子放到另外一个BERT模型里,得到句子向量;8)将句子向量里的头尾实体向量进行拼接,送入前馈神经网络,进行关系预测,从而完成文本的三元组抽取任务。
-
公开(公告)号:CN114781376B
公开(公告)日:2025-05-02
申请号:CN202210589669.3
申请日:2022-05-26
Applicant: 浙江工业大学
IPC: G06F16/34 , G06F40/211 , G06F40/289 , G06F16/951 , G06N3/0455 , G06N3/08 , G06N5/01
Abstract: 一种基于深度学习的新闻文本摘要生成方法,包括以下步骤:1)爬取新闻标题和新闻文本,获得原始数据;2)对数据进行预处理,获得模型所需的数据格式;3)利用Bert模型作为核心来构建抽取式和生成式的摘要生成系统;4)抽取式模型先对输入文本抽取出与标题相关度高的句子,用作生成式模型的指导信号;5)输入文本和指导信号输入给生成式模型,生成最终摘要;6)将生成摘要与参考摘要进行对比评价。本发明结合抽取式与生成式摘要模型对新闻文本进行摘要生成,可以让冗长的文本精简化,快速获取其中的关键信息。
-
公开(公告)号:CN115455190A
公开(公告)日:2022-12-09
申请号:CN202210589668.9
申请日:2022-05-26
Applicant: 浙江工业大学
Abstract: 一种基于重复历史事实的时序知识图谱案件推理方法,包括以下步骤:1)获取数据集中的头实体,关系,尾实体,时间戳;2)随机初始化实体、关系和时间戳的嵌入,LSTM和神经网络的参数;3)利用头实体,关系,尾实体,时间戳的嵌入,更新LSTM中的参数和神经网络,并通过历史词表惩罚历史中未出现的事实,具体过程如下所述。4)根据得到的LSTM网络和神经网络,该时间戳下已知头实体和关系预测尾实体或已知尾实体和关系预测头实体。与现有技术相比,本发明通过二维卷积聚合嵌入特征,LSTM和神经网络训练带有时间信息的特征,利用历史词表惩罚历史中未出现的事实,据此得到的时序知识图谱案件推理比现有的方法效果更好。
-
公开(公告)号:CN114999154B
公开(公告)日:2024-02-02
申请号:CN202210589674.4
申请日:2022-05-26
Applicant: 浙江工业大学
Abstract: 一种基于图卷积网络的道路服务水平预测方法,包括以下步骤:1)交通流数据的获取与处理,将设备采集到数据进行异常值剔除以及缺省值的补足;2)路网的建立,从路段之间的相关性以及路段之间的相似性两方面建立路网拓扑图;3)通过最小二乘法对流量、密度数据拟合,得到道路最大通行流量值;4)交通流预测,将历史流量、速度数据输入神经网络模型,得到预测的流量、速度数据;5)道路服务水平预测,根据上一步预测的数据,计算得到预测时刻的道路密度和饱和率,结合密度和饱和率,通过映射函数得到道路服务水平的得分。本发明结合人工智能方法,对道路未来的交通状况进行预测,极大地提高现有道路服务水平。(56)对比文件朱凯利;朱海龙;刘靖宇;石晔琼;王欢.基于图卷积神经网络的交通流量预测.智能计算机与应用.2019,(第06期),全文.
-
公开(公告)号:CN114999154A
公开(公告)日:2022-09-02
申请号:CN202210589674.4
申请日:2022-05-26
Applicant: 浙江工业大学
Abstract: 一种基于图卷积网络的道路服务水平预测方法,包括以下步骤:1)交通流数据的获取与处理,将设备采集到数据进行异常值剔除以及缺省值的补足;2)路网的建立,从路段之间的相关性以及路段之间的相似性两方面建立路网拓扑图;3)通过最小二乘法对流量、密度数据拟合,得到道路最大通行流量值;4)交通流预测,将历史流量、速度数据输入神经网络模型,得到预测的流量、速度数据;5)道路服务水平预测,根据上一步预测的数据,计算得到预测时刻的道路密度和饱和率,结合密度和饱和率,通过映射函数得到道路服务水平的得分。本发明结合人工智能方法,对道路未来的交通状况进行预测,极大地提高现有道路服务水平。
-
公开(公告)号:CN114861669A
公开(公告)日:2022-08-05
申请号:CN202210614477.3
申请日:2022-05-26
Applicant: 浙江工业大学
IPC: G06F40/295 , G06K9/62 , G06N3/04
Abstract: 一种融入拼音信息的中文实体链接方法,包括以下步骤:1)构建本地知识库,知识库中应当包含很多实体,每一个实体对应着唯一的标识id、别名以及相关的描述性文本;2)选取训练数据,并进行相应格式处理;3)命名实体识别;4)候选实体生成;5)实体消岐,主要基于二分类思想,在此步骤将拼音信息融入,然后按照候选实体的概率排序,取最高概率为正确实体。本发明的有益效果为:可以很好的解决中文实体中同形异音异义的实体链接问题。
-
公开(公告)号:CN114781376A
公开(公告)日:2022-07-22
申请号:CN202210589669.3
申请日:2022-05-26
Applicant: 浙江工业大学
IPC: G06F40/289 , G06F40/211 , G06F16/951 , G06N3/04 , G06N3/08
Abstract: 一种基于深度学习的新闻文本摘要生成方法,包括以下步骤:1)爬取新闻标题和新闻文本,获得原始数据;2)对数据进行预处理,获得模型所需的数据格式;3)利用Bert模型作为核心来构建抽取式和生成式的摘要生成系统;4)抽取式模型先对输入文本抽取出与标题相关度高的句子,用作生成式模型的指导信号;5)输入文本和指导信号输入给生成式模型,生成最终摘要;6)将生成摘要与参考摘要进行对比评价。本发明结合抽取式与生成式摘要模型对新闻文本进行摘要生成,可以让冗长的文本精简化,快速获取其中的关键信息。
-
公开(公告)号:CN115545029A
公开(公告)日:2022-12-30
申请号:CN202211207562.4
申请日:2022-09-30
Applicant: 浙江工业大学
IPC: G06F40/295 , G06N3/08 , G16H10/60 , G16H50/70
Abstract: 一种基于生成式模型的医疗事件抽取方法,包括以下步骤:1)获取数据库中的电子病历文本数据,预先设定好需要抽取的实体类型和事件模板;2)在电子病历文本中,通过标注工具根据设定好的模板标注出病历中的实体和事件;3)利用transformer模型作为文本编码器,讲文本转换为向量表示;4)使用指针网络对实体进行标注4)使用池化层和线性层对事件类型进行分类;5)使用生成式transformer生成事件信息序列;6)提取事件信息序列中的论元角色,汇总事件信息。本发明以联合抽取算法对医疗电子病历中的非结构化数据进行提取,从而获得结构化的事件信息,对患者后续的病情分析提供有力的帮助。
-
公开(公告)号:CN114861668A
公开(公告)日:2022-08-05
申请号:CN202210589675.9
申请日:2022-05-26
Applicant: 浙江工业大学
IPC: G06F40/295 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 一种基于管道式方案的政务三元组抽取方法,包括以下步骤:1)获取某个问政平台在数据库中的社情民意描述文本,预先确定好实体的schema和关系的schema;2)将文本转化为向量放入BERT模型里进行实体起始边界的预测;3)预先设定好span的最大宽度,从预测出来的起始边界开始,逐一生成实体span,直到span的宽度等于设定的最大宽度;4)对生成的span进行实体类型的预测;5)将识别出的实体两两配对,构成若干条句子,每种实体类型用特殊的token字符表示;6)将文本中的实体替换为对应的token字符,得到新的句子;7)将新句子放到另外一个BERT模型里,得到句子向量;8)将句子向量里的头尾实体向量进行拼接,送入前馈神经网络,进行关系预测,从而完成文本的三元组抽取任务。
-
公开(公告)号:CN114943010A
公开(公告)日:2022-08-26
申请号:CN202210588407.5
申请日:2022-05-26
Applicant: 浙江工业大学
IPC: G06F16/783 , G06F16/735 , G06F16/36
Abstract: 一种基于自注意力的融合三元组信息的短序列扩充电影推荐方法,包括以下步骤:1)原始数据处理:处理用户观看电影的历史数据,并根据预先设定好的电影关系为每部电影制作知识图谱;2)根据时间戳为每个用户制作观看的历史电影序列,使用单向Transformer模型反向训练模型,得到反向的预训练模型,使用反向的预训练模型生成扩充的增强数据;3)将扩充后的数据送入预训练模型进行正向模型的微调,得到正向的预训练模型;4)使用正向微调后的模型预测用户下一部即将观看的电影。本发明对短序列进行扩充,增强了数据,解决部分冷启动问题,对电影的推荐提供有力的帮助。
-
-
-
-
-
-
-
-
-