-
公开(公告)号:CN114943010A
公开(公告)日:2022-08-26
申请号:CN202210588407.5
申请日:2022-05-26
Applicant: 浙江工业大学
IPC: G06F16/783 , G06F16/735 , G06F16/36
Abstract: 一种基于自注意力的融合三元组信息的短序列扩充电影推荐方法,包括以下步骤:1)原始数据处理:处理用户观看电影的历史数据,并根据预先设定好的电影关系为每部电影制作知识图谱;2)根据时间戳为每个用户制作观看的历史电影序列,使用单向Transformer模型反向训练模型,得到反向的预训练模型,使用反向的预训练模型生成扩充的增强数据;3)将扩充后的数据送入预训练模型进行正向模型的微调,得到正向的预训练模型;4)使用正向微调后的模型预测用户下一部即将观看的电影。本发明对短序列进行扩充,增强了数据,解决部分冷启动问题,对电影的推荐提供有力的帮助。
-
公开(公告)号:CN114999154A
公开(公告)日:2022-09-02
申请号:CN202210589674.4
申请日:2022-05-26
Applicant: 浙江工业大学
Abstract: 一种基于图卷积网络的道路服务水平预测方法,包括以下步骤:1)交通流数据的获取与处理,将设备采集到数据进行异常值剔除以及缺省值的补足;2)路网的建立,从路段之间的相关性以及路段之间的相似性两方面建立路网拓扑图;3)通过最小二乘法对流量、密度数据拟合,得到道路最大通行流量值;4)交通流预测,将历史流量、速度数据输入神经网络模型,得到预测的流量、速度数据;5)道路服务水平预测,根据上一步预测的数据,计算得到预测时刻的道路密度和饱和率,结合密度和饱和率,通过映射函数得到道路服务水平的得分。本发明结合人工智能方法,对道路未来的交通状况进行预测,极大地提高现有道路服务水平。
-
公开(公告)号:CN114861669A
公开(公告)日:2022-08-05
申请号:CN202210614477.3
申请日:2022-05-26
Applicant: 浙江工业大学
IPC: G06F40/295 , G06K9/62 , G06N3/04
Abstract: 一种融入拼音信息的中文实体链接方法,包括以下步骤:1)构建本地知识库,知识库中应当包含很多实体,每一个实体对应着唯一的标识id、别名以及相关的描述性文本;2)选取训练数据,并进行相应格式处理;3)命名实体识别;4)候选实体生成;5)实体消岐,主要基于二分类思想,在此步骤将拼音信息融入,然后按照候选实体的概率排序,取最高概率为正确实体。本发明的有益效果为:可以很好的解决中文实体中同形异音异义的实体链接问题。
-
公开(公告)号:CN114781376A
公开(公告)日:2022-07-22
申请号:CN202210589669.3
申请日:2022-05-26
Applicant: 浙江工业大学
IPC: G06F40/289 , G06F40/211 , G06F16/951 , G06N3/04 , G06N3/08
Abstract: 一种基于深度学习的新闻文本摘要生成方法,包括以下步骤:1)爬取新闻标题和新闻文本,获得原始数据;2)对数据进行预处理,获得模型所需的数据格式;3)利用Bert模型作为核心来构建抽取式和生成式的摘要生成系统;4)抽取式模型先对输入文本抽取出与标题相关度高的句子,用作生成式模型的指导信号;5)输入文本和指导信号输入给生成式模型,生成最终摘要;6)将生成摘要与参考摘要进行对比评价。本发明结合抽取式与生成式摘要模型对新闻文本进行摘要生成,可以让冗长的文本精简化,快速获取其中的关键信息。
-
公开(公告)号:CN113495929A
公开(公告)日:2021-10-12
申请号:CN202110539577.X
申请日:2021-05-18
Applicant: 浙江工业大学
IPC: G06F16/28 , G06F16/36 , G06F40/295 , G06F16/35
Abstract: 一种基于自注意力的三元组抽取方法,包括以下步骤:1)根据登记在数据库中案件的简要描述,预先设定好案件需要抽取的实体类型和描述案件的三元组的模板;2)在案件的简要描述中,通过标注工具根据设定好的模板标注出描述中的三元组;3)利用Transformer模型作为核心来构建管道式的抽取系统;4)利用模型自身的自注意力结构来对实体冗余情况下的三元组进行建模;5)使用共享位置信息的方式和带有偏差的自注意力对三元组预测进行加速;6)对预测结果进行评价和排序。本发明以管道式关系抽取算法对数据中的非结构化数据进行提取,从而获得结构化的三元组数据,对数据的后续分析提供有力的帮助。
-
公开(公告)号:CN113495929B
公开(公告)日:2024-12-17
申请号:CN202110539577.X
申请日:2021-05-18
Applicant: 浙江工业大学
IPC: G06F16/28 , G06F16/36 , G06F40/295 , G06F16/35
Abstract: 一种基于自注意力的三元组抽取方法,包括以下步骤:1)根据登记在数据库中案件的简要描述,预先设定好案件需要抽取的实体类型和描述案件的三元组的模板;2)在案件的简要描述中,通过标注工具根据设定好的模板标注出描述中的三元组;3)利用Transformer模型作为核心来构建管道式的抽取系统;4)利用模型自身的自注意力结构来对实体冗余情况下的三元组进行建模;5)使用共享位置信息的方式和带有偏差的自注意力对三元组预测进行加速;6)对预测结果进行评价和排序。本发明以管道式关系抽取算法对数据中的非结构化数据进行提取,从而获得结构化的三元组数据,对数据的后续分析提供有力的帮助。
-
公开(公告)号:CN114999154B
公开(公告)日:2024-02-02
申请号:CN202210589674.4
申请日:2022-05-26
Applicant: 浙江工业大学
Abstract: 一种基于图卷积网络的道路服务水平预测方法,包括以下步骤:1)交通流数据的获取与处理,将设备采集到数据进行异常值剔除以及缺省值的补足;2)路网的建立,从路段之间的相关性以及路段之间的相似性两方面建立路网拓扑图;3)通过最小二乘法对流量、密度数据拟合,得到道路最大通行流量值;4)交通流预测,将历史流量、速度数据输入神经网络模型,得到预测的流量、速度数据;5)道路服务水平预测,根据上一步预测的数据,计算得到预测时刻的道路密度和饱和率,结合密度和饱和率,通过映射函数得到道路服务水平的得分。本发明结合人工智能方法,对道路未来的交通状况进行预测,极大地提高现有道路服务水平。(56)对比文件朱凯利;朱海龙;刘靖宇;石晔琼;王欢.基于图卷积神经网络的交通流量预测.智能计算机与应用.2019,(第06期),全文.
-
公开(公告)号:CN115545029A
公开(公告)日:2022-12-30
申请号:CN202211207562.4
申请日:2022-09-30
Applicant: 浙江工业大学
IPC: G06F40/295 , G06N3/08 , G16H10/60 , G16H50/70
Abstract: 一种基于生成式模型的医疗事件抽取方法,包括以下步骤:1)获取数据库中的电子病历文本数据,预先设定好需要抽取的实体类型和事件模板;2)在电子病历文本中,通过标注工具根据设定好的模板标注出病历中的实体和事件;3)利用transformer模型作为文本编码器,讲文本转换为向量表示;4)使用指针网络对实体进行标注4)使用池化层和线性层对事件类型进行分类;5)使用生成式transformer生成事件信息序列;6)提取事件信息序列中的论元角色,汇总事件信息。本发明以联合抽取算法对医疗电子病历中的非结构化数据进行提取,从而获得结构化的事件信息,对患者后续的病情分析提供有力的帮助。
-
公开(公告)号:CN114861668A
公开(公告)日:2022-08-05
申请号:CN202210589675.9
申请日:2022-05-26
Applicant: 浙江工业大学
IPC: G06F40/295 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 一种基于管道式方案的政务三元组抽取方法,包括以下步骤:1)获取某个问政平台在数据库中的社情民意描述文本,预先确定好实体的schema和关系的schema;2)将文本转化为向量放入BERT模型里进行实体起始边界的预测;3)预先设定好span的最大宽度,从预测出来的起始边界开始,逐一生成实体span,直到span的宽度等于设定的最大宽度;4)对生成的span进行实体类型的预测;5)将识别出的实体两两配对,构成若干条句子,每种实体类型用特殊的token字符表示;6)将文本中的实体替换为对应的token字符,得到新的句子;7)将新句子放到另外一个BERT模型里,得到句子向量;8)将句子向量里的头尾实体向量进行拼接,送入前馈神经网络,进行关系预测,从而完成文本的三元组抽取任务。
-
公开(公告)号:CN114861668B
公开(公告)日:2025-05-02
申请号:CN202210589675.9
申请日:2022-05-26
Applicant: 浙江工业大学
IPC: G06F16/36 , G06F16/353 , G06F40/295 , G06F18/2415 , G06F18/243 , G06N3/045 , G06N3/08
Abstract: 一种基于管道式方案的政务三元组抽取方法,包括以下步骤:1)获取某个问政平台在数据库中的社情民意描述文本,预先确定好实体的schema和关系的schema;2)将文本转化为向量放入BERT模型里进行实体起始边界的预测;3)预先设定好span的最大宽度,从预测出来的起始边界开始,逐一生成实体span,直到span的宽度等于设定的最大宽度;4)对生成的span进行实体类型的预测;5)将识别出的实体两两配对,构成若干条句子,每种实体类型用特殊的token字符表示;6)将文本中的实体替换为对应的token字符,得到新的句子;7)将新句子放到另外一个BERT模型里,得到句子向量;8)将句子向量里的头尾实体向量进行拼接,送入前馈神经网络,进行关系预测,从而完成文本的三元组抽取任务。
-
-
-
-
-
-
-
-
-