-
公开(公告)号:CN113468872B
公开(公告)日:2024-04-16
申请号:CN202110643975.6
申请日:2021-06-09
Applicant: 大连理工大学
IPC: G06F40/253 , G06F40/216 , G06N3/049 , G06N3/08 , G06N3/0464
Abstract: 基于句子级别图卷积的生物医学关系抽取方法及系统,属于生物医学文本处理领域,为克服生物医学领域关系抽取对句法信息获取不充分的问题,包括步骤1、根据生物医学词向量构建样本的分布式表示;步骤2、根据样本的分布式表示构造句法森林表示;步骤5、根据句法森林表示,取得句法特征;步骤6、根据句法特征,取得用于分类的最终表示;步骤7、响应于最终表示确定特征表示关系上的概率分布,得到生物医学关系,效果是对句法信息进行了增强。
-
公开(公告)号:CN115390806A
公开(公告)日:2022-11-25
申请号:CN202211083423.5
申请日:2022-09-06
Applicant: 大连理工大学
Abstract: 本发明公开了基于双模态联合建模的软件设计模式推荐方法,充分利用深度语言模型对自然语言和程序语言联合建模来解决向用户推荐软件设计模式的任务。首先构建用于软件设计模式推荐的语料库,其次将用户需求文本和软件源代码转化为实数特征向量,然后构建双模态联合建模的软件设计模式推荐模型并将两种不同模态的特征向量输入进行交互匹配,最后面向用户需求实现软件设计模式推荐。本发明能够向用户提供符合其需求的软件设计模式候选列表,且相较于其他模型具有更加精准的推荐效果,证明了基于双模态联合建模的软件设计模式推荐方法的实用性。
-
公开(公告)号:CN115169440A
公开(公告)日:2022-10-11
申请号:CN202210682483.2
申请日:2022-06-16
Applicant: 大连理工大学
Abstract: 本发明公开了一种对社交媒体多模态信息中讽刺情感识别的方法,充分利用文本、图像和图像属性三种模态来解决具有挑战性的多模态讽刺检测任务。首先提取图像特征和图像属性特征,接着利用图像属性特征与基于RoBERTa的文本预训练网络连接提取文本特征,从而将文本模态、图像模态和图像属性模态的特征重构并融合为一个特征向量对讽刺情感进行预测。本发明在社交媒体的图文信息数据集上有超过1%的准确率提升和超过3%的F1值提升,证明了多模态分层融合模型的有效性和三种模态的实用性,从而充分发挥文本的上下文信息和不同模态间的相互作用。
-
公开(公告)号:CN114880461A
公开(公告)日:2022-08-09
申请号:CN202210623480.1
申请日:2022-06-02
Applicant: 大连理工大学
Abstract: 本发明提出一种结合对比学习和预训练技术的中文新闻文本摘要方法,包括(1)构建对比学习输入数据;(2)使用结合中文新闻语料微调后的BERT预训练模型获取新闻文本的上下文向量表示,对文本中的句子进行分类打分,抽取包含关键信息的候选句得到候选句集合;(3)将候选句集合输入到结合中文新闻语料微调后的MT5模型中,生成摘要结果;(4)结合AECLoss损失函数实现抽取式模型、生成式模型的端到端训练。本发明能够结合对比学习获取更忠于原文内容的摘要结果;通过结合外部知识,提升预训练模型在新闻文本上的语义表示能力;通过先抽取后生成的摘要方式,使模型充分关注新闻文本中的关键内容,有效提升了模型的可解释性和摘要结果的连续性、可读性。
-
公开(公告)号:CN109977752B
公开(公告)日:2022-04-12
申请号:CN201910041388.2
申请日:2019-01-16
Applicant: 大连理工大学
IPC: G06V40/20 , G06V20/40 , G06F16/78 , G06F16/9032
Abstract: 一种基于序列模式挖掘的羽毛球运动员技战术分析方法,包括:S1、视频数据采集和场地编码、S2、对运动员动作进行人工标注、S3、面向羽毛球技战术分析的字符串匹配、S4、统计输出。本发明采用高效的羽毛球技战术编码方式对输入的羽毛球比赛运动视频进行标注;后利用字符串匹配方法将待分析运动员在所采集的比赛视频中每次得分所采用的人工标注字符串数据与每一关键技战术的代码进行匹配分析。然后依据预设关键技战术的代码在待分析运动员得分点的动作中出现的频率判断该运动员常用的羽毛球技战术。本方法有助于对羽毛球运动员认识自身的技术优势,从而提高自身技战术水平及教练团队进行赛前的技战术分析和赛后的技战术总结具有重大意义。
-
公开(公告)号:CN111783980A
公开(公告)日:2020-10-16
申请号:CN202010594875.4
申请日:2020-06-28
Applicant: 大连理工大学
Abstract: 一种基于双重协作生成式对抗网络的排序学习方法,该生成式对抗网络包含三个角色:导师,生成器和判别器,该方法主要步骤包括:S1、构建排序学习所需数据集步骤;S2、创建导师网络和生成器网络步骤;S3、创建判别器网络步骤;S4、数据细节及参数设置步骤;S5、T-G网络模型迭代训练步骤;S6、G-D网络模型迭代训练步骤;S7、多指标有效性测试结果返回步骤,效果是改善了用于排序学习的生成式对抗网络,在先前的知识体系基础上,通过导师与生成器之间的交互帮助与监督,减少了生成器和判别器之间的差异,提高了生成器的效率与有效性,在训练过程中大大削弱了过拟合的风险,改善了排序学习的性能。
-
公开(公告)号:CN110534192A
公开(公告)日:2019-12-03
申请号:CN201910673218.6
申请日:2019-07-24
Applicant: 大连理工大学 , 大连医科大学附属第二医院
Abstract: 本发明涉及一种肺结节良恶性识别方法,一种基于深度学习的肺结节良恶性识别方法,包括以下步骤:(1)、对原始肺结节电子病历数据进行预处理,(2)、文档筛选与分类,(3)、文本表示的构建,(4)、深度学习模型的训练,(5)、attention机制的加入,(6)、选择分类器对肺结节良恶性进行识别,(7)、对模型分类结果进行融合。本发明利用文本信息对肺结节良恶性进行判断来辅助医疗;还利用了深度学习的相关知识来进行文本分类,减少了人工干预,效率更高;通过不同的文本特征输入,比较性别和年龄、现病史、个人史这三个因素对肺结节良恶性预判的影响情况,采用结果融合的方法提高分类识别模型最终的准确率和稳定性。
-
公开(公告)号:CN109840626A
公开(公告)日:2019-06-04
申请号:CN201910041449.5
申请日:2019-01-16
Applicant: 大连理工大学
IPC: G06Q10/04 , G06Q40/06 , G06F16/951 , G06N3/04 , G06N3/08
Abstract: 一种基于卷积神经网络模型的股市预测方法,包括:S1、数据收集、S2、数据处理、S3、训练神经网络模型、S4、预测股市走势四大步骤。本发明通过采集和分析上市公司的财经新闻语料,并根据DJIA历史数据对财经新闻语料进行标注,将标注后的财经语料信息作为卷积神经网络模型输入值,从而经卷积神经网络模型的处理输出新闻标注的预测值,进而通过新闻标注的预测值即可预测DJIA的涨跌情况及股市走势。本发明经交叉验证可以达到65.5%的预测准确率。
-
公开(公告)号:CN104750819B
公开(公告)日:2018-01-23
申请号:CN201510147696.5
申请日:2015-03-31
Applicant: 大连理工大学
Abstract: 一种基于词分组排序算法的生物医学文献检索方法及系统,检索方法包括S1、搜索引擎查询提取步骤;S2、候选扩展词汇提取步骤;S3、候选扩展词汇的特征提取及标注步骤;S4、候选扩展词汇排序模型训练步骤;S5、在线搜索引擎查询与提取步骤;S6、在线候选扩展词汇提取及其特征提取及打分步骤;S7、查询结果返回步骤。检索系统包括搜索引擎查询提取模块、候选扩展词汇提取模块、候选扩展词汇的特征提取及标注模块、候选扩展词汇排序模型训练模块、查询重构模块、查询结果返回模块。本发明从查询扩展角度出发,通过在查询扩展中利用词分组排序算法和生物医学领域固有词典资源选择最能表达用户信息需求的专业词汇,完成检索任务,改善检索的性能。
-
公开(公告)号:CN104881401B
公开(公告)日:2017-10-17
申请号:CN201510278103.9
申请日:2015-05-27
Applicant: 大连理工大学
IPC: G06F17/27
Abstract: 一种专利文献聚类方法,包括以下步骤:S1、语料集采集及预处理;S2、聚类分析语料的特征词提取;S3、基于词向量的聚类分析数据专利向量表示;S4、聚类;S5、聚类结果评价。本发明的专利文献聚类方法综合考虑了专利文献的标题和摘要信息,通过将专利摘要信息从不同角度进行利用,考虑专利摘要文本的整体信息,同时考虑专利摘要中属性和属性值的信息,充分挖掘了专利文本摘要中隐含的语义信息;充分利用大规模语料中隐藏的信息,利用大规模的语料进行特征训练,将词语表示成低纬度的向量形式,避免了维灾难的同时更好地提取了文本中的信息;设置不同的权重,将标题、摘要和摘要的属性值对三种形式的数据进行融合,得到很好的专利聚类效果。
-
-
-
-
-
-
-
-
-