一种基于事理图谱的化工领域事件预测方法及系统

    公开(公告)号:CN118917681A

    公开(公告)日:2024-11-08

    申请号:CN202410927255.6

    申请日:2024-07-11

    Applicant: 辽宁大学

    Abstract: 一种基于事理图谱的化工领域事件预测方法及系统,包括以下步骤:(1)定义事件触发词、事件元素,从化工事故调查报告中事故原因部分进行事件抽取;(2)构建化工领域事理图谱;(3)对化工事件进行初始嵌入,将初始嵌入输入到BiLSTM网络中,获取事件序列的表示;(4)根据事理图谱,利用图神经网络堆叠多个嵌入传播层对事件节点进行高阶向量表示;(5)计算每个候选后续事件与事件语境的向量相似度,选择相似度最大的候选事件作为预测结果。本发明对于当前事件预测准确率较低问题,提出了一种基于事理图谱的事件预测模型;对于化工领域事件缺失,预警不足问题,将上述方法应用于化工领域,实现了基于事理图谱的化工领域事件预测系统。

    基于众包技术的面向多层次标注者的事件标注系统构建方法

    公开(公告)号:CN114281998B

    公开(公告)日:2024-09-24

    申请号:CN202111624377.0

    申请日:2021-12-28

    Applicant: 辽宁大学

    Abstract: 本发明涉及基于众包技术的面向多层次标注者的事件标注系统的构建方法,包括以下步骤:1、收集领域数据并构建完整的实体库和事件信息库;2、预处理语料库并构建完整的待标注语料库存取机制:过滤掉无效文本,进行分句处理;3、构建完整的标注机制,先进行实体标注再进行事件标注;4、构建完整的众包任务分配机制和众包结果聚合机制;5、构建完整的数据集导出机制,根据下游事件抽取模型所需要的数据集格式动态地调控和构建所需事件抽取数据集。本发明能够有效地将多种众包技术应用于不同专业程度的标注者的标注过程中,从而有效利用标注者的背景知识,最大化地发挥众包的作用。

    面向大规模金融知识图谱的分布式存储及可视化查询处理方法

    公开(公告)号:CN113157943A

    公开(公告)日:2021-07-23

    申请号:CN202110409578.2

    申请日:2021-04-15

    Applicant: 辽宁大学

    Abstract: 面向大规模金融知识图谱的分布式存储及可视化查询处理方法,首先构建图谱分割模型,根据金融数据特点,利用节点密度对图谱进行初始划分,结合模块度及负载均衡检测对局部节点进行动态调整。其次构建基于HBase的单表多列簇分布式存储模型,针对每类实体均使用单表存储实体间关系及属性值,实现大规模知识图谱数据的分布式存储,解决单机存储机器成本高、单点故障导致数据无法访问的问题。最后建立基于Neo4i的可视化查询机制,根据查询语义,将HBase中的相关实体及关系进行提取,并导入Neo4j中形成用户感兴趣的子图谱进行可视化展示,实现将金融领域内复杂难懂且多样的知识以图形化的方式直观呈现,将隐性知识显性化,外显知识具体化。

    一种基于神经网络的网页数据智能爬取方法

    公开(公告)号:CN114661973B

    公开(公告)日:2024-08-16

    申请号:CN202210262920.5

    申请日:2022-03-17

    Applicant: 辽宁大学

    Abstract: 一种基于神经网络的网页数据智能爬取方法,本发明包括以下步骤:输入待爬取数据源网址;启动爬虫代码库与网页模板库,遍历网页模板库中的网页样式,若网页模板库中不存在与待爬取网页相同的样式,则将该网页样式添加到网页模板库,否则启动领域知识库将符合条件的网页添加到队列;爬虫程序根据所选择的关键字来爬取队列中的网页,并将数据存入数据队列中;从数据队列中读取数据,将数据输入到神经网络模型进行打分,并将分值大于阈值的数据存入数据库,评分完毕后将所有数据作为样本输入神经网络进行优化。神经网络模型通过新数据的优化来提升未来神经网络模型的评分准确度。通过本发明,有效提高了从网页采集数据的准确性和效率。

    面向金融领域事件抽取的篇章级长文本数据预处理方法及系统

    公开(公告)号:CN113987111A

    公开(公告)日:2022-01-28

    申请号:CN202111403771.1

    申请日:2021-11-24

    Applicant: 辽宁大学

    Abstract: 本发明涉及面向金融领域事件抽取的篇章级长文本数据预处理方法及系统,属于大数据与人工智能技术领域,该方法包括以下步骤:1)选取金融事件的类型,并根据不同的金融事件类型定义事件元素;2)从互联网上公开数据源获取各类金融事件的篇章级长文本类数据,并对文本类数据进行清洗,将清洗后数据格式转换成JSON格式,保存到MongoDB数据库;3)根据不同的金融事件类型进行触发词设定,通过设定的触发词筛选出包含目标金融事件的文本;4)对筛选后的长文本进行数据标注,形成可以训练事件抽取模型的数据集;5)运用构造的数据集训练事件抽取模型,得到的事件抽取结果并检验数据集的效果。本发明通过上述方法,提供了一种发现包含设定类型事件的文本,减少数据标注的成本,为事件抽取提供优质数据集的数据预处理方法及系统。

    四分支链式结构金融区块链存储系统

    公开(公告)号:CN112947868A

    公开(公告)日:2021-06-11

    申请号:CN202110377277.6

    申请日:2021-04-08

    Applicant: 辽宁大学

    Abstract: 一种四分支链式结构金融区块链存储系统,首先构建四分支链式结构金融区块链三元账本结构,数据存储在四分支链式结构的区块体中,根据不同的存储环境采用三元模式进行数据存储:全聚合存储、多单元存储、全分割存储,通过数据分流并行存储,提高数据存储效率。其次构建四分支链式结构存储模型,包括自由竞争链式结构、串行集中链式结构、Z字回形链式结构、并行平均链式结构,以四种链式结构为载体进行数据存储。再次,建立四分支链式结构安全性判识机制,判定链式结构所处安全状态。最后,调整各分支链中间过渡状态,建立四分支链式结构区块链头部静态轮换机制,使四分支链间平稳过渡。本系统在数据存储速率、通信开销方面均具有很大优势。

    一种基于数据质量的多模态异构数据存储方法及系统

    公开(公告)号:CN114661832B

    公开(公告)日:2024-08-13

    申请号:CN202210281261.X

    申请日:2022-03-22

    Applicant: 辽宁大学

    Abstract: 本发明是一种基于数据质量的多模态异构数据存储方法及系统,包括以下步骤:1)将原始本文数据以key‑value格式在原始数据库中进行分布式存储;2)针对原始多媒体类数据进行数据建模,以文件的形式在文件数据库中进行分布式存储;3)将key‑value数据转换为关系型数据,构建关系数据库;4)根据关系数据库中实体之间的关系构建图数据库;5)将实体的活动数据以链式的结构进行数据建模,构建链式数据库;6)将多媒体数据转换为文本数据,按数据类型分别存储于多媒体数据库及原始数据库;7)通过构建多级索引结构将各个子数据库的实体数据进行链接;8)针对数据集成方法以及各个子数据库构建多模态数据库的日志文件维护体系。该方法可以大大减少查询数据所需的时间,保证相关人员使用数据时的效率。

    四分支链式结构金融区块链存储方法

    公开(公告)号:CN112947868B

    公开(公告)日:2024-05-03

    申请号:CN202110377277.6

    申请日:2021-04-08

    Applicant: 辽宁大学

    Abstract: 一种四分支链式结构金融区块链存储方法,首先构建四分支链式结构金融区块链三元账本结构,数据存储在四分支链式结构的区块体中,根据不同的存储环境采用三元模式进行数据存储:全聚合存储、多单元存储、全分割存储,通过数据分流并行存储,提高数据存储效率。其次构建四分支链式结构存储模型,包括自由竞争链式结构、串行集中链式结构、Z字回形链式结构、并行平均链式结构,以四种链式结构为载体进行数据存储。再次,建立四分支链式结构安全性判识机制,判定链式结构所处安全状态。最后,调整各分支链中间过渡状态,建立四分支链式结构区块链头部静态轮换机制,使四分支链间平稳过渡。本系统在数据存储速率、通信开销方面均具有很大优势。

    一种基于注意力机制的端到端语音识别模型和外部语言模型的集成方法

    公开(公告)号:CN117198274A

    公开(公告)日:2023-12-08

    申请号:CN202311163637.8

    申请日:2023-09-11

    Applicant: 辽宁大学

    Abstract: 一种基于注意力机制的端到端语音识别模型和外部语言模型的集成方法,属于语音识别技术领域。具体包括以下步骤:1、将待训练的纯文本数据集输入至外部语言模型进行训练生成外部语言模型;2、将对齐的语音、文本数据集输入至基于注意力机制的端到端语音识别模型进行训练生成语音识别模型;3、将用于训练的语音识别模型的纯文本数据集再次放入独立出语音识别模型的解码器中进行训练得到一个预测好的内部语言模型;4、对所述外部语言模型、语音识别模型和预测好的内部语言模型的得分进行集成并进行解码得到语音识别结果。本发明可以极大改善集成模型的准确率,在语音识别领域有着极高的应用前景。

Patent Agency Ranking