-
公开(公告)号:CN111932026A
公开(公告)日:2020-11-13
申请号:CN202010878028.0
申请日:2020-08-27
Applicant: 西南交通大学
Abstract: 本发明公开了一种基于数据融合和知识图谱嵌入的城市流量模式挖掘方法,包括步骤:多源异构数据预处理、实体提取和关系提取、多源数据融合和城市流量模式的知识三元组挖掘。本发明的有益效果在于,构建有效的城市交通流量知识图谱,可用于对不同日期和不同时间的交通流量进行预测,或者对整个城市相同的交通流量模式进行概览。
-
公开(公告)号:CN111382272A
公开(公告)日:2020-07-07
申请号:CN202010156828.1
申请日:2020-03-09
Applicant: 西南交通大学
Abstract: 本发明公开了一种基于知识图谱的电子病历ICD自动编码方法,涉及自然语言处理技术领域,其将电子病历字符序列中的字符映射为d维的字符嵌入矩阵,采用向量表示方法将电子病历字符序列X向量化,采用CNN网络从输入特征向量中学习到文本语义信息;构建临床医学知识图谱,采用图嵌入表示方法,根据临床医学知识图谱和ICD编码信息得到图嵌入表示Yg;采用注意力机制,根据上层序列向量H和图嵌入表示Yg计算得到高级别序列向量V;对高级别序列向量V进行标签判定,得到预测标签,使用正确标签和预测标签的二元交叉熵作为目标函数,完成电子病历ICD自动编码。本发明能减少研究时间和匹配错误,可以吸纳医生经验,能够仅提取局部有用信息。
-
公开(公告)号:CN111309930A
公开(公告)日:2020-06-19
申请号:CN202010151549.6
申请日:2020-03-06
Applicant: 西南交通大学
IPC: G06F16/36
Abstract: 本发明提供了一种基于表示学习的医学知识图谱实体对齐方法,实体的完全字符串匹配,去除公有实体得到待对齐实体;通过知识表示学习模型对两个知识图谱中的三元组进行训练,得到每个实体的嵌入向量;计算待对齐实体与标准实体的语义距离,找出语义距离值最高的前十个推荐实体;通过构造医学知识数据的词根集,去除词根完全不同的候选实体;判断待对齐实体与推荐实体是否为同一科室和部位,去除推荐实体中不可靠的结果;将最后获得的待对齐实体与推荐实体进行标注,找出推荐实体中与待对齐实体指向相同的实体,完成实体对齐。本发明在表示学习的基础上,根据医学领域知识的特点,加入词根和规则对候选实体进行筛选,得到更精确的实体对齐结果。
-
公开(公告)号:CN109918671A
公开(公告)日:2019-06-21
申请号:CN201910184951.1
申请日:2019-03-12
Applicant: 西南交通大学
Abstract: 本发明公开了一种基于卷积循环神经网络的电子病历实体关系抽取方法,该方法包括:利用数据构造器对自然语句进行重新构造得到多维层次序列;采用向量表示技术将多维层次序列映射为输入特征向量;采用卷积循环神经网络ConvLSTM同时捕捉语句的局部与全局语义信息,得到上层句子向量;采用两级注意力机制捕获与语义关系紧密关联的文本内容,获得高级别句子向量,以解决多实例误标签的问题;根据获取到的高级别句子向量进行关系判定,得到预测标签。本发明不依赖任何外部资源特征,仅通过数据重构与改进网络模型框架的方式以提升实体关系抽取性能。同时该发明的方法可以扩展到其他具有特征提取不充分与样本不均衡等问题的任务中。
-
公开(公告)号:CN107644063A
公开(公告)日:2018-01-30
申请号:CN201710771475.4
申请日:2017-08-31
Applicant: 西南交通大学
IPC: G06F17/30
Abstract: 本发明的公开了一种基于数据并行的时间序列分析方法及系统,本方法在解决时间序列数据分析问题时,不需要划分应用程序,也不需要将问题映射到分布式进程集合,根据本方法设计的应用程序将数据作为一个整体对待,运行时由计算平台自适应地创建进程,无需人为干预;本方法采用分段冗余的方式,通过计算过程中的数据冗余减少了通信量,提高了并行效率,并且对各计算节点的任务量平均分配,降低了集群资源要求,故不需要解决通信延迟大和负载不平衡的问题;根据本方法所适用的计算平台,设计出的应用程序可靠性强,即便某个进程或计算节点失效,剩余计算任务也可由其他进程或计算节点接替和完成,可以保证计算结果的正确性。
-
-
-
-