一种基于访问热度的时空数据服务调度方法

    公开(公告)号:CN104580447B

    公开(公告)日:2019-04-09

    申请号:CN201410848528.4

    申请日:2014-12-29

    Abstract: 本发明涉及一种基于访问热度的时空数据服务调度方法。该方法是:1)采集服务系统中各存储介质的参数,以及服务系统中各计算节点的参数;2)根据采集的数据编制数据服务系统的网络拓扑图;3)根据所述网络拓扑图,把时空数据进行时空分片,采集并记录每个时空区块的访问数据访问的热度;4)根据访问热度调整数据的分布位置,并对计算节点进行调度。所述访问热度是指不同的时空区间内用户访问某些服务的频度。本发明能够将数据从存储介质到计算节点的多路径进行建模,系统根据数据的访问热度把数据分布在不同的存储介质,计算节点通过不同的网络途径获取所需的数据,从而降低数据服务系统的响应时间,提高数据服务系统的服务质量。

    一种基于WEB的多模型数据可视化开发方法及平台

    公开(公告)号:CN104572096A

    公开(公告)日:2015-04-29

    申请号:CN201410849397.1

    申请日:2014-12-29

    Abstract: 本发明涉及一种基于WEB的多模型数据可视化开发方法及平台。该可视化平台通过多模型驱动的方式实现对数据的解析及可视化图形的配置,包括数据配置模型和可视化配置模型;所述数据配置模型接收原始数据并对原始数据进行处理,解析出数据各维度的元数据结构,同时提供给用户多粒度的数据选择方式;所述可视化配置模型将所述数据配置模型的输出作为输入,选择相应的可视化图形,并智能推送可视化配置项,最终输出可视化结果。本发明能够解决不同平台、不同技术路线之间的集成和互操作性问题,定义良好的接口可适应将来出现的新数据源与可视化方法,能够提升开发效率,通过友好的人机交互满足用户对数据可视化的需求。

    一种PDF文档智能标注与抽取方法

    公开(公告)号:CN116070602B

    公开(公告)日:2023-10-17

    申请号:CN202310016945.1

    申请日:2023-01-05

    Abstract: 本发明公开了一种PDF文档智能标注与抽取方法,其步骤包括:1)利用文本抽取模块抽取PDF文档中的文字信息和文字位置坐标;2)利用智能标注模型对抽取出的所述文字信息进行标注;3)利用标注回显模块将实体信息和实体关系信息使用统一的格式放入数据库中并在PDF文档上回显,并根据预先定义的知识本体进行标注筛选:31)定义知识本体和关系;32)对定义的实体名和关系名进行向量化,基于向量的余弦相似度计算每一个名称对应的智能标注模型中标出的实体和关系;33)根据从PDF文档抽取的文字和文字坐标信息,将筛选出的实体和关系定位到在PDF上;34)在原始PDF上建立一个智能标注层,标注出实体类别和关系类别。

    基于知识图谱增强的自动可解释性疾病自动诊断装置

    公开(公告)号:CN116168825A

    公开(公告)日:2023-05-26

    申请号:CN202211687077.1

    申请日:2022-12-27

    Abstract: 本公开涉及一种基于知识图谱增强的可解释性疾病自动诊断装置,所述装置包括:数据获取模块,用于获取患者的症状和医生对每一症状的补充说明;数据增强模块,用于结合所述补充说明,计算各症状的增强表示;路径推断模块,用于在知识图谱中基于所述增强表示进行路径推断,得到每一症状对应的路径集合;其中,所述知识图谱中的实体包括:疾病、症状、手术、药物、描述、相关疾病和相关症状,所述知识图谱中的关系包括:相关于、手术史有和疾病表现,所述路径集合中的路径是以疾病实体为终点的路径;症状推断模块,用于计算所有路径终点对应的疾病出现概率和/或奖励,以得到所述症状的诊断结果。本发明实现了疾病诊断和原因解释两个目的。

    一种PDF文档智能标注与抽取方法

    公开(公告)号:CN116070602A

    公开(公告)日:2023-05-05

    申请号:CN202310016945.1

    申请日:2023-01-05

    Abstract: 本发明公开了一种PDF文档智能标注与抽取方法,其步骤包括:1)利用文本抽取模块抽取PDF文档中的文字信息和文字位置坐标;2)利用智能标注模型对抽取出的所述文字信息进行标注;3)利用标注回显模块将实体信息和实体关系信息使用统一的格式放入数据库中并在PDF文档上回显,并根据预先定义的知识本体进行标注筛选:31)定义知识本体和关系;32)对定义的实体名和关系名进行向量化,基于向量的余弦相似度计算每一个名称对应的智能标注模型中标出的实体和关系;33)根据从PDF文档抽取的文字和文字坐标信息,将筛选出的实体和关系定位到在PDF上;34)在原始PDF上建立一个智能标注层,标注出实体类别和关系类别。

    基于电子病历的眼科疾病信息提取方法和辅助诊断装置

    公开(公告)号:CN115691786A

    公开(公告)日:2023-02-03

    申请号:CN202211312617.8

    申请日:2022-10-25

    Inventor: 崔文娟 叶旭 杜一

    Abstract: 本发明涉及一种基于电子病历的眼科疾病信息提取方法和辅助诊断装置。该方法包括:对眼科疾病电子病历中的各段文本进行阴性描述和阳性描述的区分抽取;对阳性描述和阴性描述分别进行语义编码,获得阳性描述静态语义表示向量和阴性描述静态语义表示向量,对其进行联合编码得到动态语义表示向量;以动态语义表示向量和各个疾病的标签嵌入向量为输入,提取与不同眼科疾病相关的信息,输出眼科疾病相关信息表示向量。该装置以眼科疾病相关信息表示向量作为神经网络的输入,输出疾病预测概率。本发明以电子病历数据为输入,输出其是否罹患各种眼科疾病,能够达到眼科疾病信息提取以及眼科疾病辅助诊断的目的。

    一种基于LightGBM分类与表示学习的姓名消歧方法和系统

    公开(公告)号:CN113962293B

    公开(公告)日:2022-10-14

    申请号:CN202111153524.0

    申请日:2021-09-29

    Abstract: 本发明面向科学文献数据,针对文献中作者同名现象提出一种基于LightGBM分类与表示学习的姓名消歧方法和系统。监督学习部分利用特征工程提取训练集论文的元信息特征和论文间的关联信息特征,通过采样构建正例与负例样本对数据集,作为LightGBM二分类模型的输入,模型输出作为两篇论文属于同一作者的概率。表示学习部分引用word2vec文本语义表示方法和基于元路径的关系网络表征方法,来捕捉论文的语义信息和论文之间的关系特征。最后,基于监督模型和表示学习模型的输出,利用层次聚类算法对待消歧论文集进行簇划分,实现同名消歧。本发明能够在不损失精确率与召回率的前提下,达到高可扩展性与稳定性,并且可以完全实现并行化计算,以加快执行效率。

    一种基于异质图卷积神经网络嵌入的作者名字消歧方法

    公开(公告)号:CN110516146B

    公开(公告)日:2022-08-19

    申请号:CN201910635799.4

    申请日:2019-07-15

    Abstract: 本发明公开了一种基于异质图卷积神经网络嵌入的作者名字消歧方法,其步骤为:1)对于一待消歧的目标作者名,收集以该目标作者名所著的出版物,然后根据所收集出版物的标题、作者列表和出版刊物信息构建出版物异质属性网络;2)根据所述出版物异质属性网络,通过基于元路径随机游走策略生成包含出版物节点邻居节点文本信息的路径;3)根据所述出版物异质属性网络以及所述路径,基于异质图卷积神经网络嵌入模型学习每一出版物的表征向量;4)根据所述出版物异质属性网络和所述出版物的表征向量,构建该目标作者名的出版物同质网络;5)对所述出版物同质网络进行划分,得到若干簇;其中同一簇中的出版物为同一人的出版物集合。

    一种基于网络表征和语义表征的同名作者消歧方法

    公开(公告)号:CN111191466B

    公开(公告)日:2022-04-01

    申请号:CN201911352416.9

    申请日:2019-12-25

    Abstract: 本发明公开了一种基于网络表征和语义表征的同名作者消歧方法。本方法为:1)提取目标论文库中各论文的语义特征和离散特征;2)基于离散特征计算各论文间的相似度,得到论文的关系相似性矩阵;如果一论文与其他论文没有共同作者或机构,则将其加入一离群论文集中;3)基于各论文的所述语义特征计算论文的语义相似度矩阵;将目标论文库中不包含语义特征的论文加入离群论文集中;4)将关系相似性矩阵和语义相似度矩阵加权求和,获得论文相似度矩阵并对其进行聚类;将不属于任何簇的论文加入离群论文集中;5)利用基于相似度阈值匹配的方法将离群论文集中的论文分配到对应的簇中。本发明实现高准确率的论文同名作者的消歧。

Patent Agency Ranking