一种面向数字教育资源的实体对齐方法及系统

    公开(公告)号:CN110162591B

    公开(公告)日:2022-08-19

    申请号:CN201910431436.9

    申请日:2019-05-22

    Abstract: 本发明公开了一种面向数字教育资源的实体对齐方法及系统,首先通过学科主题树对已有教育资源库进行学科分块,并在每个教育资源块内构建分区索引体系;然后SKE算法提取待对齐数字教育资源的知识点标签,通过索引筛选出实体对齐候选集;接着计算候选集中实体对的知识点标签相似性、属性值相似度和文本资源相似度;最后通过将计算得到的实体对相似性数据作为特征值输入构建好的决策树,判定其对齐结果。采用本方法进行数字教育资源的实体对齐,能够大幅度降低实体对齐计算复杂度,提高对齐效率;提升数字教育资源的文本相似度计算精度,从而提高实体对齐准确率。

    基于kalman-RNN神经网络的飞锯寿命预测方法

    公开(公告)号:CN110287638A

    公开(公告)日:2019-09-27

    申请号:CN201910597647.X

    申请日:2019-07-04

    Abstract: 本发明公开了一种基于kalman-RNN神经网络的飞锯寿命预测方法,首先,采集锯片磨损数据集,这为以后进行对比分析做准备。然后,对被切材料、锯片直径、锯切速度、锯切深度、锯切宽度、每齿进刀量、齿数、齿距等工艺参数进行分析,最终选择锯片直径、锯切速度、锯切深度、锯切宽度、每齿进刀量、齿数、齿距作为神经网络的输入;神经网络对应时刻输出为预测的寿命,即磨损百分比,并结合Kalman滤波技术将其和对应时刻的实际测量值进行融合、比对、更新神经网络对应时刻的输出,依此提高该算法寿命预测的精度。

    基于自然语言处理的教育资源质量评价挖掘方法及系统

    公开(公告)号:CN110147552B

    公开(公告)日:2022-12-06

    申请号:CN201910431440.5

    申请日:2019-05-22

    Abstract: 本发明公开了一种基于自然语言处理的教育资源质量评价挖掘方法及系统,首先从海量教育评论数据中使用自然语言处理技术挖掘用户评价观点,以 二元组存储。其次,以 为指标结点建立。然后基于教育资源语料库通过神经网络对词向量进行训练,建立词到向量的模型。再对评价对象进行聚类,再按照floyd算法选出中心向量。接着对评价词进行聚类,生成资源评价指标树,选出的中心向量作为评价指标树的结点,最后对评价词进行情感分析并打分输出。解决了基于众筹众创的数字教育评价数据量过大,人工评价方法成本高、难度大、主观性高等问题。

    一种基于参考序列的基因压缩方法

    公开(公告)号:CN110310709B

    公开(公告)日:2022-08-16

    申请号:CN201910598102.0

    申请日:2019-07-04

    Abstract: 本发明公开了一种基于参考序列的基因压缩方法,首先任意选取一个基因序列作为参考序列。其次,获取参考序列的小写字符和ACGT,并以二元组表示小写字符。然后,读取参考文件,获得参考文件的头部、换行信息、小写字符、N字符、碱基信息和其他字符,并将换行长度、小写字符、N字符和其他字符表示成二元组。接着,匹配参考序列和待压缩序列的小写字符二元组。最后匹配Hash值。解压缩过种采用压缩过程相反的步骤。采用本压缩方法的压缩比高,压缩速度快,而且二元组编码与基因次序无关,有利于分布式存储和分析基因序列。

    一种基于参考序列的基因压缩方法

    公开(公告)号:CN110310709A

    公开(公告)日:2019-10-08

    申请号:CN201910598102.0

    申请日:2019-07-04

    Abstract: 本发明公开了一种基于参考序列的基因压缩方法,首先任意选取一个基因序列作为参考序列。其次,获取参考序列的小写字符和ACGT,并以二元组表示小写字符。然后,读取参考文件,获得参考文件的头部、换行信息、小写字符、N字符、碱基信息和其他字符,并将换行长度、小写字符、N字符和其他字符表示成二元组。接着,匹配参考序列和待压缩序列的小写字符二元组。最后匹配Hash值。解压缩过种采用压缩过程相反的步骤。采用本压缩方法的压缩比高,压缩速度快,而且二元组编码与基因次序无关,有利于分布式存储和分析基因序列。

    一种基于交互数据聚类的个性化推荐方法及系统

    公开(公告)号:CN110162706A

    公开(公告)日:2019-08-23

    申请号:CN201910431441.X

    申请日:2019-05-22

    Abstract: 本发明公开了一种基于交互数据聚类的个性化推荐方法及系统,包括构建用户项目交互特征矩阵、构建用户历史行为矩阵、使用分类器对交互矩阵P进行分类、相似用户聚类、邻近项目选择、神经网络训练、个性化推荐,本发明将用户对项目的浏览记录、用户搜索记录等历史信息与用户个人信息拼接构造用户特征,使用聚类算法对用户特征进行聚类,并在此基础上对特定用户进行个性化推荐,改进了传统矩阵分解模型的性能,将矩阵分解与多层感知机结合,对用户项目间的关系进行学习预测。提升了大数据环境下推荐的精度。

    基于自然语言处理的教育资源质量评价挖掘方法及系统

    公开(公告)号:CN110147552A

    公开(公告)日:2019-08-20

    申请号:CN201910431440.5

    申请日:2019-05-22

    Abstract: 本发明公开了一种基于自然语言处理的教育资源质量评价挖掘方法及系统,首先从海量教育评论数据中使用自然语言处理技术挖掘用户评价观点,以 二元组存储。其次,以 为指标结点建立。然后基于教育资源语料库通过神经网络对词向量进行训练,建立词到向量的模型。再对评价对象进行聚类,再按照floyd算法选出中心向量。接着对评价词进行聚类,生成资源评价指标树,选出的中心向量作为评价指标树的结点,最后对评价词进行情感分析并打分输出。解决了基于众筹众创的数字教育评价数据量过大,人工评价方法成本高、难度大、主观性高等问题。

    基于kalman-RNN神经网络的飞锯寿命预测方法

    公开(公告)号:CN110287638B

    公开(公告)日:2022-09-13

    申请号:CN201910597647.X

    申请日:2019-07-04

    Abstract: 本发明公开了一种基于kalman‑RNN神经网络的飞锯寿命预测方法,首先,采集锯片磨损数据集,这为以后进行对比分析做准备。然后,对被切材料、锯片直径、锯切速度、锯切深度、锯切宽度、每齿进刀量、齿数、齿距等工艺参数进行分析,最终选择锯片直径、锯切速度、锯切深度、锯切宽度、每齿进刀量、齿数、齿距作为神经网络的输入;神经网络对应时刻输出为预测的寿命,即磨损百分比,并结合Kalman滤波技术将其和对应时刻的实际测量值进行融合、比对、更新神经网络对应时刻的输出,依此提高该算法寿命预测的精度。

    一种基于交互数据聚类的个性化推荐方法及系统

    公开(公告)号:CN110162706B

    公开(公告)日:2021-10-26

    申请号:CN201910431441.X

    申请日:2019-05-22

    Abstract: 本发明公开了一种基于交互数据聚类的个性化推荐方法及系统,包括构建用户项目交互特征矩阵、构建用户历史行为矩阵、使用分类器对交互矩阵P进行分类、相似用户聚类、邻近项目选择、神经网络训练、个性化推荐,本发明将用户对项目的浏览记录、用户搜索记录等历史信息与用户个人信息拼接构造用户特征,使用聚类算法对用户特征进行聚类,并在此基础上对特定用户进行个性化推荐,改进了传统矩阵分解模型的性能,将矩阵分解与多层感知机结合,对用户项目间的关系进行学习预测。提升了大数据环境下推荐的精度。

    一种基于Hadoop的并行化基因数据压缩方法

    公开(公告)号:CN110299187B

    公开(公告)日:2022-03-22

    申请号:CN201910597641.2

    申请日:2019-07-04

    Abstract: 本发明公开了一种基于Hadoop的并行化基因数据压缩方法,事先从待压缩基因序列中选取并通过k‑mer构建Hash表编码参考序列,并将参考序列存储为索引文件。启动Hadoop集群,将配置、索引和待压缩文件传到HDFS上,配置MapReduce任务,在Map任务中读取待压缩序列的所有信息,使用Combiner与Partitioner对Map结果优化。在Reduce任务中进行待压缩序列与参考序列的匹配去重,最后将结果压缩输出。本发明使用分布式计算方式可以在读取单个基因实现并行化并提高效率,还可以实现多条基因序列的并行处理,以实现处理压缩大批量基因文件的加速。

Patent Agency Ranking