分布式轨迹流伴随模式挖掘方法

    公开(公告)号:CN113779105B

    公开(公告)日:2022-12-13

    申请号:CN202110921144.0

    申请日:2021-08-11

    Abstract: 本发明涉及轨迹数据技术领域,涉及一种分布式轨迹流伴随模式挖掘方法,包括以下步骤:一、数据预处理:根据地理区域的划分将数据划分为多个区域,得到分区边界,输出分区编号;二、监测不断到达的数据流;三、当前快照创建时间窗口,窗口大小为当前快照时间;四、根据分区编号执行Keyby算子,利用哈希函数分发到不同的节点;五、每个节点对接收到的当前分区的数据执行基于方向的密度聚类,并得到当前分区的密度聚类簇集合;六、进行聚类合并,输出合并后簇的集合;七、执行模式挖掘,与候选伴随集合取交集,生成新的候选伴随,并输出当前快照的伴随模式结果。本算法具有更快的处理速度。

    基于图嵌入在异构信息网络视角下为课题推荐学生的方法

    公开(公告)号:CN115422170A

    公开(公告)日:2022-12-02

    申请号:CN202210827339.3

    申请日:2022-07-13

    Abstract: 本发明公开了基于图嵌入在异构信息网络视角下为课题推荐学生的方法,包括如下步骤:数据预处理;构建异构信息网络图;在异构信息网络图下,通过随机游走算法,获取不同节点的信息序列;为序列中的节点进行位置信息建模,并通过多头自注意力层帮助模型理解当前节点在该序列中的含义,将多头自注意力层的结果进行残差连接和前馈网络操作,输出课题节点吸收序列中信息后的向量权重;构建课题‑学生之间的正负样本,通过损失计算,对模型进行反馈训练,得到最优模型;本发明引入位置向量编码与随机游走的结合,加入多头自注意力机制,使得序列间的节点信息关联传递不受距离影响,且使得模型的计算复杂度更优,能实现精确、快速的为新课题推荐学生。

    一种电子商务平台用户重复购买行为预测方法

    公开(公告)号:CN110956497B

    公开(公告)日:2022-11-25

    申请号:CN201911181002.4

    申请日:2019-11-27

    Abstract: 本发明公开了一种电子商务平台用户重复购买行为预测方法,包括:获取用户历史购买行为数据;采用分段下采样方法进行样本均衡处理;构建用户特征、商户特征、用户与商户交互特征和隐藏特征;将样本均衡的用户历史购买行为数据输入至双层注意力BiGRU个体模型中,将用户特征、商户特征、用户与商户交互特征和隐藏特征输入至深度Catboost个体模型和DeepGBM个体模型中;对各个体模型分别进行用户重复购买行为预测训练;通过Vote‑Stacking模型,对训练后的各个体模型进行融合,并采用多数投票决策机制输出最终预测结果。本发明融合深度Catboost个体模型、双层注意力BiGRU个体模型和DeepGBM个体模型,对用户历史购买数据中离散的购买记录数值和行为序列特征进行建模,提高了预测结果的准确性。

    一种平滑自回归基数估计方法

    公开(公告)号:CN115328972A

    公开(公告)日:2022-11-11

    申请号:CN202211024149.4

    申请日:2022-08-24

    Abstract: 本发明涉及数据库系统查询优化的基数估计技术领域,具体地说,涉及一种平滑自回归基数估计方法,包括:S1、将数据库表格数据编码后得到编码数据x;S2、对x进行平滑,期间复制x来引入不同程度的噪声得到平滑数据xrs和微弱平滑数据xcls,拼接所有平滑数据后得到输入xin;S3、将xin喂给平滑自回归模型,并进行训练;S4、通过训练好的模型进行基数估计。本发明能够达到目前最先进的基数估计准确度,能较出色地完成基数估计任务。

    基于双区块链保护下教育数据共享方法

    公开(公告)号:CN115270173A

    公开(公告)日:2022-11-01

    申请号:CN202210653636.0

    申请日:2022-06-09

    Abstract: 本发明涉及数据共享技术领域,涉及一种基于双区块链保护下教育数据共享方法,包括:1、用户DG‑ID‑A通过TDSC合约修改SHATE;2、用户DG‑ID‑B使用私钥SKB对待分享课程的课程标识和身份标识进行签名操作,并发送到智能合约;TDSC合约收到请求后,先调用DIRCC合约对身份进行权限检查,并且权限结果返回TDSC合约,将DG‑ID‑B的权限等级与SHATE进行匹配;3、DG‑ID‑A收到请求后,使用私钥将AES密钥进行加密发送,DG‑ID‑B对数据进行解密,得到AES密钥;4、DG‑ID‑B通过AES密钥对数据进行解密,得到原始数据。本发明能较佳地保护了教育数据共享过程的安全性。

    一种完全注意力机制的属性级情感分析方法

    公开(公告)号:CN111259153B

    公开(公告)日:2021-06-22

    申请号:CN202010072375.4

    申请日:2020-01-21

    Abstract: 本发明公开一种完全注意力机制的属性级情感分析方法,该方法结合基于自注意力机制网络SAM‑NN和特定方面注意力机制网络AAM‑NN来分别生成词汇级别、句子级别语义特征,最后通过一个全连接神经网络FC‑NN输出层计算评论句子内容的情感极性。本发明所提出的方法在实现上是并行结构的,并且在每一个网络计算模块,本发明都融合了特定方面信息特征,保证了该方法在尽可能的根据特定方面信息进一步分析出用户评论信息中关于目标对象特定属性方面的情感极性。与现有技术相比,本发明方法不仅有效提高特定方面情感分析任务的准确率,而且有效减少在模型训练时间上的花费。

    基于激活-池化增强BERT模型的在线课程评论情感分析方法

    公开(公告)号:CN111310474A

    公开(公告)日:2020-06-19

    申请号:CN202010065670.7

    申请日:2020-01-20

    Abstract: 本发明公开了一种基于激活-池化增强BERT模型的在线课程评论情感分析方法,涉及在线课程评估技术领域,包括构建在线课程评论情感分析模型来编码评论文本中分句内词语上下文语义和分句间逻辑关系;设计激活函数层和最大-平均池化层解决BERT模型在课程评论情感分析中存在的过拟合问题;通过新增的情感分类层对在线课程评论进行情感正负极性分类。本发明改进了直接应用BERT模型做课程评论情感分析任务时出现过拟合的问题,同时增加了情感分类层对课程评论情感进行分析;相对于传统课程评论情感分析模型,在线课程评论情感分析模型具有精确度高,训练容易的优点,该模型的准确率和AUC值与基准模型相比分别有显著的提升。

    一种数据自适应平衡分组方法

    公开(公告)号:CN110175651A

    公开(公告)日:2019-08-27

    申请号:CN201910452021.X

    申请日:2019-05-28

    Abstract: 本发明公开一种数据自适应平衡分组方法,将数据块边界点信息加入到传统聚类中,并将该聚类算法运用于分布式环境中结点数据分组中,利用数据块边界点信息约束数据块大小,使不同数据块之间满足较高的平衡性,解决了现有基于聚类的数据分组方法效率较低的问题,同时还提高了数据分组的准确率,具有很高的实用价值。

Patent Agency Ranking