-
公开(公告)号:CN118484481B
公开(公告)日:2025-05-02
申请号:CN202410663869.8
申请日:2024-05-27
Applicant: 哈尔滨工业大学
IPC: G06F16/2458 , G06F16/29 , G06F18/22 , G06F18/23213 , G06N3/0455 , G06N3/048 , G06N3/0499 , G06N3/08
Abstract: 一种基于时空信息提取的轨迹相似度分析方法、电子设备及存储介质,属于城市智能计算和数据挖掘技术领域。为更全面准确地评估轨迹相似性,本发明采集时空轨迹数据,进行数据清洗、编码预处理,得到预处理后的时空轨迹数据输入到具有位置代码层的Transformer模型中进行处理,输出时空轨迹表征结果;将时空轨迹表征结果,通过余弦相似度进行T‑SNE降维处理,然后再进行K‑Means聚类,得到基于时空信息提取的轨迹相似度分析的可视化结果。本发明将复杂的轨迹数据转化为易于处理的向量形式,进而利用相似度分析算法对轨迹数据进行高效的比对和分类。这不仅能够提高数据分析的效率,还能够提升分析的准确性和可靠性。
-
公开(公告)号:CN118484481A
公开(公告)日:2024-08-13
申请号:CN202410663869.8
申请日:2024-05-27
Applicant: 哈尔滨工业大学
IPC: G06F16/2458 , G06F16/29 , G06F18/22 , G06F18/23213 , G06N3/0455 , G06N3/048 , G06N3/0499 , G06N3/08
Abstract: 一种基于时空信息提取的轨迹相似度分析方法、电子设备及存储介质,属于城市智能计算和数据挖掘技术领域。为更全面准确地评估轨迹相似性,本发明采集时空轨迹数据,进行数据清洗、编码预处理,得到预处理后的时空轨迹数据输入到具有位置代码层的Transformer模型中进行处理,输出时空轨迹表征结果;将时空轨迹表征结果,通过余弦相似度进行T‑SNE降维处理,然后再进行K‑Means聚类,得到基于时空信息提取的轨迹相似度分析的可视化结果。本发明将复杂的轨迹数据转化为易于处理的向量形式,进而利用相似度分析算法对轨迹数据进行高效的比对和分类。这不仅能够提高数据分析的效率,还能够提升分析的准确性和可靠性。
-
公开(公告)号:CN114862001A
公开(公告)日:2022-08-05
申请号:CN202210454436.2
申请日:2022-04-27
Applicant: 哈尔滨工业大学
Abstract: 一种基于区域功能增强特征的城市人群流量预测方法及系统,涉及城市智能计算技术领域,用以解决现有技术对于城市人群流量预测准确性不高的问题。本发明的技术要点包括:根据人群移动轨迹数据和城市兴趣点位置数据提取时空轨迹特征集和区域功能增强特征集,并将时空轨迹特征集和区域功能增强特征集结合输入预训练的机器学习预测模型中预测人群流量,其中,区域功能增强特征集包括基于兴趣点的区域功能增强特征集和基于轨迹的区域功能增强特征集。本发明中模型输入特征不仅考虑了轨迹特征,还考虑了兴趣点特征,即包含了基于城市各个区域功能影响的特征提取,可以有效地提高城市动态时空轨迹的流量预测结果的准确性。
-
公开(公告)号:CN118916739A
公开(公告)日:2024-11-08
申请号:CN202410944911.3
申请日:2024-07-15
Applicant: 哈尔滨工业大学
IPC: G06F18/24 , G06F18/25 , G06F18/214 , G06F18/10 , G06F16/9536 , G06Q50/00 , G06N3/0455 , G06N3/08
Abstract: 本发明涉及了一种基于编解码结构的用户生成内容目标立场联合检测方法及系统,涉及社交媒体的立场检测。本发明解决了立场检测任务的人工依赖问题,又消除了错误级联现象。技术要点:将预处理后的社交媒体文本数据输入编码器,编码器由序列编码器和经过微调的情感编码器构成,对查询向量之间使用自注意力机制,动态计算每个查询向量与其他查询向量的关联程度,从而更好地捕捉不同查询向量之间的依赖关系;然后,将编码器输出的序列特征输入解码器中,与查询向量做交叉注意力机制;将所有融合了序列特征的查询向量输入目标‑立场聚合层;将聚合后的查询向量与编码器输出的情感特征输入目标立场对解码层,首先通过注意力机制为查询向量与情感特征赋值权重,之后将两种特征进行拼接,得到最终的特征向量;将最终特征表示输入由两个全连接神经网络组成的解码器中以输出目标以及立场的预测结果。本发明应用于社交网络分析中。
-
公开(公告)号:CN117216397A
公开(公告)日:2023-12-12
申请号:CN202311237690.8
申请日:2023-09-22
Applicant: 哈尔滨工业大学
IPC: G06F16/9535 , G06F16/9537 , G06N3/044 , G06N3/08
Abstract: 本发明提出一种基于区域影响的深度矩阵分解的POI推荐方法,属于智能推荐技术领域。包括:S1.获取POI数据,进行预处理,并构建用户兴趣点矩阵;S2.对用户兴趣点进行偏置分析;S3.对用户兴趣点矩阵进行正则化处理;S4.构建POI图获取POI功能嵌入表示,构建Region图获取区域嵌入表示;S5.获取区域影响指数和关联区域特征的用户兴趣点偏置矩阵;S6.构建深度矩阵分解模型,训练模型,预测用户对未知兴趣点的兴趣程度。本发明通过学习用户和POI之间的潜在特征向量,能够更好地捕捉用户的兴趣和POI的特征。通过对用户‑POI矩阵的分解和补全,能够准确地预测用户的POI访问偏好,并生成个性化的推荐结果。
-
公开(公告)号:CN117540746B
公开(公告)日:2024-07-19
申请号:CN202311709913.6
申请日:2023-12-13
Applicant: 哈尔滨工业大学
IPC: G06F40/295 , G06F40/169 , G06F18/214 , G06F18/21 , G06N3/048 , G06N3/0455 , G06N3/096
Abstract: 一种基于多任务迁移的众包命名实体识别个性化提示微调方法及系统,属于众包命名实体识别技术领域。本发明为了解决使用现有的提示方法在众包场景下进行提示微调时识别准确率低、识别效果差的问题而提出的。技术要点:先构建个性化提示生成器:个性化提示生成器针对每个标注者构建私有提示,针对所有标注者构建公有提示,初始化后经过训练过程得到用于预测的私有提示、公有提示,二者再生成最终软提示,最终软提示再通过提示生成网络生成三种注意力机制对应的K、V;再将K、V输入给基于软提示微调的Transformer构架下的模型,得到参数改变后的预训练模型。实验证明,我们提出的PPG能够显著提升已有基于预训练模型的软提示微调命名实体识别方法在众包数据上的效果。
-
公开(公告)号:CN117540746A
公开(公告)日:2024-02-09
申请号:CN202311709913.6
申请日:2023-12-13
Applicant: 哈尔滨工业大学
IPC: G06F40/295 , G06F40/169 , G06F18/214 , G06F18/21 , G06N3/048 , G06N3/0455 , G06N3/096
Abstract: 一种基于多任务迁移的众包命名实体识别个性化提示微调方法及系统,属于众包命名实体识别技术领域。本发明为了解决使用现有的提示方法在众包场景下进行提示微调时识别准确率低、识别效果差的问题而提出的。技术要点:先构建个性化提示生成器:个性化提示生成器针对每个标注者构建私有提示,针对所有标注者构建公有提示,初始化后经过训练过程得到用于预测的私有提示、公有提示,二者再生成最终软提示,最终软提示再通过提示生成网络生成三种注意力机制对应的K、V;再将K、V输入给基于软提示微调的Transformer构架下的模型,得到参数改变后的预训练模型。实验证明,我们提出的PPG能够显著提升已有基于预训练模型的软提示微调命名实体识别方法在众包数据上的效果。
-
公开(公告)号:CN114862001B
公开(公告)日:2023-06-02
申请号:CN202210454436.2
申请日:2022-04-27
Applicant: 哈尔滨工业大学
Abstract: 一种基于区域功能增强特征的城市人群流量预测方法及系统,涉及城市智能计算技术领域,用以解决现有技术对于城市人群流量预测准确性不高的问题。本发明的技术要点包括:根据人群移动轨迹数据和城市兴趣点位置数据提取时空轨迹特征集和区域功能增强特征集,并将时空轨迹特征集和区域功能增强特征集结合输入预训练的机器学习预测模型中预测人群流量,其中,区域功能增强特征集包括基于兴趣点的区域功能增强特征集和基于轨迹的区域功能增强特征集。本发明中模型输入特征不仅考虑了轨迹特征,还考虑了兴趣点特征,即包含了基于城市各个区域功能影响的特征提取,可以有效地提高城市动态时空轨迹的流量预测结果的准确性。
-
公开(公告)号:CN117436449B
公开(公告)日:2024-07-09
申请号:CN202311442418.3
申请日:2023-11-01
Applicant: 哈尔滨工业大学
IPC: G06F40/295 , G06F16/35 , G06N3/0464 , G06N3/0442 , G06N3/0455 , G06N3/047 , G06N3/084 , G06N3/092
Abstract: 一种基于多源域适应和强化学习的众包命名实体识别模型及系统,属于众包命名实体识别技术领域。本发明为了解现有的使用域适应模型解决众包问题的方法往往没有充分考虑标注者的可靠性导致低质量标注者的数据对模型训练产生负面影响、以及现有众包命名实体识别方法在处理低质量标注者提交的极低质量数据时存在困难等问题。通过考虑标注者可靠性生成合成的专家表示,并采用基于强化学习的实例选择器丢弃低质量的标注,从而提高命名实体识别模型在众包数据集上的性能,本发明加深了对众包命名实体识别领域适应方法中标注者可靠性的理解,提出了一种基于强化学习的数据预处理实例选择器,并展示了其在解决众包标注中的命名实体识别挑战方面的有效性。本发明用于在无监督众包数据中高效地提取命名实体信息。
-
公开(公告)号:CN118070774A
公开(公告)日:2024-05-24
申请号:CN202410353286.5
申请日:2024-03-26
Applicant: 哈尔滨工业大学
IPC: G06F40/194 , G06F40/242 , G06F40/216
Abstract: 一种基于目标信息识别的用户生成内容立场检测方法及系统,涉及社交网络数据处理技术领域。本发明为了解决现有的用户生成内容立场检测或识别方法需要花费大量人工成本去标注目标信息,并且仅有的类似方法在目标识别阶段往往需要大规模数据对模型进行训练或微调,导致样本数据质量会直接影响目标识别的性能和准确率的问题。技术要点:首先从给定社交媒体文本中抽取出具有代表性的关键词;然后通过余弦相似度计算关键词与目标集合中特定目标之间的相似度,并根据相似度将确定文本所针对的目标对象;最后基于识别出的目标对象,采用多任务BERTweet模型来检测文本与该目标对象之间的立场关系。本发明所提出的基于目标信息识别的用户生成内容立场检测方法可有效减少人工成本,从而提高了立场检测方法在实际应用中的可行性和实用性。
-
-
-
-
-
-
-
-
-