一种基于大数据的重点区域人群密度预测方法

    公开(公告)号:CN118690133A

    公开(公告)日:2024-09-24

    申请号:CN202410721670.6

    申请日:2024-06-05

    Abstract: 本发明属于人群密度预测领域,具体涉及一种基于大数据的重点区域人群密度预测方法;该方法包括:获取人群行为数据,采用自适应图注意力网络对人群行为数据进行对齐与融合,得到融合人群行为特征;对融合人群行为特征进行数据增强,得到增强数据;对增强数据进行多尺度卷积、融合和映射处理,得到多尺度特征表示;采用异构图卷积神经网络对多尺度特征表示进行特征表示学习,得到多维度特征表示;将多维度特征表示输入到密度预测模块中进行处理,得到人群密度预测结果;本发明可有效提高预测结果的准确性,帮助相关工作人员快速获取发生地信息和该区域内人员的流动情况,快速制定解决方案。

    一种基于大数据的广告高价值用户识别方法

    公开(公告)号:CN118014660A

    公开(公告)日:2024-05-10

    申请号:CN202410026232.8

    申请日:2024-01-08

    Abstract: 本发明涉及大数据领域,具体涉及一种基于大数据的广告高价值用户识别方法,包括获取广告信息数据集、用户信息数据集和流水数据集;对流水数据集进行划分得到多组用户流水样本,对每一组用户流水样本进行预处理得到对应的训练样本,构建广告高价值用户识别模型,采用训练样本集合训练广告高价值用户识别模型;并通过双阈值对比损失和偏权重交叉熵损失对广告高价值用户识别模型进行参数优化,直到模型收敛;获取待识别用户数据输入训练好的广告高价值用户识别模型,得到用户价值识别结果;本发明提升识别准确度。

    基于文本的变压器故障智能识别模型的训练方法及装置

    公开(公告)号:CN117493886A

    公开(公告)日:2024-02-02

    申请号:CN202311545744.7

    申请日:2023-11-16

    Abstract: 本发明涉及深度学习领域,特别涉及一种基于文本的变压器故障智能识别模型的训练方法及装置,所述方法包括将多标签变压器故障文本输入基于编码结构的文本语义模型得到变压器故障文本语义编码向量,并一同与通过文本语义模型嵌入层得到的故障类别文本语义向量输入跨注意力网络进行交互,得到变压器故障类别结果。训练时利用多标签及标签不平衡自适应损失函数MSLoss优化模型效果。本发明提出了文本标签域筛法TLDF与基于标签域掩码的生成对抗网络LM‑GAN,优化模型应对标签不平衡情况下的训练效果。本发明通过优化损失函数并利用文本中的标签域特征信息增强少样本数据,提升了模型性能和鲁棒性,实现了高准确率的变压器故障智能识别。

    一种基于多模态大数据的短视频舆情分类方法

    公开(公告)号:CN117372930A

    公开(公告)日:2024-01-09

    申请号:CN202311379146.7

    申请日:2023-10-24

    Abstract: 本发明涉及自然语言处理领域,具体涉及一种基于多模态大数据的短视频舆情分类方法,该方法包括:获取待处理的短视频数据和对应的标题数据;对标题数据进行预处理,得到标题向量特征;从短视频数据中抽取K帧图片,将K帧图片输入到多个patch输入视频编码模块中,得到视频向量特征;根据标题向量特征和视频向量特征计算数据特征向量;对数据特征向量添加高斯噪声,并输入到分类器,得到分类结果;本发明能够充分融合短视频舆情数据中的视频向量特征和文本向量特征得到数据向量特征,同时向数据向量特征中引入高斯噪声以增强模型的泛化性能。

    一种基于大数据的互联网假新闻识别方法

    公开(公告)号:CN117034905A

    公开(公告)日:2023-11-10

    申请号:CN202310985688.2

    申请日:2023-08-07

    Abstract: 本发明涉及自然语言处理技术领域,具体涉及一种基于大数据的互联网假新闻识别方法,包括:获取互联网新闻数据并进行预处理得到新闻文本数据集;采用贪婪策略对新闻文本数据集进行重复事件检测得到多个原始事件图;为每一个原始事件图设置相应的节点特征、边特征和簇特征,得到初始事件图;构造Motif特征提取器,并采用初始事件图进行训练;根据训练好的Motif特征提取器构建图模型,并采用初始事件图进行训练;将待识别互联网新闻输入训练好的图模型,输出待识别互联网新闻的真假判别结果;本发明对虚假信息进行早期检测并及时阻断其传播,极大降低虚假新闻带来的危害,营造清朗的网络舆论空间。

    一种基于大数据的道路路况预测方法

    公开(公告)号:CN116994427A

    公开(公告)日:2023-11-03

    申请号:CN202310807737.3

    申请日:2023-07-04

    Abstract: 本发明属于数据挖掘领域,具体涉及一种基于大数据的道路路况预测方法,包括:提取数据中的连续特征、类别特征以及空间特征;建立路况预测模型,基于动态注意力的多层感知机对连续特征和类别特征进行学习,基于拓扑子图的图神经网络对拓扑特征进行学习;将基于动态注意力的多层感知机输出向量和基于拓扑子图的图神经网络输出向量拼接在一起,通过分类层进行输出预测结果。本发明采用动态注意力的多层感知机将类别特征和离散特征充分挖掘,自动提取与道路拥堵情况联系更加紧密的深层特征并为他们赋予更高的权重,提升模型的拟合能力;还通过拓扑子图的图神经网络充分学习了复杂的道路拓扑信息,进一步提升了模型在道路路况预测的准确性。

    一种基于多模态大数据的互联网短视频分类方法

    公开(公告)号:CN116958677A

    公开(公告)日:2023-10-27

    申请号:CN202310915465.9

    申请日:2023-07-25

    Abstract: 本发明涉及深度学习领域,具体涉及一种基于多模态大数据的互联网短视频分类方法,包括获取多模态短视频数据集,对数据集中的数据进行预处理,并针对数据存在的长尾现象进行重采样;对多模态短视频数据集中无标注的数据打上伪标签,并对打上标签后的数据转换为预训练格式;构建单流神经网络模型,使用无标注数据对单流模型进行预训练;构建双流神经网络模型,使用无标注数据对双流模型进行预训练;将预训练格式的数据输入到训练好的预训练模型进行分类,判断短视频的种类;本发明能够有效提高对短视频分类的预测准确率。

    一种基于大数据的医学影像报告智能生成方法

    公开(公告)号:CN116631566A

    公开(公告)日:2023-08-22

    申请号:CN202310582362.5

    申请日:2023-05-23

    Inventor: 王进 林兴 袁鑫浩

    Abstract: 本发明属于计算机视觉与自然语言处理交叉领域,具体涉及一种基于大数据的医学影像报告智能生成方法,包括:将待处理的医学影像图片经预处理后输入到图像编码模型提取关键的图像特征;将提取的图像特征输入文本生成模型自动的生成诊断报告;其中,所述图像编码模型基于ViT神经网络模型,所述文本生成模型基于预训练语言模型GPT模型和分类器,通过设计损失函数FD‑CE和对比损失函数对医学影像报告智能生成模型进行优化,实现图像编码模型和文本生成模型之间的语义对齐和交互,本发明方法不仅使用方便,其生成的诊断报告更具有真实性和可靠性,可辅助医生进行诊断,从而提高诊断效率。

    一种基于大数据的司法领域类案推送方法

    公开(公告)号:CN116610770A

    公开(公告)日:2023-08-18

    申请号:CN202310464853.X

    申请日:2023-04-26

    Abstract: 本发明涉及自然语言处理技术领域,具体涉及一种基于大数据的司法领域类案推送方法;包括将司法领域文书上传到数据库进行匹配;将司法领域文书及其匹配数据输入到训练好的类案相似度计算模型,输出该司法领域文书与每一个匹配数据的相似度;将所有相似度按照大小降序排列,并选取前k个相似度所对应的匹配数据进行推送;本发明解决了文书文本在预训练模型表征中文本特征趋同的难题,并通过数据扰动的方法进行数据增强,克服了司法领域文书类案推送情景下构建有监督样本时间、人工成本高的困难,可以高效、低成本和自动化地完成精准司法领域类案推送,帮助司法领域从业人员快速地获取与他们正在处理的案件相关的信息和先前的裁决结果。

    一种基于大数据的APP软件用户评论需求分类方法

    公开(公告)号:CN116501879A

    公开(公告)日:2023-07-28

    申请号:CN202310550831.5

    申请日:2023-05-16

    Abstract: 本发明属于文本分类领域,具体涉及一种基于大数据的APP软件用户评论需求分类方法,包括:获取APP用户评论数据并清洗和打标;建立SVTEO模型和NBTEO模型;根据标签数据对SVTEO模型和NBTEO模型的线性层进行ML、DL同质化学习和SVTEO模型、NBTEO模型异质化和参数微调处理,并将处理后的SVTEO模型和NBTEO模型组成用户评论需求分类模型;将待分类的APP用户评论数据输入用户评论需求分类模型进行分类打标处理,得到APP用户评论数据的分类标签。本发明考虑到传统机器学习与深度学习在用户评论需求分类领域的差异性,吸收其各自优点,弥补缺点,解决了文本分类在用户评论需求分类领域的困难。

Patent Agency Ranking