-
公开(公告)号:CN111275521B
公开(公告)日:2022-06-14
申请号:CN202010046965.X
申请日:2020-01-16
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于用户评论与满意层面嵌入的商品推荐方法,包括步骤:1)收集用户历史的评论评分行为,组成训练集;2)在训练中,预处理训练集中的每条评论,计算其语义向量;3)在训练中,利用步骤2)中的语义向量通过层面嵌入计算评价向量s;通过知识图谱的建模方法生成推断的评价向量结合s计算评价生成损失Lg;4)在训练中,利用回归模型以s为输入计算预测评分结合真实评分ru,i计算评分预测损失Lr,计算回归模型复杂度损失Lθ,组合Lr、Lθ与步骤3)的Lg计算整体损失L,利用L对模型进行训练;5)在测试中,利用回归模型以为输入计算预测评分根据生成推荐结果。本发明解决传统方法训练效率低下,模型的透明性、可解释性和准确性不足的问题。
-
公开(公告)号:CN114067270A
公开(公告)日:2022-02-18
申请号:CN202111372602.6
申请日:2021-11-18
Applicant: 华南理工大学
Abstract: 本发明实施例公开了一种车辆追踪方法、装置、计算机设备及存储介质,包括:获取多个监控设备发送的车辆行驶监控视频;采用预设的针对车辆的目标检测算法对所述车辆行驶监控视频中的车辆进行检测得到所述车辆的特征信息,其中,所述特征信息包括所述车辆的检测框(boundingbox)里的图像;从所述检测框图像中提取车辆特征(featuremaps)进行AMOC‑RNN时间序列特征融合得到每个所述监控设备采集到车辆特征集合;将安装于同一地理沿线上多个监控设备采集到的车辆特征集合中的车辆特征进行相似度对比;根据相似度比对结果识别所述多个监控设备中的同一车辆以对所述车辆进行追踪。针对道路中多个监控设备监控到的多个车辆的重识别与跟踪,可以实时反馈结果追踪结果。
-
公开(公告)号:CN111222332A
公开(公告)日:2020-06-02
申请号:CN202010008804.1
申请日:2020-01-06
Applicant: 华南理工大学
IPC: G06F40/289 , G06F40/30 , G06F16/9535 , G06N3/04 , G06N3/08 , G06Q30/06
Abstract: 本发明公开了一种结合注意力网络和用户情感的商品推荐方法,包括步骤:1)提取出用户对商品的评分和评论数据并预处理,构建样本集合T;2)采用无监督的学习模型,利用T中评论的文本数据,不断训练得到相应领域的属性矩阵W;3)构建基于注意力的神经网络结构C,利用基于W的记忆网络和循环神经网络作为基础,使用预测的情感得分作为权重,构建用户偏好向量U和商品特征向量I,利用U和I计算出缺失评分的预测值,同时计算出当前用户和商品的属性向量,用于最终的推荐解释;4)根据预测的评分进行降序排序,为用户推荐前N个商品,并根据属性矩阵和属性向量,为推荐结果提供属性级别的解释。本发明解决了传统评分预测推荐方法缺乏解释性和难以处理大规模数据等问题。
-
公开(公告)号:CN106682173B
公开(公告)日:2019-10-18
申请号:CN201611236768.4
申请日:2016-12-28
Applicant: 华南理工大学
IPC: G06F16/2453 , G06F16/27 , G06F16/28
Abstract: 本发明公开了一种社保大数据OLAP预处理方法及在线分析查询方法,包括以下步骤:从原始数据库提取数据构建数据仓库;从数据仓库提取单维数据;针对单维数据以及单维数据之间的组合构建从数据属性到ID的反向映射,并利用反向映射构建键值对数据库;筛选合适的数据属性的组合,保证对多维属性的组合可以得到多维数据聚合的结果;由数据属性的组合得到不同的分割,通过各种不同的分割组合来去除重复冗余的分割,从而保证用最少的分割达到所有的分割组合,然后构造一维的CUBE,完成预处理过程。本发明能够有效的表达多维查询的数据模型的结果并减少其所占用的存储空间。
-
公开(公告)号:CN108921602A
公开(公告)日:2018-11-30
申请号:CN201810642096.X
申请日:2018-06-21
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于集成神经网络的用户购买行为预测方法,包括步骤:1)对用户行为历史记录进行特征提取和采样,获得样本集合T1;2)利用Boosting集成方法形成分类器C1,对样本集合T1进行分类处理和特征集成,得到新的样本集合T2;3)构建神经网络的基本结构,利用基因算法对神经网络的参数进行启发式搜索,形成集成神经网络分类器C2;4)利用分类器C2对样本集合T2进行分类处理,得到新的样本集合T3;5)利用Bagging集成方法形成分类器C3,对样本集合T3进行分类处理,得到用户会产生购买行为的物品列表,作为对于用户购买行为的预测结果。本发明解决传统方法分类效果差、泛化性差、在大数据情景下效率低下等问题。
-
公开(公告)号:CN107395669A
公开(公告)日:2017-11-24
申请号:CN201710402900.2
申请日:2017-06-01
Applicant: 华南理工大学
IPC: H04L29/08
Abstract: 本发明公开了一种基于流式实时分布式大数据的数据采集方法及系统,主要是采用分布式云集群的方式来处理数据采集,提高数据采集的处理性能和提供一定的可扩展性;构建分区关联的任务队列,不需要首先完成数据累计和落地,实时检测业务数据的变化,采用内存模型来高效存储增量收集的数据,减少本地临时文件保存时所占的空间,避免数据堆积和丢失,同时在基于内存模型的基础上,将数据块进行流化处理,直接在内存中对数据流进行并行处理并实时更新到分析数据集。本发明充分发挥了云集群的高效处理性能,同时利用基于内存的高效存储模型完成数据的收集和归类操作,为后续的实时数据分析提供数据基础,保证了实时数据采集可得到实时的反馈分析结果。
-
公开(公告)号:CN107329982A
公开(公告)日:2017-11-07
申请号:CN201710402942.6
申请日:2017-06-01
Applicant: 华南理工大学
CPC classification number: G06F9/5088 , G06F16/2219 , G06F16/24532
Abstract: 本发明公开了一种基于分布式列式存储的大数据并行计算方法及系统,主要是利用基于内存的NoSQL列式存储存放最近最常访问的数据,达到缓存优化的功能,实现数据的快速查询;采用分布式集群的架构,满足海量数据存储需求,实现数据存储容量动态伸缩;结合基于Spark的并行计算框架,实现业务层数据分析并行化作业,提高计算速度;运用图形图表引擎实现大屏滚动分析的实时数据可视化体验。本发明充分发挥了分布式云服务器的内存处理性能和并行计算的优势,克服了单一服务器和串行计算的性能瓶颈,避免了数据节点之间多余的数据传输,提高了系统实时响应速度,实现了快速的大数据分析。
-
公开(公告)号:CN106682173A
公开(公告)日:2017-05-17
申请号:CN201611236768.4
申请日:2016-12-28
Applicant: 华南理工大学
IPC: G06F17/30
Abstract: 本发明公开了一种社保大数据OLAP预处理方法及在线分析查询方法,包括以下步骤:从原始数据库提取数据构建数据仓库;从数据仓库提取单维数据;针对单维数据以及单维数据之间的组合构建从数据属性到ID的反向映射,并利用反向映射构建键值对数据库;筛选合适的数据属性的组合,保证对多维属性的组合可以得到多维数据聚合的结果;由数据属性的组合得到不同的分割,通过各种不同的分割组合来去除重复冗余的分割,从而保证用最少的分割达到所有的分割组合,然后构造一维的CUBE,完成预处理过程。本发明能够有效的表达多维查询的数据模型的结果并减少其所占用的存储空间。
-
公开(公告)号:CN106126601A
公开(公告)日:2016-11-16
申请号:CN201610451305.3
申请日:2016-06-20
Applicant: 华南理工大学
IPC: G06F17/30
CPC classification number: G06F16/27 , G06F16/283
Abstract: 本发明公开了一种社保大数据分布式预处理方法及系统,主要技术方案是将数据预处理流程定义为包含多个预处理操作节点的数据预处理作业,预处理操作节点在独立的线程中并行执行;对复杂度高的数据操作节点分配多个执行线程,并以分布式云服务器集群的方式并行执行数据预处理作业;分布式预处理系统的数据装载按列方式写入分布式文件系统,同时利用NoSQL对数据写入操作进行缓存优化。本发明充分发挥了预处理云服务器的处理性能,克服了单一服务器的性能瓶颈,也避免了服务器与HDFS数据节点之间多余的数据传输,同时提高数据装载到HDFS的效率,从而提高大数据预处理的效率。
-
-
-
-
-
-
-
-