一种基于大数据的移动终端用户画像构建方法及系统

    公开(公告)号:CN111444236B

    公开(公告)日:2023-04-28

    申请号:CN202010207233.4

    申请日:2020-03-23

    Inventor: 张星明 何伟成

    Abstract: 本发明公开了一种基于大数据的移动终端用户画像构建方法及系统,包括步骤:1)建立用户画像标签体系;2)梳理需要获取的用户行为信息并形成数据埋点需求,数据埋点在移动终端进行数据采集,将采集到的用户行为信息存储到分布式文件系统;3)解析存储在分布式文件系统的用户行为信息,并将处理后的用户行为信息存储到分布式数据库;4)从分布式数据库中提取用户特征,并存储到特征数据库;5)基于用户画像标签体系,对于每一个标签,在特征数据库中选择与该标签相关的用户特征,通过聚类算法与人工标签规则确定用户所属的标签,并保存到用户画像数据库。本发明解决传统方法过于依赖人工规则、在大数据情景下效率低下等问题,提升用户画像效率和准确率。

    一种基于双背景的高速公路抛洒物检测方法

    公开(公告)号:CN114677343A

    公开(公告)日:2022-06-28

    申请号:CN202210262727.1

    申请日:2022-03-15

    Abstract: 本发明公开了一种基于双背景的高速公路抛洒物检测方法,该方法步骤如下:S1、对高速公路监控视频进行背景建模,得到背景帧视频;S2、用背景帧视频中的当前背景帧减去历史背景帧,得到当前背景帧和历史背景帧的差分图;S3、对差分图进行数学形态学操作,得到背景帧视频中的运动物体;S4、在获得的运动物体中去除面积过小和过大的、距离摄像头过远的,以及不在路面上的运动物体,其余运动物体判定为抛洒物,并在画面中进行标示。本发明通过背景建模并进行背景帧相减,再通过一系列的条件判断检测出抛洒物,在实际场景中验证了本发明的有效性。

    一种基于代价敏感分类器集成的广告点击率预测方法

    公开(公告)号:CN108921604B

    公开(公告)日:2022-03-29

    申请号:CN201810647829.9

    申请日:2018-06-22

    Abstract: 本发明公开了一种基于代价敏感分类器集成的广告点击率预测方法,包括步骤:在特征提取上,采用人工定义的规则进行特征提取,对用户行为历史记录进行特征提取和采样;在广告点击率预测中采用改进B‑SMOTE+方法进行数据过采样;经过数据预处理后的数据集在交由分类器学习时采用代价敏感算法,将误分“点击广告”这一错误加大惩罚力度;采用了遗传算法进行了优化调参;采用两层Stacking方式对进行集成。本发明解决了目前一些点击率预测算法由于特征维度较少、数据预处理不到位等问题导致的准确率较低等问题,采用该方法能够较好地提升广告点击率预测的准确率。

    一种基于生成对抗网络的多姿态人脸图像正面化方法

    公开(公告)号:CN110543846B

    公开(公告)日:2021-12-17

    申请号:CN201910806159.5

    申请日:2019-08-29

    Abstract: 本发明公开了一种基于生成对抗网络的多姿态人脸正面化方法,在训练阶段,首先收集各种姿态的人脸图片作为数据集,然后输入多组同一人的正脸图像和非正脸图像,通过新设计的损失函数,交替训练生成网络和判别网络,直到损失函数的值稳定收敛。在训练完成后的测试阶段,对输入的各种姿态人脸图片,本发明都可以将它们矫正成正脸图像。矫正后的图像不仅清晰,并且保留了原人脸的身份特征,可以用于人脸识别工作。本发明将有效减缓姿态因素对人脸识别造成的负面影响,有利于非限制条件下人脸识别实际应用的发展。

    一种结合注意力网络和用户情感的商品推荐方法

    公开(公告)号:CN111222332B

    公开(公告)日:2021-09-21

    申请号:CN202010008804.1

    申请日:2020-01-06

    Inventor: 张星明 罗凌杰

    Abstract: 本发明公开了一种结合注意力网络和用户情感的商品推荐方法,包括步骤:1)提取出用户对商品的评分和评论数据并预处理,构建样本集合T;2)采用无监督的学习模型,利用T中评论的文本数据,不断训练得到相应领域的属性矩阵W;3)构建基于注意力的神经网络结构C,利用基于W的记忆网络和循环神经网络作为基础,使用预测的情感得分作为权重,构建用户偏好向量U和商品特征向量I,利用U和I计算出缺失评分的预测值,同时计算出当前用户和商品的属性向量,用于最终的推荐解释;4)根据预测的评分进行降序排序,为用户推荐前N个商品,并根据属性矩阵和属性向量,为推荐结果提供属性级别的解释。本发明解决了传统评分预测推荐方法缺乏解释性和难以处理大规模数据等问题。

    一种基于流式实时分布式大数据的数据采集方法及系统

    公开(公告)号:CN107395669B

    公开(公告)日:2020-04-07

    申请号:CN201710402900.2

    申请日:2017-06-01

    Abstract: 本发明公开了一种基于流式实时分布式大数据的数据采集方法及系统,主要是采用分布式云集群的方式来处理数据采集,提高数据采集的处理性能和提供一定的可扩展性;构建分区关联的任务队列,不需要首先完成数据累计和落地,实时检测业务数据的变化,采用内存模型来高效存储增量收集的数据,减少本地临时文件保存时所占的空间,避免数据堆积和丢失,同时在基于内存模型的基础上,将数据块进行流化处理,直接在内存中对数据流进行并行处理并实时更新到分析数据集。本发明充分发挥了云集群的高效处理性能,同时利用基于内存的高效存储模型完成数据的收集和归类操作,为后续的实时数据分析提供数据基础,保证了实时数据采集可得到实时的反馈分析结果。

    一种基于HEVC的运动区域检测的码率控制方法

    公开(公告)号:CN106604029A

    公开(公告)日:2017-04-26

    申请号:CN201710000884.4

    申请日:2017-01-03

    CPC classification number: H04N19/114 H04N19/147 H04N19/172 H04N19/543

    Abstract: 本发明公开了一种基于HEVC的运动区域检测的码率控制方法,包括如下步骤:按照HEVC编码器的码率控制方法,编码第1个GOP;从第2个GOP开始,对于每一个I帧,采用基于帧间差分法的运动区域检测技术对每一个I帧的LCU进行标记,标记类型包括运动区域、一般区域和静止区域;根据进行标记后的LCU调整LCU的QP,下调标记为运动区域的LCU的QP,上调标记为静止区域的LCU的QP,将标记为一般区域的LCU的QP保持不变;根据调整后的QP采用HEVC编码器的码率控制方法编码I帧中的每个LCU;对于GOP中的B帧和P帧则按照HEVC编码器的码率控制方法进行编码。本发明在中低码率下能检测出视频内容中的视觉关注区域并保证其视觉质量,实现了快速的、准确的码率分配优化。

    一种社保大数据可视化方法及系统

    公开(公告)号:CN106230907A

    公开(公告)日:2016-12-14

    申请号:CN201610586634.9

    申请日:2016-07-22

    CPC classification number: H04L67/10 H04L67/06 H04L67/2842 H04L67/32

    Abstract: 本发明公开了一种社保大数据可视化方法及系统,该技术方案主要是通过反馈式的交互机制来生成图形文件,提高交互实时性和友好性;同时通过预定义图表和地图模板、缓存机制、异步传输机制来提高可视化效率。另外,通过云服务器集群选举空闲的服务器处理客户端请求,确保客户端请求能被及时、高效处理。本发明充分发挥了可视化云服务器的处理性能,克服了单一服务器的性能瓶颈;同时通过缓存机制避免相同可视化结果的重复生成和多余的数据传输,提高从可视化生成到客户端展示的效率,从而提高数据可视化的效率。

Patent Agency Ranking