一种社交电商用户群体阶层划分方法

    公开(公告)号:CN111859245A

    公开(公告)日:2020-10-30

    申请号:CN202010639112.7

    申请日:2020-07-06

    Abstract: 本发明提供了一种社交电商用户群体阶层划分方法,它解决了现有技术存在的局限性的问题。其方法包括:S1:取用户使用时长、使用人数、单月留存率、双月留存率、单月同层转化率和双月同层转化率;S2:利用多项式函数拟合的方式生成以使用时长为自变量,使用人数、单月留存率、双月留存率、单月同层转化率分别为因变量的函数曲线;S3:拟合函数确定后通过计算其局部区间上的数据离散程度差异的极大值得到函数转折点;S4:转折点之间划分得到的区间即用户阶层划分区间。本发明优点在于利用数据的拟合曲线的转折点进行用户区间划分,结果优于k-means++聚类;用户区间合并参考区间留存率,有利于用户阶层的有效划分。

    一种减少视频数据集用于人工智能训练时冗余的方法

    公开(公告)号:CN112906818A

    公开(公告)日:2021-06-04

    申请号:CN202110283680.2

    申请日:2021-03-17

    Abstract: 本发明公开了一种减少视频数据集用于人工智能训练时冗余的方法,包括如下步骤:1)将视频文件逐帧解析成图像文件,解析时使用检测算法进行图像模糊度检测;2)读取步骤1处理后的第一张图像保存为临时变量;3)读取下一张图像与临时变量使用相似度对比算法进行相似度对比;4)遍历步骤3中保留的图像文件,按顺序逐一与其他剩余图像进行相似度对比,如果相似度对比值高于阈值,则保留被对比图像,否则将对比图像进行删除操作。本发明属于互联网技术领域,具体是指一种可以有效降低视频数据用于人工智能模型训练时冗余性的方法。

Patent Agency Ranking