基于信息熵的标签权重智能更新方法、系统及计算机设备
摘要:
本发明属于大数据标签技术,为基于信息熵的标签权重智能更新方法、系统及计算机设备,其方法包括:获取源数据,包括标签集合、标签覆盖率、标签使用行为次数集合、标签行为权重集合、业务场景系数;考虑标签覆盖率的整体分布情况,引入标签覆盖率基准值作为信息量计算公式中对数的底数,改进信息量计算公式并生成标签信息量权重;基于标签使用行为次数与标签行为权重,自动更新标签使用权重系数;计算标签权重的衰减系数;根据标签权重的衰减方式,并综合标签信息量权重、标签使用权重系数及业务场景系数,生成标签权重并动态更新。本发明使得标签权重更新相关的系数可动态调整,解决了现有技术难以保证标签权重准确有效的问题。
0/0