- 专利标题: 基于信息熵的标签权重智能更新方法、系统及计算机设备
-
申请号: CN202210076732.3申请日: 2022-01-24
-
公开(公告)号: CN114090854B公开(公告)日: 2022-04-19
- 发明人: 姜磊 , 朱振航 , 杨钊 , 严海龙
- 申请人: 佰聆数据股份有限公司
- 申请人地址: 广东省广州市高新技术产业开发区科学城科学大道162号创意大厦B3栋1301单元
- 专利权人: 佰聆数据股份有限公司
- 当前专利权人: 佰聆数据股份有限公司
- 当前专利权人地址: 广东省广州市高新技术产业开发区科学城科学大道162号创意大厦B3栋1301单元
- 代理机构: 广州市华学知识产权代理有限公司
- 代理商 林梅繁
- 主分类号: G06F16/906
- IPC分类号: G06F16/906 ; G06K9/62
摘要:
本发明属于大数据标签技术,为基于信息熵的标签权重智能更新方法、系统及计算机设备,其方法包括:获取源数据,包括标签集合、标签覆盖率、标签使用行为次数集合、标签行为权重集合、业务场景系数;考虑标签覆盖率的整体分布情况,引入标签覆盖率基准值作为信息量计算公式中对数的底数,改进信息量计算公式并生成标签信息量权重;基于标签使用行为次数与标签行为权重,自动更新标签使用权重系数;计算标签权重的衰减系数;根据标签权重的衰减方式,并综合标签信息量权重、标签使用权重系数及业务场景系数,生成标签权重并动态更新。本发明使得标签权重更新相关的系数可动态调整,解决了现有技术难以保证标签权重准确有效的问题。
公开/授权文献
- CN114090854A 基于信息熵的标签权重智能更新方法、系统及计算机设备 公开/授权日:2022-02-25