发明授权
- 专利标题: 一种基于感知数据的标签提取方法
-
申请号: CN201711253610.2申请日: 2017-12-02
-
公开(公告)号: CN107862089B公开(公告)日: 2020-03-13
- 发明人: 丁治明 , 刘凡 , 才智 , 曹阳
- 申请人: 北京工业大学
- 申请人地址: 北京市朝阳区平乐园100号
- 专利权人: 北京工业大学
- 当前专利权人: 北京工业大学
- 当前专利权人地址: 北京市朝阳区平乐园100号
- 代理机构: 北京思海天达知识产权代理有限公司
- 代理商 沈波
- 主分类号: G06F16/335
- IPC分类号: G06F16/335 ; G06F16/33 ; G06F16/35
摘要:
本发明公开了一种基于感知数据的标签提取方法,对象数据包括数值数据和文本数据,标签提取首先将这两部分数据分开处理,提取出各自标签后,再通过概率统计将其关联。数值特征标签提取,特征标签提取是通过聚类来选出质心来做为类的最终标签,聚类的好坏直接关系特征标签提取的效果。标签都代表着某类别最突出的特征点,即在语义上与本类中的所有实例的差别最小。大多数聚类算法都遵循着这个原则,但实际上数值特征标签本身并不需要表示出本簇的特征语义。序列特征标签提取过程主要分为聚类以及质心的选择两部分。将传入的感知数据与标签库中的标签进行相似度匹配,得出相应的数值标签。通过与文本标签库的关联获取相应的文本标签并返回。
公开/授权文献
- CN107862089A 一种基于感知数据的标签提取方法 公开/授权日:2018-03-30