一种基于感知数据的标签提取方法
摘要:
本发明公开了一种基于感知数据的标签提取方法,对象数据包括数值数据和文本数据,标签提取首先将这两部分数据分开处理,提取出各自标签后,再通过概率统计将其关联。数值特征标签提取,特征标签提取是通过聚类来选出质心来做为类的最终标签,聚类的好坏直接关系特征标签提取的效果。标签都代表着某类别最突出的特征点,即在语义上与本类中的所有实例的差别最小。大多数聚类算法都遵循着这个原则,但实际上数值特征标签本身并不需要表示出本簇的特征语义。序列特征标签提取过程主要分为聚类以及质心的选择两部分。将传入的感知数据与标签库中的标签进行相似度匹配,得出相应的数值标签。通过与文本标签库的关联获取相应的文本标签并返回。
公开/授权文献
0/0