行业分类方法、装置和服务器

    公开(公告)号:CN101673305A

    公开(公告)日:2010-03-17

    申请号:CN200910235273.3

    申请日:2009-09-29

    Abstract: 本发明公开了一种行业分类方法、装置和服务器,该方法包括:确定跨行业用户,将跨行业用户分离为多个单一行业的虚拟用户,根据跨行业用户的拍卖词确定虚拟用户对应的拍卖词;将虚拟用户对应的拍卖词与各行业的种子词进行匹配,确定虚拟用户对应的拍卖词的初始行业;根据虚拟用户对应的拍卖词的初始行业对虚拟用户进行聚类,根据虚拟用户的聚类结果对虚拟用户对应的拍卖词进行聚类,重复执行聚类的步骤,根据达到预定条件时的聚类结果确定虚拟用户和虚拟用户对应的拍卖词所属的行业。本发明实现了根据虚拟用户和该虚拟用户对应的拍卖词的关联关系对短文本进行分类,实现了在行业体系下对用户和该用户对应的拍卖词进行准确的分类。

    行业分类方法、装置和服务器

    公开(公告)号:CN101673305B

    公开(公告)日:2015-04-08

    申请号:CN200910235273.3

    申请日:2009-09-29

    Abstract: 本发明公开了一种行业分类方法、装置和服务器,该方法包括:确定跨行业用户,将跨行业用户分离为多个单一行业的虚拟用户,根据跨行业用户的拍卖词确定虚拟用户对应的拍卖词;将虚拟用户对应的拍卖词与各行业的种子词进行匹配,确定虚拟用户对应的拍卖词的初始行业;根据虚拟用户对应的拍卖词的初始行业对虚拟用户进行聚类,根据虚拟用户的聚类结果对虚拟用户对应的拍卖词进行聚类,重复执行聚类的步骤,根据达到预定条件时的聚类结果确定虚拟用户和虚拟用户对应的拍卖词所属的行业。本发明实现了根据虚拟用户和该虚拟用户对应的拍卖词的关联关系对短文本进行分类,实现了在行业体系下对用户和该用户对应的拍卖词进行准确的分类。

Patent Agency Ranking