-
公开(公告)号:CN105701118A
公开(公告)日:2016-06-22
申请号:CN201410708694.4
申请日:2014-11-28
Applicant: 国际商业机器公司
IPC: G06F17/30
CPC classification number: G06F16/2455 , G06F17/3053 , G06F17/30554 , H04L41/0806
Abstract: 本发明公开了一种用于归一化文件的非数值特征的方法和相应装置,该方法包括:将给定文件的非数值特征的至少一对正例切分为若干单词;通过将所述至少一对正例中的单词进行比较获得匹配的单词;以及针对所述匹配的单词,计算其匹配该给定文件的权重,并将所述单词及其权重存储在单词库中。
-
公开(公告)号:CN105701118B
公开(公告)日:2019-05-28
申请号:CN201410708694.4
申请日:2014-11-28
Applicant: 国际商业机器公司
IPC: G06F16/13
CPC classification number: G06F16/2455 , G06F17/3053 , G06F17/30554 , H04L41/0806
Abstract: 本发明公开了一种用于归一化文件的非数值特征的方法和相应装置,该方法包括:将给定文件的非数值特征的至少一对正例切分为若干单词;通过将所述至少一对正例中的单词进行比较获得匹配的单词;以及针对所述匹配的单词,计算其匹配该给定文件的权重,并将所述单词及其权重存储在单词库中。
-