-
公开(公告)号:CN109583472A
公开(公告)日:2019-04-05
申请号:CN201811276191.9
申请日:2018-10-30
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供了一种web日志用户识别方法和系统。该方法包括:从用户行为日志中提取日志关键字段,其中,所述日志关键字段至少包括统一资源定位符URL;从所述统一资源定位符URL中构建反映用户行为动机的多个行为特征;根据所述多个行为特征计算用户行为动机相似度并基于所述用户行为动机相似度来识别用户。本发明的方法和系统能够根据web日志准确有效地进行用户识别。
-
公开(公告)号:CN113515947B
公开(公告)日:2024-03-08
申请号:CN202110837354.1
申请日:2021-07-23
Applicant: 中国科学院计算技术研究所 , 中国雄安集团有限公司
IPC: G06F40/295 , G06F40/216 , G06F18/214 , G06N3/0464 , G06N3/049 , G06N3/084
-
公开(公告)号:CN113515947A
公开(公告)日:2021-10-19
申请号:CN202110837354.1
申请日:2021-07-23
Applicant: 中国科学院计算技术研究所
IPC: G06F40/295 , G06F40/216 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种用于级联地名实体识别模型的训练方法,所述级联地名实体识别模型是端到端模型,从输入到输出依次包括嵌入层、BiLSTM层、自注意力层以及CRF层,其中,所述嵌入层用于将语料样本的每个字映射为低维随机变量,所述自注意力层用于根据BiLSTM的输出计算级联地名文字的隐向量,所述方法包括:对级联地名语料数据进行预处理,获取训练样本;基于所述训练样本训练所述模型。
-
-