联合词性与词序的相关因子训练的word2vec改进方法

    公开(公告)号:CN107526834B

    公开(公告)日:2020-10-23

    申请号:CN201710791297.1

    申请日:2017-09-05

    Abstract: 本发明公布了一种联合词性与词序的相关因子训练的word2vec改进方法,提出Structured word2vec on POS模型,包括CWindow‑POS(CWP)模型和Structured Skip gram‑POS(SSGP)模型,两个模型均将词性标注信息与词语顺序作为影响因素联合优化,利用词性关联信息对上下文窗口内词语之间的固有句法关系进行建模;通过词性关联权重对上下文词语序列进行加权计算,再按词语位置顺序进行向量内积计算,使用随机梯度下降(SGD)算法联合学习相关权重和word embedding。本发明将词语按其位置顺序定向嵌入,实现了对词向量和词性相关加权矩阵进行的联合优化;在词语类比任务、词语相似性任务与定性分析都具有高效性。

    词向量模型的增量式学习方法

    公开(公告)号:CN106776534A

    公开(公告)日:2017-05-31

    申请号:CN201610995636.3

    申请日:2016-11-11

    Abstract: 本发明公布了一种词向量模型的增量式学习方法,该方法采用的超参数包括:向量维度、反例样本个数范围、文本窗口长度;针对一篇新增文本text,通过对新增文本中出现的新词进行初始化更新和基于历史词表word_list的反例采样,对词向量模型进行动态更新,完成向量模型优化,从而实现对新增文本text进行增量式学习;采用本发明技术方案,能够避免对历史数据进行重复性学习,大幅减少计算复杂度;而随着数据量增大,本发明还能保持较高的学习效率,从而满足在线系统的效率需求。

    词向量模型的增量式学习方法

    公开(公告)号:CN106776534B

    公开(公告)日:2020-02-11

    申请号:CN201610995636.3

    申请日:2016-11-11

    Abstract: 本发明公布了一种词向量模型的增量式学习方法,该方法采用的超参数包括:向量维度、反例样本个数范围、文本窗口长度;针对一篇新增文本text,通过对新增文本中出现的新词进行初始化更新和基于历史词表word_list的反例采样,对词向量模型进行动态更新,完成向量模型优化,从而实现对新增文本text进行增量式学习;采用本发明技术方案,能够避免对历史数据进行重复性学习,大幅减少计算复杂度;而随着数据量增大,本发明还能保持较高的学习效率,从而满足在线系统的效率需求。

    一种基于Storm平台的分布式数字标牌广告投放方法

    公开(公告)号:CN105184614B

    公开(公告)日:2018-08-24

    申请号:CN201510583827.4

    申请日:2015-09-14

    Abstract: 本发明公开了一种基于Storm平台的分布式数字标牌广告投放方法,将广告投放过程分为:1)搭建基于Storm平台的处理框架,包含读订单,选屏,排期,更新订单状态;2)发射源接收订单消息并发给选屏处理单元;3)选屏处理单元根据订单地理约束条件等为每个订单选择屏位;4)排期处理单元根据订单中时间约束条件、屏位空闲时间段为该屏位生成排期列表;5)状态处理单元根据排期结果,更新订单状态。本发明能够高效地实现海量订单广告的即时精准投放,同时能够提高数字标牌的屏位利用率,减少时间碎片,具有很高的商业价值和应用推广价值。

    联合词性与词序的相关因子训练的word2vec改进方法

    公开(公告)号:CN107526834A

    公开(公告)日:2017-12-29

    申请号:CN201710791297.1

    申请日:2017-09-05

    Abstract: 本发明公布了一种联合词性与词序的相关因子训练的word2vec改进方法,提出Structured word2vec on POS模型,包括CWindow-POS(CWP)模型和Structured Skip gram-POS(SSGP)模型,两个模型均将词性标注信息与词语顺序作为影响因素联合优化,利用词性关联信息对上下文窗口内词语之间的固有句法关系进行建模;通过词性关联权重对上下文词语序列进行加权计算,再按词语位置顺序进行向量内积计算,使用随机梯度下降(SGD)算法联合学习相关权重和word embedding。本发明将词语按其位置顺序定向嵌入,实现了对词向量和词性相关加权矩阵进行的联合优化;在词语类比任务、词语相似性任务与定性分析都具有高效性。

    一种面向数字标牌的多维标签实现方法

    公开(公告)号:CN105302560A

    公开(公告)日:2016-02-03

    申请号:CN201510745138.9

    申请日:2015-11-05

    Abstract: 本发明提出一种面向数字标牌的多维标签实现方法,该多维标签实现方法分为五个步骤,具体过程包括:1)根据广告屏的特征定义广告屏多维标签模型,被描述的广告屏属性包括地理位置、受众特征、商圈特征属性;2)根据广告的属性特征定义行业属性标签,描述广告属于哪个行业;3)设计Redis数据库中的数据结构,将多维标签存入Redis数据库;4)定义标签的修改、删除操作;5)定义标签的查询操作。本发明能实现多维标签的高效管理,具有很高的商业价值和应用推广价值。

    一种面向数字标牌的多维标签实现方法

    公开(公告)号:CN105302560B

    公开(公告)日:2018-06-05

    申请号:CN201510745138.9

    申请日:2015-11-05

    Abstract: 本发明提出一种面向数字标牌的多维标签实现方法,该多维标签实现方法分为五个步骤,具体过程包括:1)根据广告屏的特征定义广告屏多维标签模型,被描述的广告屏属性包括地理位置、受众特征、商圈特征属性;2)根据广告的属性特征定义行业属性标签,描述广告属于哪个行业;3)设计Redis数据库中的数据结构,将多维标签存入Redis数据库;4)定义标签的修改、删除操作;5)定义标签的查询操作。本发明能实现多维标签的高效管理,具有很高的商业价值和应用推广价值。

    一种基于Storm平台的分布式数字标牌广告投放方法

    公开(公告)号:CN105184614A

    公开(公告)日:2015-12-23

    申请号:CN201510583827.4

    申请日:2015-09-14

    Abstract: 本发明公开了一种基于Storm平台的分布式数字标牌广告投放方法,将广告投放过程分为:1)搭建基于Storm平台的处理框架,包含读订单,选屏,排期,更新订单状态;2)发射源接收订单消息并发给选屏处理单元;3)选屏处理单元根据订单地理约束条件等为每个订单选择屏位;4)排期处理单元根据订单中时间约束条件、屏位空闲时间段为该屏位生成排期列表;5)状态处理单元根据排期结果,更新订单状态。本发明能够高效地实现海量订单广告的即时精准投放,同时能够提高数字标牌的屏位利用率,减少时间碎片,具有很高的商业价值和应用推广价值。

Patent Agency Ranking