一种基于双向LSTM、CNN和CRF的中文分词方法

    公开(公告)号:CN108268444B

    公开(公告)日:2021-11-02

    申请号:CN201810021528.5

    申请日:2018-01-10

    Abstract: 本发明公开了一种基于双向LSTM、CNN和CRF的中文分词方法,基于深度学习算法对传统中文分词的改进优化。该方法具体步骤如下:对初始语料进行预处理,提取语料字符特征信息和字符对应的拼音特征信息;利用卷积神经网络得到字符的拼音特征信息向量;利用word2vec模型得到文本的字符特征信息向量;将拼音特征向量和字符特征向量进行拼接,得到上下文信息向量,放入双向LSTM神经网络中;利用线性链条件随机场对双向LSTM的输出进行解码,得到分词标注序列;对分词标注序列进行解码得到分词结果。本发明利用深度神经网络提取文本字符特征和拼音特征并结合条件随机场进行解码,可以有效提取中文文本特征并且能够在中文分词任务上取得很好的效果。

    一种基于旅客信任度的智能旅馆推荐方法

    公开(公告)号:CN108416607A

    公开(公告)日:2018-08-17

    申请号:CN201711471333.2

    申请日:2017-12-29

    Abstract: 本发明公开了一种基于旅客信任度的智能旅馆推荐方法,其实现步骤为:采集旅客消费数据;从旅客评论中提取特征情感词对,合并同类特征,量化各特征的分数;建立旅客-偏好评分矩阵,计算旅客偏好相似度;根据旅客活跃度和旅客评论有效率,计算旅客可靠度;计算旅客间的信任度;基于旅客间信任度通过加权评价值为旅馆打分;推荐前N个旅馆。本发明不仅解决了旅客住宿偏好难于获取的问题,还能够将热门旅馆和值得信赖的旅客所消费的旅馆优先推荐。

    一种基于双向LSTM、CNN和CRF的中文分词方法

    公开(公告)号:CN108268444A

    公开(公告)日:2018-07-10

    申请号:CN201810021528.5

    申请日:2018-01-10

    Abstract: 本发明公开了一种基于双向LSTM、CNN和CRF的中文分词方法,基于深度学习算法对传统中文分词的改进优化。该方法具体步骤如下:对初始语料进行预处理,提取语料字符特征信息和字符对应的拼音特征信息;利用卷积神经网络得到字符的拼音特征信息向量;利用word2vec模型得到文本的字符特征信息向量;将拼音特征向量和字符特征向量进行拼接,得到上下文信息向量,放入双向LSTM神经网络中;利用线性链条件随机场对双向LSTM的输出进行解码,得到分词标注序列;对分词标注序列进行解码得到分词结果。本发明利用深度神经网络提取文本字符特征和拼音特征并结合条件随机场进行解码,可以有效提取中文文本特征并且能够在中文分词任务上取得很好的效果。

Patent Agency Ranking