-
公开(公告)号:CN108268444B
公开(公告)日:2021-11-02
申请号:CN201810021528.5
申请日:2018-01-10
Applicant: 南京邮电大学
IPC: G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于双向LSTM、CNN和CRF的中文分词方法,基于深度学习算法对传统中文分词的改进优化。该方法具体步骤如下:对初始语料进行预处理,提取语料字符特征信息和字符对应的拼音特征信息;利用卷积神经网络得到字符的拼音特征信息向量;利用word2vec模型得到文本的字符特征信息向量;将拼音特征向量和字符特征向量进行拼接,得到上下文信息向量,放入双向LSTM神经网络中;利用线性链条件随机场对双向LSTM的输出进行解码,得到分词标注序列;对分词标注序列进行解码得到分词结果。本发明利用深度神经网络提取文本字符特征和拼音特征并结合条件随机场进行解码,可以有效提取中文文本特征并且能够在中文分词任务上取得很好的效果。
-
公开(公告)号:CN108776940A
公开(公告)日:2018-11-09
申请号:CN201810566021.8
申请日:2018-06-04
Applicant: 南京邮电大学盐城大数据研究院有限公司
Abstract: 本发明涉及基于文本评论挖掘的智能餐饮推荐算法,本发明属于计算机算法领域。本发明通过搜集用户餐饮数据,建立用户餐厅打分矩阵,计算用户打分相似度;提取出特征情感词对;合并同类特征,量化各特征的分数;建立用户偏好打分矩阵,计算用户的偏好相似度;计算用户综合相似度;计算用户信任值;计算用户间的信任度;基于用户间信任度通过加权评价值为餐厅打分;推荐前N个餐厅。本发明利用文本评论挖掘的方法,制定了一系列抽取规则,形成评论摘要,利用依存句法从评论摘要中提取出用户对餐厅的环境、服务等特征属性的情感信息,将特征属性量化之后的分数与用户的餐厅总体打分结合,对餐厅进行推荐。与传统的餐饮推荐相比,提高了推荐的准确率。
-
公开(公告)号:CN108416607A
公开(公告)日:2018-08-17
申请号:CN201711471333.2
申请日:2017-12-29
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于旅客信任度的智能旅馆推荐方法,其实现步骤为:采集旅客消费数据;从旅客评论中提取特征情感词对,合并同类特征,量化各特征的分数;建立旅客-偏好评分矩阵,计算旅客偏好相似度;根据旅客活跃度和旅客评论有效率,计算旅客可靠度;计算旅客间的信任度;基于旅客间信任度通过加权评价值为旅馆打分;推荐前N个旅馆。本发明不仅解决了旅客住宿偏好难于获取的问题,还能够将热门旅馆和值得信赖的旅客所消费的旅馆优先推荐。
-
公开(公告)号:CN108268444A
公开(公告)日:2018-07-10
申请号:CN201810021528.5
申请日:2018-01-10
Applicant: 南京邮电大学
Abstract: 本发明公开了一种基于双向LSTM、CNN和CRF的中文分词方法,基于深度学习算法对传统中文分词的改进优化。该方法具体步骤如下:对初始语料进行预处理,提取语料字符特征信息和字符对应的拼音特征信息;利用卷积神经网络得到字符的拼音特征信息向量;利用word2vec模型得到文本的字符特征信息向量;将拼音特征向量和字符特征向量进行拼接,得到上下文信息向量,放入双向LSTM神经网络中;利用线性链条件随机场对双向LSTM的输出进行解码,得到分词标注序列;对分词标注序列进行解码得到分词结果。本发明利用深度神经网络提取文本字符特征和拼音特征并结合条件随机场进行解码,可以有效提取中文文本特征并且能够在中文分词任务上取得很好的效果。
-
-
-