一种基于深度神经网络与多标记分类的病句检测方法

    公开(公告)号:CN105045779A

    公开(公告)日:2015-11-11

    申请号:CN201510408379.4

    申请日:2015-07-13

    Applicant: 北京大学

    Inventor: 王厚峰 张龙凯

    Abstract: 本发明提供一种基于深度神经网络与多标记分类的病句检测方法,该方法的核心是先对句子进行词法分析、句法分析,在此基础上抽取基层特征,包括词特征,词关系特征等;然后,利用深度神经网络学习抽象的特征表示,以获得不同错误与特征之间的关系;最后,通过多标记分类方法推断句子中可能存在的语病。本发明针对句子识别其中语病,并且可以做到识别句子中的多种语病,避免了人工选择特征,同时也能提升多种语病的预测的准确度。

    一种基于文档词汇特征变化的突发事件检测方法

    公开(公告)号:CN103246728A

    公开(公告)日:2013-08-14

    申请号:CN201310170296.7

    申请日:2013-05-10

    Applicant: 北京大学

    Inventor: 王厚峰 张龙凯

    Abstract: 一种基于文档词汇特征变化的突发事件检测方法。包括:利用计算机从新闻网站上的时政新闻报道中爬取指定时间段的新闻文章;对每一个文档进行预处理,包括汉语词切分和词性标注;留下内容词,过滤掉其它词;获取前面k年与目标文档相同时间段及前r天和后r天的新闻文档作为比较文档集;对比较文档集同样进行汉语切词和词性标注处理,保留内容词;从数据库中提取目标文档集中的所有线索词;对线索词集聚类,形成突发事件描述。利用本发明提供的技术方案,可以将事件空间还原到线索词空间,通过聚类的方法输出的线索词子集合,一个子集合对应着一个突发事件的描述。

Patent Agency Ranking