一种面向多用户微博的情感引发原因标注方法及系统

    公开(公告)号:CN109240558A

    公开(公告)日:2019-01-18

    申请号:CN201810814188.1

    申请日:2018-07-23

    Abstract: 本发明涉及一种面向多用户微博的情感引发原因标注方法及系统,包括如下步骤:自动获取微博数据,构建中文微博语料库;根据微博情感引发原因的表示形式,设计一套完整的微博情感引发原因标注方法;设计一套基于图像界面的标注系统,用以加快微博情感引发原因的标注;利用所述标注系统对所述语料库中语料进行人工标注,得到标注语料库。本发明能够从包含多用户的中文微博中标注出该微博所含情感的原因。

    一种基于篇章信息的中文水果品种信息抽取方法及装置

    公开(公告)号:CN106649264B

    公开(公告)日:2019-07-05

    申请号:CN201611043050.3

    申请日:2016-11-21

    Abstract: 本发明提供一种基于篇章信息的中文水果品种信息抽取方法及装置。通过获取语料,在搜索引擎网站爬取下载与水果相关的页面;对所述与水果相关的页面进行语料标注;对所述与水果相关的页面进行词项对提取,将词项对分为训练语料和测试语料;对所述语料进行基于篇章结构的远距离特征提取;利用训练语料特征训练得到基于深度学习的组合分类器;利用组合分类器从测试语料中抽取水果品种信息;将与水果相关的页面随机分为N组,重复执行,获得评估结果。改进目前的信息抽取技术,使其更加适应于农业领域,提高了水果品种名称识别与抽取的准确率。

    一种面向新闻的中文食品安全新闻事件信息自动抽取方法

    公开(公告)号:CN108846018A

    公开(公告)日:2018-11-20

    申请号:CN201810427945.X

    申请日:2018-05-07

    Abstract: 本发明涉及一种面向新闻的中文食品安全新闻事件信息自动抽取方法,包括如下步骤:S1步骤:采集网络新闻构建食品新闻语料库;整理中国国内地理信息知识库,构建地理信息知识库;从网络中收集食品种类信息,构建食品种类知识库;S2步骤:利用文本分类模型对食品新闻语料库的新闻语料进行文本分类,得到食品安全新闻语料;S3步骤:首先对所述食品安全新闻语料中事件发生时间进行提取,其次,利用地理信息知识库对所述食品安全新闻语料中事件发生地点进行提取,最后,利用食品种类知识库对所述食品安全新闻语料中涉及到的食品名称及种类信息进行提取;S4步骤:对所述提取到的时间、地点和食品信息进行统计;S5步骤:将所述时间、地点和食品统计信息利用可视化技术进行展示。本发明能够准确地从网络新闻中提取出食品安全事件的时间、地点和食品种类这三个维度的信息,并对这些信息进行统计,最终将统计结果进行直观地显示。

    一种基于篇章信息的中文水果品种信息抽取方法及装置

    公开(公告)号:CN106649264A

    公开(公告)日:2017-05-10

    申请号:CN201611043050.3

    申请日:2016-11-21

    CPC classification number: G06F17/2775 G06F16/35 G06F17/2785

    Abstract: 本发明提供一种基于篇章信息的中文水果品种信息抽取方法及装置。通过获取语料,在搜索引擎网站爬取下载与水果相关的页面;对所述与水果相关的页面进行语料标注;对所述与水果相关的页面进行词项对提取,将词项对分为训练语料和测试语料;对所述语料进行基于篇章结构的远距离特征提取;利用训练语料特征训练得到基于深度学习的组合分类器;利用组合分类器从测试语料中抽取水果品种信息;将与水果相关的页面随机分为N组,重复执行,获得评估结果。改进目前的信息抽取技术,使其更加适应于农业领域,提高了水果品种名称识别与抽取的准确率。

    一种基于深度学习的集成式食品安全文本分类方法

    公开(公告)号:CN106570164A

    公开(公告)日:2017-04-19

    申请号:CN201610976304.0

    申请日:2016-11-07

    CPC classification number: G06F16/35 G06N3/0454 G06N3/08

    Abstract: 一种基于深度学习的集成式食品安全文本分类方法。本发明涉及中文食品安全文本分类方法,包括如下步骤:S1步骤:进行新闻语料采集,得三类文档:食品安全类、非食品安全类和无标签类文档;S2步骤:将所述语料进行处理,分成训练语料和测试语料;S3步骤:在训练阶段,首先将所述训练语料中负样本随机分成N组,每组的负样本和正样本组合成一个训练语料子集,其次,采用深度学习方法用所述子集训练生成一个基分类器,最后,N个基分类器组成基于深度学习的组合分类器;S4步骤:在测试阶段,用所述组合分类器对所述测试语料进行分类,得到N个分类标签;按照多数投票制对标签进行投票,得到最终分类标签。本发明能解决中文食品安全语料中的单类分类问题,准确地从网络新闻中筛选出食品安全相关报道。

Patent Agency Ranking