一种面向招标文本的信息抽取方法

    公开(公告)号:CN108874771A

    公开(公告)日:2018-11-23

    申请号:CN201810513564.3

    申请日:2018-05-25

    Applicant: 福州大学

    Abstract: 本发明涉及一种面向招标文本的信息抽取方法,包括:对招标文件进行规范化处理;根据所需要抽取的信息,建立对应的关键词列表;逐句读取招标文件的文本内容,使用jieba分词逐句对招标文件的文本进行分词与标注词性处理;将分词结果进行存储,作为后续抽取操作的输入数据,完成预处理;通过调用预设信息抽取模块,根据目标招标信息,对预处理过的文本采用对应匹配抽取方式进行对应的招标信息抽取操作,获取抽取结果。本发明提出的一种面向招标文本的信息抽取方法,利用自然语言处理领域的技术实现对招标文本中特定信息进行抽取并将获得的信息以结构化的形式给予描述。通过对招标文本的信息抽取为招标信息的提取提供更有力的获取工具。

    一种基于句法语义的农业领域关系抽取方法

    公开(公告)号:CN108920465A

    公开(公告)日:2018-11-30

    申请号:CN201810766657.7

    申请日:2018-07-13

    Applicant: 福州大学

    Abstract: 本发明涉及一种基于句法语义的农业领域关系抽取方法,首先从农业专业网站爬取农业知识相关的文本。将收集得到的文本进行整理,去除掉无关文本,得到就是与农业领域相关的文本。结合事先确定的关系种类,对农业领域文本进行人工标注,构建农业领域的语料库。根据确定好的特征种类对文本进行特征抽取,构建特征向量。最后使用SVM对分类器进行建模,得到面向农业领域的关系分类模型。本发明有较好的抽取效果。

    一种面向领域知识图谱的问答系统及构建方法

    公开(公告)号:CN111506721B

    公开(公告)日:2022-10-11

    申请号:CN202010321773.5

    申请日:2020-04-22

    Applicant: 福州大学

    Abstract: 本发明涉及一种面向领域知识图谱的问答系统及构建方法,根据给定知识图谱中的三元组,基于设定模板生成问答对,然后对问答对中的问句进行分词处理以及向量化处理,得到每一个问答对中问句的词向量,并构建问答语料库;将用户输入的问句进行分词处理以及向量化处理,并计算用户输入的问句与问答对中的问句的相似度,选取相似度最高的前N个问答对的答案作为用户问句的答案,并反馈给用户。本发明能够在给定多种不同领域的知识图谱的情况下,自动生成不同领域的问答系统,比起限定好领域的问答系统,该系统更加灵活,给定不同的情景都能够自动生成问答系统,可复用性较高。

    一种面向领域知识图谱的问答系统及构建方法

    公开(公告)号:CN111506721A

    公开(公告)日:2020-08-07

    申请号:CN202010321773.5

    申请日:2020-04-22

    Applicant: 福州大学

    Abstract: 本发明涉及一种面向领域知识图谱的问答系统及构建方法,根据给定知识图谱中的三元组,基于设定模板生成问答对,然后对问答对中的问句进行分词处理以及向量化处理,得到每一个问答对中问句的词向量,并构建问答语料库;将用户输入的问句进行分词处理以及向量化处理,并计算用户输入的问句与问答对中的问句的相似度,选取相似度最高的前N个问答对的答案作为用户问句的答案,并反馈给用户。本发明能够在给定多种不同领域的知识图谱的情况下,自动生成不同领域的问答系统,比起限定好领域的问答系统,该系统更加灵活,给定不同的情景都能够自动生成问答系统,可复用性较高。

    面向法制相关文本的判别方法

    公开(公告)号:CN109033081A

    公开(公告)日:2018-12-18

    申请号:CN201810787857.0

    申请日:2018-07-18

    Applicant: 福州大学

    CPC classification number: G06F17/2715 G06K9/6278

    Abstract: 本发明涉及一种面向法制相关文本的判别方法。利用爬虫在互联网上爬取法制相关文本,构建法制相关语料库;对法制相关语料库中的语料标注关联度,并且利用结巴分词技术及TF‑IDF关键词技术对每条语料进行分词,统计得到关键词;利用关键词组生成每条语料和关键词的特征向量;对于每条语料和关键词的特征向量进行机器学习并生成对应的分类模型;最后利用分类模型对互联网上文本进行判别。本发明利用机器学习对于处理好的数据进行学习训练,最终实现法制相关文本的判别。

Patent Agency Ranking