-
公开(公告)号:CN110377700A
公开(公告)日:2019-10-25
申请号:CN201910583098.0
申请日:2019-07-01
Applicant: 厦门美域中央信息科技有限公司
Inventor: 刘家祥
Abstract: 一种专业知识语义检索系统,包括应用层、业务逻辑层和数据层;应用层包括输入模块和输出模块;业务逻辑层包括数据处理模块、信息调取模块和标识模块;数据层包括若干信息库模块。本发明对接收到的检索条件进行模糊概念转换、查询优化扩展,并生成同义检索条件集和语义相近检索条件集,接着对各检索条件集进行分词解析,将解析结果转化为本体查询语言,然后将本体查询语言与信息库模块中相关的专业知识进行匹配、校正,最后在信息库中调取与本体查询语言匹配的三元组,同时标识模块对个体用户检索过的知识进行标记,并将其存储在信息库中,大大提高了语义检索的精准度和检索的速度,方便用户对专业知识的学习。
-
公开(公告)号:CN110362682A
公开(公告)日:2019-10-22
申请号:CN201910542364.5
申请日:2019-06-21
Applicant: 厦门美域中央信息科技有限公司
Inventor: 肖清林
Abstract: 一种基于统计机器学习算法的实体共指消解方法,方法步骤包括:构建资料库,划分训练组和实测组;确定实体共指消解的特征;对训练组进行表述检测;构建实体共指表述对集合;构建分类模型;进行分类模型训练;进行分类模型校正;将实测组信息输入分类模型,并生成结果。本发明首先确定实体共指消解的特征,接着进行表述检测,建立分类模型,并通过对分类模型的反复训练和校正,在统计机器学习算法的基础上最终实现对实体共指消解,使得对实体共指消解的准确性高,从而保证了工作在机器翻译,信息抽取以及问答等领域的顺利进行,利于工作的普及和开展。
-
公开(公告)号:CN116258256A
公开(公告)日:2023-06-13
申请号:CN202310102013.9
申请日:2023-02-09
Applicant: 厦门美域中央信息科技有限公司
IPC: G06Q10/04 , G06Q50/06 , G06N3/0442 , G06N3/08 , G06N20/00
Abstract: 本发明涉及能源预测领域,具体为一种基于地理分布机器学习的能源出力及负荷预测方法,其包括以下步骤:S1、获取能源出力以及负荷的时间序列历史数据集A和历史数据集B;S2、按照地理位置对历史数据集A以及历史数据集B进行分割;S3、对每个子数据集进行划分,分成为训练集和测试集;S4、构建各地区的能源出力预测模型和能源负荷预测模型;S5、获取突变的影响因素、影响数值和影响时间段;S6、向能源出力预测模型和能源负荷预测模型中输入地区和时间,获取能源出力及负荷的预测值;S7、结合突变的影响因素进行预测值的纠正,获得最终预测结果。本发明中,预测结果排除突变的影响因素,能更加准确地得到能源出力及负荷的预测值。
-
公开(公告)号:CN110457467A
公开(公告)日:2019-11-15
申请号:CN201910587787.9
申请日:2019-07-02
Applicant: 厦门美域中央信息科技有限公司
Inventor: 刘家祥
Abstract: 一种基于高斯混合模型的信息技术文本分类方法,包括以下具体步骤:预先设置多个不同的类别;根据不同的类别细分多个具体的类目;根据设置的不同的类别和类目构建高斯混合模型的训练集;通过训练集得到高斯混合模型;提取信息技术文本中的分词,并根据分词确定关键词;根据关键词对信息技术文本进行初步分类;将关键词输入高斯混合模型中;分类结果与初步分类结果进行比对;对分类结果进行修正,并输出最终结果;本发明构建高斯混合模型的训练集,同时对于分类错误的文本通过人工修正后作为特例输入高斯混合模型的训练集中,从而进一步提高高斯混合模型的准确度;随着输入高斯混合模型的信息技术文本越来越多,其准确度逐渐提高。
-
公开(公告)号:CN110442729A
公开(公告)日:2019-11-12
申请号:CN201910587769.0
申请日:2019-07-02
Applicant: 厦门美域中央信息科技有限公司
Inventor: 刘家祥
Abstract: 一种基于粗燥集的语料库系统构建方法,所述构建方法包括以下步骤:S1、采集原始语料数据,构建原始语料文本集;S2、对所述原始语料文本集进行预处理,得到标注语料数据文本集;S3、利用R语言聚类方法对标注语料数据文本集进行聚类;S4、对聚类后的标注语料数据文本集进行自分类测试,验证分类体系的准确性,确定最终该分类系统的类目;S5、对标注语料数据文本集进行一致性评估,并将原始语料和满足一致性评估的标注文本存储到信息语料库中;S6、基于粗糙集对所述原始语料数据、标注语料数据文本集和分类类目共同构建得到语料库系统。本发明有效提高对语料库系统构建效率和准确性。
-
公开(公告)号:CN110442708A
公开(公告)日:2019-11-12
申请号:CN201910547137.1
申请日:2019-06-24
Applicant: 厦门美域中央信息科技有限公司
Inventor: 肖清林
IPC: G06F16/35 , G06Q50/26 , G06F16/951
Abstract: 一种基于粒度计算的信息分类方法,包括以下步骤:获取信息;进行分词处理并获得词汇集合;进行词性标注和词义标注;根据预先存储的各类别信息,从词汇集合中获得与其相匹配的类别词汇;基于粒度计算确定词汇集合中的每一个类别词汇的权重;确定词汇集合中包含的所有类别词汇所属的目标类别信息;基于粒度计算确定每一个目标类别信息的权重;根据每一个目标类别信息的权重,确定该信息所属的至少一个类目;判断该信息与各所属类目的概率是否大于预设阈值。本发明基于粒度计算来进行信息分类,优化了信息分类方法,操作简便,分类效率高,分类准确度高,省时省力。
-
公开(公告)号:CN110427457A
公开(公告)日:2019-11-08
申请号:CN201910570843.8
申请日:2019-06-28
Applicant: 厦门美域中央信息科技有限公司
Inventor: 肖清林
Abstract: 一种基于ANN的数据库文本分类中的特征选择方法,其特征在于,包括以下具体步骤:使用文本样本集合及其文本类别,通过ANN人工神经网络训练获得文本分类模型;建立文本分类模型的集合,对不同的文本分类模型设置用于比较的特征关键词;获取待分类的文本,对待分类文本进行预处理,获取待分类文本的特征项集合;确定特征项集合中每一个特征项的实体属性和在待分类文本中出现的频率;根据特征项出现的频率设置权重;根据关联度的高低,对特征项进行排序;计算相似度;之后将待分类文本输入相似度最高的文本分类模型中;本发明中通过ANN训练得出多个分类模型,并提取分类模型的特征关键词和待分类文本的特征项,通过比对选择最合适的分类模型。
-
公开(公告)号:CN110413795A
公开(公告)日:2019-11-05
申请号:CN201910542136.8
申请日:2019-06-21
Applicant: 厦门美域中央信息科技有限公司
Inventor: 刘家祥
Abstract: 一种数据驱动的专业知识图谱构建方法,包括以下步骤:根据专业领域所涵盖的数据来源以及业务特征进行本体建模;从专业知识数据源进行知识抽取;通过图数据库、关系型数据库以及文档数据库相结合的方式对抽取的专业知识进行存储;将从各数据源采集的专业知识进行知识融合;并构建专业知识图谱。本发明提出一种数据驱动的专业知识图谱构建方法,有效准确的方法实现专业知识图谱的构建,在数据源足够支撑的情况下,使得覆盖专业领域的知识更加全面。
-
公开(公告)号:CN110390022A
公开(公告)日:2019-10-29
申请号:CN201910542202.1
申请日:2019-06-21
Applicant: 厦门美域中央信息科技有限公司
Inventor: 刘家祥
IPC: G06F16/36 , G06F16/951 , G06F16/35 , G06F17/27
Abstract: 一种自动化的专业知识图谱构建方法,包括以下步骤:获取专业知识文本;对专业知识文本进行分词并去除分词文本中的停用词;将每条文本转换成若干词语集合;通过词性标注得到词性标签,通过依存分析得到依存标签和依存树;基于词性标签和依存标签进行名词短语检测、动词短语检测、候选关系检测;对候选关系中的词语进行语义标注,得到候选语义关系模式;对得到的候选语义关系模式进行聚类,得到一组最终的语义关系模式;利用语义词典和语义关系模式得到专业知识数据;将数据写成owl文件并导入到protege中。本发明进行了优化和扩展,构建专业知识图谱的效率高,成本较低,省时省力,并且所构建的专业知识图谱准确性高。
-
公开(公告)号:CN110377904A
公开(公告)日:2019-10-25
申请号:CN201910555817.8
申请日:2019-06-25
Applicant: 厦门美域中央信息科技有限公司
Inventor: 肖清林
Abstract: 一种基于语料库的近义词辨析方法,所述辨析方法包括以下步骤:S1、采集整理相关词语并建立语料库;S2、根据词语信息对语料库进行实时更新;S3、对词语进行采集和预处理;S4、对预处理后的词语进行识别分析;S5、根据语料库对采集的词语进行近义词辨析;S6、对近义词辨析结果进行统计确认。本发明对信息近义词辨析精准且辨析效率高。
-
-
-
-
-
-
-
-
-