-
公开(公告)号:CN105183813A
公开(公告)日:2015-12-23
申请号:CN201510532920.2
申请日:2015-08-26
Applicant: 山东省计算中心(国家超级计算济南中心)
CPC classification number: G06F17/30705 , G06K9/6215 , G06K9/6269
Abstract: 本发明的基于互信息的用于文档分类的并行特征选择方法,包括a).选取样本并分类;b).求解词的TF-IDF值;c).生成初始化数据集合D={x1,x2,…,xN};d).分布式计算,将所有子数据集平均分布到m个计算节点上;e).建立集合,S=Φ,V={X1,X2,…,XM};f).计算联合、条件概率分布;g).计算互信息;h).选取特征变量;i).判断数量是否已够;j).文本分类。本发明的文档分类的并行特征选择方法,基于瑞利熵的互信息被用来度量特征变量与类变量之间的相关性,使得最终选取的特征变量更能代表文档分类的特征,分类效果更准确,分类结果要好于目前常用特征选择方法得到的结果,有益效果显著,适于推广应用。
-
公开(公告)号:CN117473386A
公开(公告)日:2024-01-30
申请号:CN202311437250.7
申请日:2023-10-31
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F18/241 , G06F18/213 , G06N3/0464 , G06N3/08 , G06F18/27
Abstract: 本发明提出了一种基于差异化提示字符的分层级文本分类方法及系统,涉及文本分类技术领域,设计一个预置多个占位符的分层级预测提示模版;分别对第一层级的类别集合和第二层级的类别集合进行语义特征提取与聚合,得到第一层级和第二层级的差异化提示字符;将待分类文本、第一层级和第二层级的差异化提示字符填充到分层级预测提示模版的相应占位符中,得到待预测序列;将待预测序列输入到预训练语言模型中,对第一层级类别掩码和第二层级类别掩码进行预测,得到最终的预测结果。本发明基于设计的分层级预测提示模版,使用提示学习,在小样本背景下,将文本分类的问题转化为完形填空问题,基于对预训练语言模型的知识挖掘,实现分层级的文本分类任务。
-
公开(公告)号:CN113240427A
公开(公告)日:2021-08-10
申请号:CN202110540666.6
申请日:2021-05-18
Applicant: 山东省计算中心(国家超级计算济南中心) , 山东亿云信息技术有限公司
Abstract: 本发明公开了一种基于区块链的可信交易和服务信誉评价方法,首先通过认证系统进行实名认证。然后通过数据发布系统对交易信息进行发布。在发布交易信息中,需要对交易信息进行二次认证。双方达成初步意愿后,通过信息采集平台对进行二次认证,并通过担保平台和支付平台进行支付。在交易过程中,交易流程模块构建流程状态图,实施追踪交易进展情况。完成交易后,通过综合反馈模块对发布信息人和需求信息人进行二次评价分数统计。与现有技术相比本发明的有益效果是:通过多级评价方案对相关信息进行综合评分,以保证信息的可靠性和真实性,在费用支付上采用多级担保的方式,提高双方交易的可信赖度,促进交易的成功转换。
-
公开(公告)号:CN113221001A
公开(公告)日:2021-08-06
申请号:CN202110541178.7
申请日:2021-05-18
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06F16/9535 , G06F40/216 , G06Q40/02
Abstract: 本发明公开了一种基于大数据的科技服务智能匹配、推荐的方法,其特征在于,包括如下步骤:企业通过服务平台进行实名认证和资质上传,并对企业的经营内容进行关键词的整理和分类,形成若干个领域模块的企业名录;企业通过搜索引擎模块进行检索;同时数据采集模块自动采集搜索引擎模块中录入的关键信息并进行存储;检索后的相关信息通过公示模块进行展示;数据采集模块通过整理检索信息关键词的频率和企业经营内容,通过推荐匹配模块单独在搜索引擎模块的一侧进行显示。与现有技术相比本发明的有益效果是:特点是使用操作简单,推荐准确性高,安全可靠。
-
公开(公告)号:CN107247954A
公开(公告)日:2017-10-13
申请号:CN201710461311.1
申请日:2017-06-16
Applicant: 山东省计算中心(国家超级计算济南中心)
CPC classification number: G06K9/6218 , G06K9/46 , G06N3/08
Abstract: 本发明公开一种基于深度神经网络的图像离群点检测方法,该方法采用深度神经网络提取图像特征,基于扩展熵的信息损失量度量图像之间的距离,在此基础上,提出基于聚类的图像异常检测方法,不合格图像检测方法的有效性通过实例分析得以验证,并提高不合格图像检测的效率。
-
公开(公告)号:CN119396953A
公开(公告)日:2025-02-07
申请号:CN202411503863.0
申请日:2024-10-25
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F16/332 , G06F16/33 , G06F16/36 , G06F40/35 , G06N3/042 , G06N3/0499 , G06N3/048 , G06N3/084 , G06N5/022
Abstract: 本发明属于知识图谱多跳问答技术领域,尤其涉及一种基于双向交叉注意力和图提示的知识图谱问答方法及系统;方法包括:获取问题上下文文本的语义表示和文本表示以及该问题对应的知识图谱子图;利用多层交互模型将文本表示与知识图谱子图进行多层交互,利用更新后的文本表示和图节点计算代表全图信息的提示向量,并利用提示向量增强语义表示;将增强后的语义表示以及图节点表示输入至多层感知机,得到该问题对应候选选项的得分。本发明利用多层交互模型对文本表示与知识图谱子图中的图节点表示进行多层交互,确保了文本和图数据能够相互作用;有效解决了知识图谱问答推理过程中文本向量和图向量独立更新的问题。
-
公开(公告)号:CN117009525A
公开(公告)日:2023-11-07
申请号:CN202310994477.5
申请日:2023-08-08
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F16/35 , G06F40/30 , G06F18/2415 , G06F18/22 , G06F18/27 , G06N3/0464 , G06N3/084 , G06N3/042 , G06N5/04
Abstract: 本发明属于文本分类技术领域,提供了基于提示学习的虚拟类表示的小样本文本分类方法及系统,其方案为:将原始文本序列和提示模板整合,将文本分类任务转化为完形填空任务,得到整合后的带有MASK的输入序列;基于整合后的带有MASK的输入序列和预训练语言模型,得到MASK位置的最后一层隐藏层的回归值;为每一类设计一个相同长度的随机数字作为类的虚拟表示,随机初始化一个嵌入机制,并将虚拟类表示放入随机初始化嵌入机制得到类的初始表示;基于类的初始表示进行多维度特征提取得到每一个类表示向量;将MASK位置的最后一层隐藏层的回归值和每一个类表示向量求余弦相似度,将求得的相似度向量最大值的索引作为最终的分类预测结果。
-
公开(公告)号:CN115392463A
公开(公告)日:2022-11-25
申请号:CN202211054245.3
申请日:2022-08-30
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06N5/02 , G06F40/295 , G06F40/216 , G06N3/04
Abstract: 本发明提供一种基于动态时间步的实体链接方法及系统,涉及自然语言处理技术领域,该方法包括:获取待分析文档中关联主题的多个实体提及;从知识库中获取各实体提及的候选实体,采用动态时间步的方法构建映射实体关联图,并从映射实体关联图中抽取全局主题一致性特征;根据全局主题一致性特征从所述候选实体中获取各实体提及的目标实体,将各实体提及与对应的目标实体关联。这样,通过采用动态时间步的方法构建映射实体关联图,在每一个时间步中,选择与主题相关的候选实体作为映射实体关联图的映射实体,以从映射实体关联图中抽取出正确的全局主题一致性特征,从而提高实体链接的精度。
-
公开(公告)号:CN113240393A
公开(公告)日:2021-08-10
申请号:CN202110541150.3
申请日:2021-05-18
Applicant: 山东省计算中心(国家超级计算济南中心) , 山东亿云信息技术有限公司
IPC: G06Q10/10 , G06Q40/04 , G06Q40/06 , G06F16/904
Abstract: 本发明公开了一种信息资源服务平台架构系统,包括运营平台、用户端口、中介服务端口、科技创新监管中心;用户端口包括企业端口、高校端口和个人端口;运营平台包括信息维护中心、大数据处理中心、流程监管中心、支付运营中心、登录服务中心;中介服务端口包括第三方科技服务单元、第三方融资单元和中介服务平台;科技创新监管中心包括创新统计中心、交易监控中心和第三方监管中心。与现有技术相比本发明的有益效果是:集成了多方的一体系构建平台,包括企业、个人、高校、科技服务机构以及监管部门,通过平台统一正规化管理,降低风险预算,促进成果转化,为成果的落地形成提供强有力的支撑。
-
公开(公告)号:CN112395860A
公开(公告)日:2021-02-23
申请号:CN202011354524.2
申请日:2020-11-27
Applicant: 山东省计算中心(国家超级计算济南中心) , 山东亿云信息技术有限公司
IPC: G06F40/211 , G06F40/284 , G06F16/36 , G06N5/02
Abstract: 本发明提供了一种大规模并行政策数据知识抽取方法及系统,本发明通过对政策数据进行正文内容解析,获得政策正文数据列表,分别进行政策发文机构、发布日期知识抽取、政策申报截止日期知识抽取以及政策事件知识抽取,从而实现政策数据的知识抽取。本发明实现依存句法分析模型预加载,达到模型加载一次,多次使用的效果,提高知识抽取的效率,无需使用人工对知识进行抽取,节省人力成本,提高效率,适用于信息量巨大的网络信息获取。
-
-
-
-
-
-
-
-
-