-
公开(公告)号:CN113160906A
公开(公告)日:2021-07-23
申请号:CN202110429091.0
申请日:2021-04-21
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种MXenes材料稳定性分类系统及其运行方法,该系统包括MXenes材料第一性原理性质计算数据库、特征处理模块、机器学习与预测模块和符号回归模块;所述特征处理模块的输入端与第一性原理性质计算数据库连接,输出端分别与机器学习与预测模块、符号回归模块连接。本发明引入特征工程用于稳定性相关性质描述符的筛选,有利于提高MXenes材料稳定性分类准确度至84%;引入符号回归突破性质描述符的局限性,回归出由基本特征组合而成的新描述符(PaulA‑RaV)3,更准确评价MXenes材料稳定性。
-
公开(公告)号:CN113053474A
公开(公告)日:2021-06-29
申请号:CN202110395730.6
申请日:2021-04-13
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种可光充电材料筛选系统及其运行方法,包括文献数据采集模块、化学式提取模块、无监督机器学习模块、可视化操作模块和特性模拟模块,化学式提取模块、无监督机器学习模块的输入端均与文献数据采集模块连接,输出端均与可视化操作模块连接,可视化操作模块与特性模拟模块连接。本发明将无监督机器学习的两层神经网络词向量算法和ChemDataExtractor化学式提取有效地结合起来,建立化学式、相关属性、可光充电属性间的关联性并表征关联度大小,以进行可光充电材料的筛选,省去人工标注步骤,提高文献数据处理效率,材料筛选准确度达90%。
-
公开(公告)号:CN114625865A
公开(公告)日:2022-06-14
申请号:CN202210196825.X
申请日:2022-03-01
Applicant: 南京信息工程大学
IPC: G06F16/34 , G06F16/33 , G06F40/242 , G06F40/284 , G06N3/02
Abstract: 本发明公开了一种利用自然语言处理挖掘太阳能电池材料的方法及系统,其方法包括以下步骤:获取太阳能电池材料相关文献资料的摘要部分,形成文献摘要语句库;对文献摘要语句库进行预处理;对预处理后的文献摘要语句库进行逐句分词;将获得的分词输入预先训练的神经网络模型;根据神经网络模型的输出,挖掘潜在的太阳能电池材料。本发明通过获取文献摘要语句库,预处理,文字转换为词向量并引入自定义词典、筛选词以及分词技术,删除无效输入信息,使得预测挖掘潜在的太阳能电池材料变得更容易、预测准确度更高。
-
公开(公告)号:CN113160906B
公开(公告)日:2024-01-02
申请号:CN202110429091.0
申请日:2021-04-21
Applicant: 南京信息工程大学
IPC: G16C60/00 , G16C20/70 , G06F18/2411 , G06F18/2431 , G06N20/00
Abstract: 本发明公开了一种MXenes材料稳定性分类系统及其运行方法,该系统包括MXenes材料第一性原理性质计算数据库、特征处理模块、机器学习与预测模块和符号回归模块;所述特征处理模块的输入端与第一性原理性质计算数据库连接,输出端分别与机器学习与预测模块、符号回归模块连接。本发明引入特征工程用于稳定性相关性质描述符的筛选,有利于提高MXenes材料稳定性分类准确度至84%;引入符号回归突破性质描述符的局限性,回归出由基本特征组合而成的新描述符(PaulA‑RaV)3,更准确评价MXenes材料稳定性。(56)对比文件Venturi V等.Machine learning enableddiscovery of application dependent designprinciples for two-dimensional materials.《Machine Learning: Science andTechnology》.2020,第1卷(第3期),1-32.
-
公开(公告)号:CN114429129A
公开(公告)日:2022-05-03
申请号:CN202111578394.5
申请日:2021-12-22
Applicant: 南京信息工程大学
IPC: G06F40/289 , G06F40/242 , G06F40/253 , G16C60/00 , G16C20/30 , G16C20/90 , G16C20/70
Abstract: 本申请涉及材料预测和计算技术领域,且公开了一种文献挖掘与材料性质预测方法,包括以下步骤:1)抓取有关化学和材料的中文文献摘要21万篇;2)使用分词测试集测试分词工具,选取最佳分词工具将数据库进行分词;3)使用自定义停用词库和自定义词典将摘要数据库进行预处理,并整理成LineSentence格式;4)用两种不同的模型skip‑gram和CBOW进行词向量嵌入训练,并使用自定义关联词测试集测试不同的word2vec模型;5)选取最优模型进行太阳能电池材料的预测。通过第一性原理去计算辅助验证预测项。通过使用Word2vec词向量嵌入算法对专业中文文献摘要数据库进行自然语言处理,在模型成功输出太阳能电池材料预测项后,使用第一性原理辅助计算验证,准确性和有效性更高。
-
-
-
-