材料基因组工程研究院杨炯教授团队在计算材料著名期刊《NPJ Computational materials》上发表研究论文

发布日期: 2020/11/13  投稿: 吕涛    部门: 材料基因组工程研究院   浏览次数:    返回

近日,材料基因组工程研究院杨炯教授课题组在计算材料著名期刊《NPJ Computational materials》上发表研究论文“Active learning for the power factor prediction in diamond-like thermoelectric materials (用主动学习预测类金刚石热电材料的功率因子)”。上海大学为第一单位,材料基因组工程研究院博士生盛晔为第一作者,材料基因组工程研究院杨炯教授和南方科技大学物理系张文清教授为通讯作者。此工作还得到了上海大学陆文聪教授、钱伟长学院2017级本科生吴雅颂,瑞士Material Phases Data System公司(MPDS)的Pierre Villars的鼎力支持。

该工作基于前期高通量计算的158个类金刚石热电材料的功率因子,用主动学习的框架结合机器学习和第一性原理计算,建立高精度的外推模型。主动学习的框架包括数据库,机器学习和验证样本选择模块,计算验证模块,如图1所示。验证样本的选择策略对主动学习的精度和效率有很大影响。在尝试的多种策略中,以多个机器学习算法的争议为推选验证样本标准的“委员会推选(Query by Committee)”策略得到了外推能力最强的模型。在分析搜索空间中所有化合物的功率因子后发现,磷族化合物,含有空位和小原子半径元素的硫族化物可能具有较大的p型功率因子,如图2所示。


图1:类金刚石结构热电材料搜索空间及主动学习框架


图2:通过外推结果预测的具有高p型功率因子的新型热电材料


数据驱动的机器学习方法在近年被引入加速用于热电材料的搜索。机器学习方法的一般过程包括数据收集,机器学习,高性能的候选材料预测和验证。大多数研究中机器学习模型在已知数据集上表现很好,但没有去验证模型在已知数据之外的可靠性。而从材料应用角度讲,机器学习模型的外推预测能力至关重要。弱外推能力往往可以通过扩展数据样本来改善,但是增加大量样本成本高昂。主动学习架构通过外部验证更新机器学习模型,用尽可能少的验证样本最大程度的提高机器学习模型的外推能力。主动学习架构的应用不只局限热电材料也可用于其他功能材料,对加速高性能材料的发现具有重要的意义。

相关工作得到了国家重点研发计划(2018YFB0703600、2017YFB0701600)、国家自然科学基金(11674211、51632005、51761135127)、111项目(D16002)、广东省“珠江人才计划”引进创新创业团队(2017ZT07C062)、广东省重点实验室项目(2019B030301001)、深圳市重点实验室项目(ZDSYS20190902092905285)、深圳市鹏程学者、南方科技大学计算科学与工程中心的资助。

论文链接:https://www.nature.com/articles/s41524-020-00439-8 (撰稿:杨炯)