论文部分内容阅读
在光伏领域,光电转换效率(PCE)是在器件环境下测量光伏材料性能的关键参数。传统开发有机光伏(OPV)材料的模式涉及基于经验的分子设计、有机合成、材料表征、器件优化及表征等多个环节,需要大量的资源投入,因此经过近30年的发展,仅实验验证了不足2000余个分子结构。为了加快OPV材料开发进程,我们尝试通过机器学习方法来快速筛选/评估设计的分子。首先,我们开发了一个基于卷积神经网络的深度学习模型,能够识别化学结构并自动分类[1]。我们利用来自哈佛清洁能源项目的 35000个分子对模型进行培训,该模型在预测OPV供体材料的PCE方面取得了90%以上的成功率。值得注意的是,深度学习模型允许直接使用化学结构的图片作为输入。通过对模型的可视化,发现该模型可以从化学结构图中提取元素、化学键或子结构等抽象特征。然而,与文献报道的分子相比,哈佛清洁能源项目中的分子不具有侧链,结构简单。因此,我们建立了一个包含1719个OPV供体材料的数据库,该数据库是从Web of Science收录的已发表文献里总结出来的[2]。为了在OPV材料发现中应用机器学习方法,特别是使用小数据库时提供一些指导和建议,我们接下来研究了机器语言表达对分子结构的重要性,并讨论了不同机器学习算法的优缺点。结果表明,具有一定长度的分子指纹可以提供足够的化学结构信息进行建模,而随机森林算法是一种稳定的算法。通过对10个新型给体材料的PCE评估,模型预测结果与实验值吻合较好,验证了机器学习方法的可靠性。我们的研究证明机器学习是一种有效的工具,可以预先筛选新的OPV材料,为新材料的设计提供指导。