博文

目前显示的是 十一月, 2024的博文

2024 - AIDD: FragNet-可解释的分子属性预测模型

图片
  AIDD: FragNet-可解释的分子属性预测模型 <<< 左右滑动见更多 >>> 榴莲忘返 2014 导读 分子属性预测是材料发现和设计的关键组成部分,应用于药物设计、储能材料发现、催化和农用化学品等多个现代科学领域。尽管已有大量机器学习模型可用于分子特性预测,但在提供高精度预测和提供可解释性以支持科学见解的能力之间,往往需要权衡。 本文介绍了一种名为 FragNet 的图神经网络架构,它不仅能够实现与当前最先进模型相当或更优的预测精度,而且还能提供对四个分子亚结构层面的洞察力,即原子、键、片段和片段连接。换言之,利用该模型,研究人员可以了解哪些原子、键、分子片段以及分子片段之间的哪些连接在预测给定分子特性方面起着关键作用。通过增强模型推理片段之间连接的能力,研究人员为具有不通过规则共价键连接的亚结构的分子(如盐和络合物)提供了改进的表示。 此前已有若干研究实现了利用注意力机制的深度学习模型,这些模型可以为不同类型的分子亚结构提供值。AttentiveFP [2] 和 MoGAT [3] 模型提供了原子级重要性值。Wu 等人的研究 [4] 提供了片段级注意力。然而,他们的工作在评估的分子特性范围方面受到限制,因为它只提供了使用随机训练 - 测试拆分配置的 ESOL 数据集 [5] 的结果。相比之下,本研究提供了 MoleculeNet [6] 中多个基准数据集的预测结果,同时使用了更具挑战性的支架拆分方法。这为理解分子特性预测模型的推理如何受目标特性影响提供了更全面和稳健的理解。 除了展示 FragNet 模型在这一系列挑战性任务中强大的特性预测性能外,研究人员还通过对选定的特性预测任务进行多个案例研究,展示了多层可解释性机制的效用。研究人员使用模型注意力权重和贡献值来研究模型对单个分子预测以及跨多个预测的聚合推理,以识别驱动特性变化的关键分子成分。为了进一步验证从模型中提取的推理,研究人员对 FragNet 贡献分数与静电表面电势的密度泛函理论 (DFT) 计算进行了比较研究。最后,研究人员开发并发布了一个交互式浏览器应用程序,使其他分子特性任务能够访问这些类型的可解释性研究。 方法 FragNet 模型采用多图架构,分别构建原子图、键图和分子片段图来表征分子结构。原子图和键图的构建方式与传统图神经网络类似,...