计算机系统应用教程网站

网站首页 > 技术文章 正文

基于元路径分层Transformer和注意力网络的药物-靶标相互作用预测

btikc 2024-10-19 03:14:04 技术文章 14 ℃ 0 评论

今天给大家讲一篇2023年3月在Briefings in Bioinformatics上发表的一篇药物靶标互作的文章,作者提出了一种药物-靶标相互作用预测的基于元路径的分层变压器和Transformer方法(MHTAN-DTI),通过引入不同元路径实例的不同权重以获得特定语义的节点嵌入,运用注意力机制主要捕捉不同元路径类型的重要性,并执行加权融合以获得最终的节点嵌入表征。与其他DTI预测方法相比,MHTAN-DTI的预测性能具有显著优势。此外,还进行了消融实验。结果表明,多种异构信息在预测DTI方面的重要性,且具有一定的可解释性,加速药物设计的进程

药物靶标作用研究背景

在早期药物发现中,靶标的选择和确认尤为重要。药物-靶点相互作用的预测对于识别新的配体与特定靶标之间的相互作用、多药理学研究和耐药性研究具有重要意义。自2019年12月以来,高传染性且具有潜伏性的2019冠状病毒(COVID-19)迅速蔓延,并对人类健康构成严重威胁。因此了解药物靶标信息有助于预测脱靶毒性及其疗效,也为研究药物副作用的机制提供了新的视角。其中药物靶标相互作用的评估指标有最大半抑制浓度(IC50),抑制常数(Ki)和解离常数(Kd)等。现有基准方法有引入药物-药物相互作用、药物-疾病互作、药物-副作用、蛋白-蛋白和蛋白-疾病互作等信息来提高预测效果,它们包含了与药靶作用相关的潜在信息。然而,如何有效地利用节点间的拓扑结构来提升药靶作用的预测很难解决。本文作者提出了一种基于元路径的Transformer模型及注意力网络(MHTAN-DTI)的药靶作用预测方法。首先,构建了一个包含708种药物、1512种蛋白、5603种疾病和4192种副作用的异质性生物信息学网络。网络中边的特征包括药物-药物互作、药物-蛋白互作、药物-疾病互作、药物-副作用互作、蛋白-蛋白互作和蛋白-疾病互作的信息。该模型基于异构生物信息学网络生成药物和蛋白质的低维向量来实现精准的药靶作用预测

MHTAN-DTI模型介绍

2.1 模型架构

作者提出了一种Transformer及注意力网络的方法来预测药物靶标相互作用。如图1所示,首先,构建了一个包含四种节点类型的异质生物信息学网络:药物、靶点、疾病和副作用。然后,依次使用Transformer及注意力网络,将生物网络的结构及语义信息编码为药物和靶标的低维潜在嵌入。其中元路径实例Transformer对元路径实例进行内部聚合,单语义注意力将相同元路径类型的元路径实例与节点本身结合起来,多语义注意力融合多个单语义节点嵌入,得到最终的节点嵌入。并最终输出一个二值分类结果,通过交叉熵损失函数来更新模型的权重系数。

实验结果

3.1基准方法评估与比较

如图2所示,作者验证了MHTAN-DTI在构建的元路径数据集上的性能,并将MHTAN-DTI与7种最先进的DTI预测方法(BLMNII、CMF、NetLapRLS、NRLMF、DTINet、NeoDTI和EEG-DTI)进行了比较。实验结果表明,MHTAN-DTI在DTI预测性能方面表现最佳。与7种对照实验方法的最佳结果相比,MHTAN-DTI的AUROC提高了3.01%,AUPR提高了2.71%。

而其余方法则效果不佳,可能是由于它们捕获的相关特征相对有限。此外,从无监督学习中学到的嵌入表征很可能不适合DTI预测。因此,MHTAN-DTI通过结合元路径实例级变换、单语义注意和多语义注意,能够更好地捕获药物-蛋白质相互作用的关键特征,从而在性能上取得显著的改进

3.2 消融实验分析

作者引入了Transformer编码器作为元路径实例的聚合器。为了评估不同元路径实例编码器对MHTAN-DTI的影响,还使用了双向长短时记忆网络(BiLSTM)编码器、平均编码器和最大池化编码器的方式作为基准比较。此外,还进行了一个额外的实验,即只利用基于元路径的邻居信息,而没有使用任何元路径实例编码器。如图3所示,在没有对中间节点进行聚合的情况下,AUROC和AUPR指标会明显下降,这表明药物和蛋白质的最终嵌入丧失了重要信息。此外,除了Transformer编码器之外,BiLSTM编码器在性能上表现得最好。平均编码器和最大池化编码器也取得了良好的实验结果。Transformer编码器相较于仅考虑基于元路径的邻居信息实现了显著的性能提升,表明该编码器在元路径实例上的有效性

结论

作者构建了一种基于元路径的Transformer且结合注意力网络的药物-蛋白质相互作用(DTI)预测方法。首先,构建了一个基于元路径的异构生物信息学网络。基于元路径类型来来表征数据的方法使得模型具有可解释性。此外,还采用了Transformer编码器和双层注意力机制来获取蛋白及化合物序列的语义信息从而生成二者的低维向量,最终用于DTI预测。可以发现Transformer编码器有助于捕获元路径实例之间的依赖关系,而双层注意力网络也减轻了噪声对预测性能的影响

进一步,为了验证MHTAN-DTI的有效性和鲁棒性,作者将其与7种不同的DTI预测方法进行了比较。实验结果显示,MHTAN-DTI在性能上表现出竞争性的优势。此外,还进行了消融研究,证明了不同元路径类型和MHTAN-DTI的不同组成部分对提高DTI预测性能的贡献。这些发现强调了MHTAN-DTI作为一种强大的DTI预测方法的潜力和可应用性。

参考文献

  1. Cummings, M. D. & Sekharan, S. Structure-based macrocycle design in small-molecule drug discovery and simple metrics to identify opportunities for macrocyclization of small-molecule ligands. J. Med. Chem. 62, 6843–6853 (2019)

版权信息

本文系AIDD Pro接受的外部投稿,文中所述观点仅代表作者本人观点,不代表AIDD Pro平台,如您发现发布内容有任何版权侵扰或者其他信息错误解读,请及时联系AIDD Pro (请添加微信号sixiali_fox59)进行删改处理。

原创内容未经授权,禁止转载至其他平台。有问题可发邮件至sixiali@stonewise.cn

Tags:

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表