人工智能在药物开发过程中的应用_技术前沿_医疗器械资讯-3618医疗器械网

在药物的发现和开发过程中，艰巨的步骤是在10的60次方的分子量级的巨大化学空间中识别合适的和具有生物活性的药物分子。此外，药物的发现和开发过程被认为是一个耗费时间和成本的过程。但令人惋惜的是，十分之九的药物分子通常无法通过II期临床试验和其他监管批准。上述药物发现和开发的局限性可以通过实施基于人工智能的工具和技术来解决。

人工智能涉及到药物开发过程的每一个阶段，如小分子设计、确定药物剂量和相关有效性、预测生物活性剂、蛋白质-蛋白质相互作用、识别蛋白质折叠和错误折叠、基于结构和配体的VS、QSAR建模、药物再利用、预测毒性和生物活性特性，以及确定药物化合物的作用模式。

肽合成和小分子设计

肽是由大约2-50个氨基酸组成的具有生物活性的小链，由于它们能够穿过细胞屏障并到达所需的靶位点，因此越来越多地被用于治疗目的。一些基于DL（深度学习）和ML（机器学习）的工具已经得到开发应用于这一领域，例如Deep-amp p30，Deep-AmPEP30，IAMPE，ACP-DL，DeepACP等工具。

此外，国内一些公司也开始在该领域展开行动，例如，此前晶泰科技与美国B.A.I.达成合作，共同推进针对皮肤类疾病多肽创新药物的研发。除了晶泰科技，目前国内安吉生物，佩德生物等企业也涉足该领域。

小分子是分子量非常低的分子，像肽一样，小分子也正在使用基于人工智能的工具进行治疗目的的探索。这是目前得到广泛应用的一项领域。

目前国内已经就这一领域展开了一些项目，例如，睿健医药通过基于人工智能AI筛选小分子化合物作为诱导和培养基的多功能干细胞产品开发平台，目的就是实现诱导多能干细胞的高效转化。该公司的iReme[x]ta平台利用知识图谱进行靶点富集分析，并结合互作网络拓扑结构计算每条通路的影响度和每一靶点的重要度，这样得以获得特定发育途径中的关键通路及基因，并深入确定了适合用来治疗的细胞状态。

药物剂量和给药有效性的识别

给患者施用不适当剂量的任何药物都会导致不希望和致命的副作用，因此，确定用于治疗目的的安全药物剂量至关重要。多年来，确定药物的佳剂量一直是一个挑战，这种药物可以实现期望的疗效，同时具有小的副作用。随着人工智能的出现，许多研究人员正在借助ML（Machine learning）和DL（Deep Learning）算法来确定合适的药物、剂量。例如AI-PRS，CURATE.AI等。

预测生物活性剂和监测药物释放

药物类似物的设计和监测是一个冗长而耗时的过程。以来，多种在线工具已被开发分析药物释放和检查作为载体的选定生物活性化合物的衡量计算。基准数据集随后被用于验证计算分析。对于这样的评价，基于化学特征的药效团适合。这些模型构建了通过计算机实验开发的大型3D数据集内部的复合集合。

此外，药物不良反应(ADRs)是由给药引起的意外的、有害的、致命的副作用。避免药物不良反应是药物开发中的一个主要挑战，在药物开发的初期阶段识别可能的药物不良反应以使药物开发过程更加稳健和有效变得至关重要。研究人员已经使用人工智能来确定不同药物在上市前可能出现的不良反应。例如：pairwiseMKL，Xgboost，DeepMalaria等等。

从具体事例来看，对于抗胆碱药物的研究中，众多药物，包括某些膀胱药、抗抑郁药、胃药和帕金森病药物都有一定程度的抗胆碱能影响。可能导致包括迷失方向、视力模糊、头晕、跌倒和脑功能下降在内的不良副作用。研究人员开发了国际抗胆碱能认知负担工具(IACT)。这是一个在线工具，采用化学结构分析和自然语言处理来识别具有抗胆碱能效应的药物。抗胆碱能负担的计算方法是根据记录的不良事件给出一个分数，并与考虑开具处方的药品的化学结构密切匹配，从而形成一个比以往任何方法都更准确和新的评分系统。经过进一步调查和使用实际病人数据进行建模而开发的工具可以帮助减少常见药物的风险。

蛋白质相互作用和折叠

分析蛋白质相互作用(PPIs)对于有效的药物开发和发现至关重要。大多数蛋白质的注解方法使用的是具有有限范围的序列同源性。随着数据量的不断增加，高通量蛋白质-蛋白质相互作用数据正在成为新的生物学发现的基础。生物信息学现在面临的一个巨大挑战是管理、分析和模拟这些数据，因此为了满足这一点，能够同时预测多个输入的计算模型已经得到开发。尽管PPIs被认为比蛋白质-蛋白质非相互作用PPNIs更能提供信息，这些计算方法会被用于研究PPIs和PPNIs。ML和统计学习方法，如K-nearest neighbor，Naïve Bayesian，SVM，ANN，DT和RF已被用来预测PPIs中的遇到的障碍。如利用贝叶斯网络(BN)预测PPIs主要是利用基因共表达、基因本体(GO)和其他生物过程相似性。

此前相当的AlphaFold就是AI技术在这一领域的典型范例，Deep Mind在训练该系统时，用到了约17万种已知实验蛋白质结构的公共数据集，还使用了未知结构蛋白质序列数据库。AlphaFold分两步预测蛋白质的3D结构:(I)首先，使用卷积神经网络（CNN）将蛋白质的氨基酸序列转化为距离矩阵和扭转角矩阵，(II)其次，使用梯度优化技术将这两个矩阵转化为蛋白质的三维结构。

基于结构和基于配体的虚拟筛选

在药物设计和药物发现中，虚拟筛查（VS）是计算机辅助药物设计（CADD）的关键方法之一。VS代表了识别与药物靶点结合的小化合物。VS是一种从化合物池中筛选出有潜力的治疗化合物的有效方法。因此，它成为高通量筛选的重要工具，产生了成本高、准确率低的问题。一般来说，VS有两种重要类型:基于结构的VS (SBVS)和基于配体的VS (LBVS)。

LBVS依赖于活性配体和非活性配体的化学结构和经验数据，它利用活性配体的化学和物理化学相似性，从一组具有高生物活性的化合物中预测其他活性配体。然而，LBVS不依赖于目标蛋白的三维结构，因此，该方法是在目标结构或信息缺失的情况下实现的，获得的结构精度较低。

另一方面，SBVS已被用于通过体外或体内实验或计算建模阐明蛋白质或靶标的三维结构信息的情况。一般来说，该方法用于预测活性配体或其相关靶标之间的相互作用，以及预测参与药物靶标结合的氨基酸残基。与LBVS相比，SBVS具有较高的精度和精密度。然而，SBVS与致病蛋白数量增加及其复杂构象的问题有关。

为了使用ML进行VS，应该有一个由已知活性和非活性化合物组成的过滤训练集。这些训练数据被用来训练使用监督学习技术的模型。然后对训练好的模型进行验证，如果它足够准确，则将该模型用于新的数据集，以筛选对目标具有所需活性的化合物。在那之后，入围的化合物可以进行ADMET分析，然后在进入临床试验之前进行各种生物测定。

因此，ML有能力加速VS，使其更健壮，甚至可以减少VS中的假阳性。对接是SBVS中应用的主要原则，在SBVS中已经开发了一些基于AI和ML的评分算法，如NNScore、CScore、SVR-Score和ID-Score。同样，ML和DL方法，如RF、SVM、CNN和浅神经网络已经被构建来预测SBVS中的蛋白质配体亲和力。此外，基于人工智能的算法已被开发用于SBVS的分子动态模拟分析。另一方面，LBVS由几个步骤组成，每个步骤都会产生新的基于AI和ML的算法，以加快过程并增加可靠性。例如，一些基于ML和DL的算法已经被构建来制备有用的decoy sets，如高斯混合模型(GMMs)、isolation forests和人工神经网络(ANNs)。

QSAR模型和药物再利用

QSAR是指定量的构效关系，是使用数学模型来描述分子结构和分子的某种生物活性之间的关系。其基本假设是化合物的分子结构包含了决定其物理，化学及生物等方面的性质信息，而这些理化性质则进一步决定了该化合物的生物活性。进而，化合物的分子结构性质数据与其生物活性也应该存在某种程度上的相关。

开发数学模型的主要优势是从分子数据库中识别不同的化学结构，这些化学结构可以用作针对疾病靶标的治疗化合物。一旦选择了有前途的化合物，就要进行实验室合成和体外或体内测试。

QSAR模型大致分为两种类型，即回归模型和分类模型。高斯过程(GPs)是一种QSAR建筑回归模型，是一种稳健而有力的QSAR建模方法。GP方法可以处理大量的描述符并识别关键的描述符。近年来，两个分类模型已被证明使用GP，这是固有的GP分类方法，另一个是GP回归技术和概率单位分析的组合。此外，该方法适用于建模非线性关系，并且不需要主观确定模型参数。

除了QSAR建模之外，人工智能算法也已经在药物再利用或“药物重新定位”方法中实现。在药物设计和发现中，药物重新定位指的是对已经为一种疾病开发的药物进行研究，并将它们重新利用于其他疾病。由于涉及多种疾病的多靶点的可能性，重新利用药物可能是成功的。另一方面，来自基因组学、蛋白质组学和体内和体外药理学研究的大数据集的出现为药物重新定位提供了一个很好的途径。基于人工智能的工具和算法已在近期药物发现中为未来的研究提供了平台。

理化性质和生物活性预测

众所周知，每种化合物都与物理化学性质相关，例如溶解度、分配系数、电离度、渗透系数，这可能会妨碍化合物的药物动力学性质和药物-靶标结合效率。因此，在设计新的药物分子时，必须考虑化合物的物理化学性质。目前已有预测化合物的物理化学性质的AI得到开发。例如，为预测化合物的生物物理和生物化学性质而开发的AI的工具包括分子指纹、SMILES格式字符串、库仑矩阵和势能测量，这些工具用于DNN训练阶段，生成可行分子，从而预测其性质。

此外，药物分子的治疗活性取决于它们与受体或靶标的结合效率，因此，不能显示与药物靶标的结合亲和力的化学分子将不被认为是治疗剂。为此，预测化学分子与治疗靶标的结合亲和力对于药物发现和开发至关重要。目前已经开发了许多基于ML和DL的模型用于鉴定药物-靶亲和力，例如KronRLS、SimBoost、DeepDTA和PADME。

化合物的作用方式和毒性预测

药物毒性是指由于化合物的作用方式或代谢，化学分子对有机体或有机体的任何部分的不利影响。人工智能的扩展范围有可能预测药物分子的脱靶和靶效应，以及在化合物的合成吸引与药物开发过程相关的科学家之前对化合物进行体内安全性分析。人工智能的参与减少了药物开发时间、成本、损耗率和人力资源。对此，LimTox，admetSAR，pkCSM，Tox21，TargeTox，DeepTox，PrOCTOR等ML和DL工具已经得到了开发和应用。

目前深度学习算法已经展现出作为化合物分子展示的新方法的潜力，这使得DL方法更加适合预测化合物毒性。此外，用于毒性预测的DL算法的潜力取决于数据集的质量和数量。简而言之，应该进行更多的研究，以使基于人工智能的算法能够可靠地进行毒性预测。然而，目前基于ML的预测器仍然不适合取代生物系统，但它们足以将药物化学原理向正确的方向扩展，这减少了合成周期的数量。

分子途径和多重药理学的鉴定

AI和ML算法在药物发现和开发中的重要成果之一是预测和估计疾病网络或药物-药物相互作用或药物-靶标关系的整体拓扑和动力学。这种方法为识别特定疾病的新分子治疗靶点提供了广阔的途径。文本挖掘驱动的数据库，如DisGeNET、STITCH、STRING，分别被广泛用于确定基因-疾病关联、药物-靶标关联和分子途径。

在药物化学中，多重药理学是指在与疾病相关的药物-靶点生物网络中设计一个能够与多个靶点相互作用的单一药物分子。它适合设计一种用于治疗更复杂的疾病的可能药物，如癌症、神经退行性疾病(NDDs)、糖尿病、心力衰竭和许多其他疾病。基于ML的方法由于具有强大的挖掘能力和数据分析能力，具有分析关联分子网络的潜力。此外，ML模型生成了大量具有不同化学和拓扑特征的化学结构，通过生成所需的多药理特征的化合物，有助于多靶配体的合理设计。这样可以使得发现多靶配体的概率增加。此外，ML模型有助于识别存在不同结合区域的多目标配体。目前多种工具例如：多重药理学浏览器（PBB），基于自组织映射的药物等效关系预测(SPiDER)，Targethunter，域映射器，化学映射器，Swiss Target Prediction已得到开发并应用于这一领域。

此外，药物开发中的AI打开了通过基因组学信息、生物化学特征和目标规格来识别治疗人类疾病的分子途径或分子目标的大门。例如OpenTargets是一个基于ML的免费工具，能够以超过71%的准确率对潜在的治疗药物靶点进行优先排序。

总结

在药物发现过程中，ML和DL的新发展带来了降低成本、提高效率和节省时间的巨大机会。该领域的创业公司数量也在不断增加，到2020年6月达到230家，我国目前至少有60多家关于AI的初创公司逐步启航，为我国的药物开发提供了新的道路。相信在不久将来会对制药行业产生重大影响。

省市代理商名录

（7941家）

全国总代理商名录

（2106家）

代理商留言

（312776条）

生产厂家名录

（21379家）

人工智能在药物开发过程中的应用

行业资讯

相关资讯

相关文章