第一章引言
1.1药物的ADME/T性质研究概况
药物(drug)是指用于治疗、预防和诊断疾病的化学物质,是人类长期以来与疾病做斗争的最主要武器。古代的药物以天然产物特别是植物来源为主,至今从天然产物或天然产物衍生物中发现药物仍是药物研究及开发中的主要途径之一。化学合成药物最早出现于20世纪20年代,经过几十年的快速发展,进入了现代药物分子设计时代。尤其是自20世纪90年代以来,随着相关学科的发展,药物设计进入了合理药物设计(rational drug design)时代,大大提高了药物研发的效率。几个重要的环节包括:
(1)先导化合物的发现所谓先导化合物(leading compound),是指通过各种途径和方法得到的具有某种生物活性或药理活性的化合物。一般来说,先导化合物主要通过对天然活性物质的挖掘、对现有药物不良作用的改进以及对药物合成中间体的蹄选等途径来寻找。
(2)先导化合物的优化由于发现的先导化合物可能具有作用强度或特异性不高、药代动力性质不适宜、毒副作用较强或是化学或代谢上不稳定等缺陷,先导化合物一般不能直接成为药物。因此有必要对先导化合物理化学及生物化学性质进行优化。优化后再进行体内外活性评价,循环反馈,最终获得优良的化合物——候选药物(drug candidate )。
(3)临床前试验由制药公司进行的实验室和动物研究,以观察化合物针对目标疾病的生物活性,同时对化合物进行安全性评估。这些试验大概需要3.5年的时间。
(4)临床研究I期临床,研究药物的安全性,同时确定药物在体内的吸收、分布、代谢和排泄(absorption, distribution, metabolism, elimination,ADME)以及药物的作用持续时间等;11期临床,评价药物的疗效;m期临床,确定疗效和不良反应。
尽管制药公司用于药物研发的投资逐年上升,FDA批准的新化合物实体药物(new chemical entities, NCE)的数量却呈现下降的趋势[3]。2010年FDA批准的新分子实体(New Molecular Entities, NMEs)仅有15个,创下历史最低记录。可以说药物设计和开发正面临着高投入低产出的困境。
据统计,药物研发过程中只有不到5%的先导化合物可以通过初步药效学的蹄选进入临床前研究,其中只有约1%可以获得FDA批准成功上市。造成药物研发失败率如此之高的主要因素包括ADME性质不佳、药效不理想、副作用过强、毒性过大以及商业因素等,其中ADME/T和副作用因素所占比例超过60%。此外,艮|]便是经FDA批准上市的药物也会在临床使用中面临诸多问题,其中药物毒副作用和抗药性是最严重也是最难以避免的。许多药物在上市后因发现较大的毒副作用(甚至致死)而不得不撤出市场。可以说,不理想的ADME/T性质是制约药物研究与幵发成功的关键因素。
1.2生物相关谱的提出
生物相关性(biological relevance,或 biologically relevant)这一概念曾在多篇文献中被提及,但是这些文献均没有给出“biological relevance”的确切含义和表征算法。我们定义了生物相关性(Biological Relevance, BR)的概念_,按照我们的定义,生物相关性是对一个分子来源于生物合成的可能性及其对生物体生存重要性的度量。我们从KEGG配体库中依据分子多样性选择出2000个化合物构建了生物相关代表性化合物数据库(Bio-relevance Representative Compounds Database,BRCD),利用分子相似性计算,实现了生物相关性指标的表征。
同其它化学信息学指标相比,生物相关性指标的计算直接从生物相关分子(BRCD)出发,不需要现有药物的信息和随机化合物信息(负样本),具有更广泛的普适性。指标算法对称,结果归一,可以应用于候选化合物库的设计与优化、虚拟蹄选和高通量蹄选结果的处理、生物相关分子的定向合成等领域,对药物设计与开发具有重要的指导意义。
研究结果表明,生物相关性指标可以为药物发现和设计提供有益的理论指导。首先,生物相关性指标可以区分各类不同来源的化合物数据库,天然产物(DNP)、临床药物(CMC)、合成化合物(ACD)、生物活性化合物(MDDR)的生物相关性依次降低,这一结果和这些数据库中化合物的来源本质是一致的,证明了生物相关性指标的有效性;其次,对于相同的活性,CMC化合物的平均生物相关性大于MDDR中具有相同活性的化合物;再次,MDDR中不同幵发阶段的候选药物,从生物活性测试、临床前研究、临床一期、二期、三期到上市阶段的化合物,其平均生物相关性逐渐升高,这一结果表明具有较高生物相关性的化合物具有更高的几率通过药物开发的流程。
第二章理论基础与研究方法简介…………..9
2.1化学信息学研究概况………………..9
2.2基于支持向量机方法的预测模型………………10
2.2.1支持向量机简介………………10
2.2.2核函数及其参数………………11
2.2.3模型预测性能的评价方法………………12
2.2.4模型的验证方法………………13
2.3本文用到的软件与数据库简介………………14
第三章生物相关谱在药物ADME性质预测中的初步应用………………17
3.1药物人体小肠吸收活性预测………………17
3.2药物透过血脑屏障预测………………18
3.3药物亚细胞分布预测………………20
3.3.1分布在细胞核、细胞周质药物数据………………21
3.3.2结果与讨论………………21
第四章生物相关谱用于化合物的急性毒性预测………………23
4.1鼠经肌肉给药途径药物毒性预测………………23
4.2药物的兔经静脉注射途径毒性预测………………27
4.2.1数据收集及处理………………27
4.2.2结果与讨论………………28
第五章生物相关谱在化合物成药性预测中的应用………………33
5.1上市药物与合成非药物化合物判别分析模型………………33
5.2成功药物与研究失败药物判别分析模型………………35
5.2.1数据收集与处理………………35
5.2.2结果与分析………………37
第六章论文总结………………39
参考文献………………41
第六章论文总结
新药研究与开发面临着周期长、投资费用大和失败率高的困境,不理想的ADME性质和过大的毒性是造成药物幵发阶段高失败率的主要原因之一。因而,早期对候选药物的ADME/T性质进行研究和综合评价是解决药物研发地成功率的一个重要思路。使用试验方法研究化合物的ADME/T性质,需要耗费大量时间、金钱和人力,随着化学信息学和计算化学的快速发展,以及ADME/T性质试验数据的大量积累,使用计算机模拟方法,尤其是机器学习方法,成为预测药物ADME/T性质的一种有效工具。
本论文首先根据KEGG数据库的更新,对生物相关性代表数据库进行了升级,改进了分子相似性算法,实现了生物相关谱的表征。然后利用SVM方法构建了化合物的人体小肠吸收、血脑屏障透过、亚细胞舉位分布、急性毒性和成药性预测模型,研究生物相关谱在化合物ADME/T性质预测中的应用。
第一,以生物相关谱作为特征向量表征分子结构,使用SVM判别分析方法分别构建了药物人体小肠吸收、血脑屏障透过和亚细胞分布的预测模型。经过评估和验证,所有模型均表现出了良好的预测能力和推广能力。表明生物相关谱可以做为化合物ADME/T性质预测的一项重要指标。
第二,使用SVM回归分析方法,以生物相关谱为自变量,依据ToxicFinder数据库中化合物的两个不同体系的毒性实验数据,构建了化合物急性毒性预测模型。经过对模型预测结果的统计分析,两个模型都表现出了良好的预测能力,显示了化合物的急性毒性与生物相关谱之间的高度相关性,也体现了生物相关谱在化合物急性毒性预测中的潜在作用。
最后,使用生物相关谱表征分子结构,以成功上市的药物为正样本,分别以非药物合成化合物和研究失败的药物做为负样本,建立了两个侧重点不同SVM判别模型。模型的评估和验证结果表明,生物相关谱在化合物成药性预测中取得了明显的效果。
综合以上研究,可以初步认定生物相关谱应用于ADME/T性质的预测将有助于防止ADME/T特性较差的化合物进入临床前实验或者临床阶段,减少以上实验的巨额开支。同时,可以预见,通过对不同活性化合物的生物相关谱分析,可以建立药物活性的预测模型,加快虚拟蹄选发现先导化合物的速度。
当然,做为一种全新的指标和方法,生物相关谱仍然存在一些不足。第一,KEGG的ligand数据库收录了目前己知的大部分内源代谢物信息,但并不能代表所有生物全部的内源代谢物,而我们计算生物相关谱的基础就是从KEGG中提取的2000个小分子构成的生物相关性代表数据库,所以KEGG的不足使生物相关谱受到限制。对于这一问题,我们的解决方法是,随着KEGG的更新,对生物相关性代表数据库进行升级;第二,生物相关谱的理论基础是分子相似性理论,目前分子相似性的计算不够成熟,方法繁多,偏重点各异。我们选用旳是目前应用比较广泛的Tanimoto算法,该算法最大的问题是完全以分子的二维结构为基础进行计算,没有考虑分子的立体构象。对于这一问题,我们课题组正在积极改进,开发基于三维结构的分子相似性算法,提高分子相似性的计算精度。
相信经过不断升级和改进,生物相关谱将成为一种R益成熟的化合物评价方法,在创新药物研究与开发中发挥重要的指导作用。
参考文献
[1]David J. Newman. Natural products as leads to potential drugs: an old process or the new hopefor drug discovery [J]. J. Med. Chem. 2008, 51:2589-2599
[2]A F. Nasonv. Computational methods and software in computer-aided combinatorial librarydesign[J]. Russian Journal of General Chemistry, 2010,80(12):2541-2571
[3]Asher Mullard. 2011 FDA drug approvals[J]. Nature Rehttp://www.1daixie.com/dxyxlw/views Drug Discovery.2012, 11:91-94
[4]Derex S. Tan. Diversity-oriented synthesis: exploring the intersections between chemistry andbiology[J]. Nature Chemical Biology. 2005, 1: 74-84
[5]Jianling Wang. Comprehensive assessment of ADME/T risks in drug discovery[J]. CurrentPharmaceutical Design. 2009, 15(19):2195-2219
[6]Tony Kennedy. Managing the drug discovery/development interface[J]. Drug Disc. Today. 1997,2:436-444
[7]Han van de Waterbeemd, Eric GifFord. ADME/T in silico modelling: towards predictionparadise?[J]. Nature Reviews Drug Discovery, 2003,2:192-204
[8]Christopher A. Lipinski, Franco Lombardo and Beryl W. Dominy,et al. Experimental andcomputational approaches to estimate solubility and permeability in drug discovery anddevelopment settings[J]. Advanced Drug Delivery Reviews. 2001, 46(1-3):3-26
[9]Aur'elien Monge, Alban Arrault and Christophe Marot, et al. Managing, profiling and analyzing alibrary of 2.6 million compounds gathered from 32 chemical providers[J]. Molecular Diversity.2006,10(3):389-403
[10]Andrew C. Good, Tudor I. Oprea. Optimization of CAMD techniques 3. Virtual screeningenrichment studies: a help or hindrance in tool seIection?[J]. J Comput AidedMol Des. 2008,22(3-4):169-178