本文所选择的63种Rho激酶抑制剂的结构和活性值是从文献[39-41]的QSAR研究中选择出来的。
2.4.2 建立训练集(training set),测试集(test set)及结构的优化
数据集被分别随机分成训练集和测试集,测试集包括化合物27,40,49,60和61,所有其他化合物被列入到训练集。
利用ChemDraw分别将63个分子结构图表示出来,再导入Chem3D软件中,与表中所给结构图进行对比看是否有误,确认无误后另存为pdb格式文件。
分子力场的选择与优化方法的选择:本文选择的是利用Tripos力场进行能量最小化计算。
打开SYBYL-X软件,从分子数据库中读入初始结构。
选择所要进行优化的分子,对分子进行命名。
命名完成后确定力场并确定电荷类型,进行最小化计算,参数设定如下:在Minimize对话框中,点击Minimize Details,将最大重复次数(Max.Iterations)增加到1000,把Gradient减低到0.005,再将Color Option设定为Force,利用Tripos力场进行能量最小化计算的参数设定就完成了。
点击OK,就完成了一个分子的优化,然后把优化好的分子存成Mol2格式文件以便后面的分析。
接下来对剩下所有分子进行同样的操作,共得到63个优化好的分子文件。
2.4.3 建立数据库
文件分为两类,化合物27,40,49,60和61为测试集,剩下的为训练集。训练集化合物的Mol2文件保存在training.mdb,测试集化合物的Mol2文件在test.mdb。
2.4.4 模型构建的准备工作及分子叠合
在SYBYL-X软件中读取训练集数据库文件training.mdb,并在数据库的第一列导入活性值即pIC50值。
接下来进行分子的叠合。分子叠合的方法有多种[42-45]:
1)化合物具有公共的骨架,就以其公共骨架进行构象叠合;
2)采用3D药效团模型GALAHAD进行叠合构象:
它可以快速生成高质量的药效团和分子叠合结果。对结合于同一位点的一系列分子,GALAHAD可自动生成药效团模型和分子叠合结果。这一方法无需预先知道药效团元素,限制条件和分子叠合,这使它成为探索新靶标和新作用模式的理想工具。GALAHAD采用成熟的新遗传算法(GA),它把分子定义为核心结构和一系列二面角。为了克服现有药效团工具的局限性,GALAHAD的遗传算法在真实的数据集上开发出来的。
分子叠加是CoMFA和CoMSIA计算的关键步骤,叠加的好坏直接影响着最终模型的合理性及预测能力的强弱。分子叠合的依据是所分析的配体分子以相同或相似作用方式与受体结合部位相互作用,因而必须确保药效团在空间的分布具有相同性。
通过不断地尝试,我最终选定公共骨架叠合法做为本次试验的叠合方法。叠合前可以利用Distill Rigid来寻找共同骨架。本文选取活性最高的36号分子为模板,以该化合物的刚性主体部分为分子叠加的公共结构,应用Align Database模块将训练集中所有化合物的公共部分与模板分子的基本骨架相重叠。采用此方法叠合可保证每个分子力场的取向具有一致性。
2.4.5 CoMFA模型的建立
选中数据库表格第二列,添加CoMFA列。操作步骤如图2-1
图2-1添加CoMFA列 图2-2 CoMFA回归分析参数
接下来进行回归分析,参数设置如图2-2,最大主成分数Components的数值由默认值改为20,如果结果不好,可增大。采用抽一法(Leave-One-Out)[23]对训练集化合物进行交叉验证,运算结束后查看Sybyl命令框。
在Sybyl命令框中找出最佳主成分数,接着验证系数q2数值来进一步分析模型的拟合能力及其他性质。将Components改为最佳主成分数,Validation改为No Validation。进行回归运算后可以得出验证q2的结果。将结果保存为PLS分析文件。 Rho激酶抑制剂三维定量构效关系的研究(6):http://www.751com.cn/huaxue/lunwen_4342.html