宋河顺手开了一个新程序,按伊雷马实验室数据,同步复现药物预测流程。
别人做的成果,他不敢全盘接收,还是亲自上手验证一下稳妥!
首先是经典的ddis预测,即药物-药物相互作用,探讨病人短时间服用多种药物后,产生的复合效应。pδ
当初在京海大学实验室,吕承恩讲过中药预测五原则,相反为制、相畏为制、相喜为制、相资为制、相恶为制,也是药物和药物相互作用的原理,只不过现代的ddis预测深入到分子层面了。
之前宋河看相关论文时,见过基于图卷积神经网络的ddis预测,以及基于平衡理论的预测。
前者太片面,只考虑邻接矩阵元素。而后者则太绝对,总结起来就是“朋友的朋友是朋友”、“朋友的朋友是敌人”,但实际的药物研发中,关系远比平衡理论要错综复杂。
电脑屏幕上,伊雷马实验室居然两种方法都弃之不用,赫然使用了新方法进行ddis预测!
宋河研读许久,基本明白了思路……大数据库推导!
伊雷马实验室尝试将海量化合物进行拓展,梳理出亲戚关系,画出一个壮观的树状图,每个枝丫都连接一种相似的化合物。
之后,再通过已经确定的化合物药用特性,大胆猜测未知化合物的药效。
这感觉好比,知道丈夫是生物学家,知道妻子是短跑运动员,于是便猜测这对夫妻将来的孙子能够……一边短跑冲刺一边手拿显微镜观察细菌……
本质上还是瞎猜药物,但在瞎猜中多了一丝丝牵强附会的推理。
“好难!”宋河吐槽。
他在帖子里寻找伊雷马实验室用的大数据库。
找了半天……没找到?
“怪不得呢!原来公布的只是边缘数据,最核心的没公布啊!”宋河摇头失笑。
没办法,他只得尝试自己搜集数据库。
他先在网上寻找,用过相似工作方式的科研团队。
花了许久,总共找到两个。
一个是千度公司合作的研发团队,通过大量食管癌病人的数据,寻找到22个显著突变基因,随后预测关联出可行的药物信息。
一个是sk癌症中心,开发了一个体细胞突变相关的知识库,收录了大量靶向药。
“都是做癌症的数据库,