AlphaFold技术揭秘----DeepMind如何破解蛋白质折叠预测难题
共 1235字,需浏览 3分钟
·
2020-12-19 13:30
【GiantPandaCV导语】视频内容主要是关于 DeepMind AlphaFold1 论文的解读,还有根据有限的资料分析了下 AlphaFold2 系统。
视频太长不看版:
视频内容主要是是关于 AlphaFold1 系统的论文解读,还有根据有限的资料猜想了下 AlphaFold2 系统的组成部分,因为 AlphaFold2 的论文目前还没发表,所以目前没办法解读。
视频开篇简要介绍了下蛋白质和氨基酸的相关的知识,还有目前预测蛋白质结构的困难。
蛋白质的功能主要由其3d结构决定,而与组成其成分的氨基酸关系不大。
目前已有的蛋白质结构推断方法是比如 X射线晶体衍射技术,但是这个过程极其复杂而且价格也很昂贵。
所以如果能通过计算机模型,输入氨基酸序列或者DNA序列就能预测出蛋白质的三维结构,那么不仅剩钱也能加速整个研究的进程。
AlphaFold1
先看下两张系统示意图:
系统分为两个阶段,上两个结构示意图中,黄色,绿色和红色的部分表示第一阶段,蓝色表示第二阶段。
第一阶段:
就是一个深度卷积神经网络,主要由残差块组成。输入是关于这个氨基酸链的特征,包含很多种类的特征。输出则包括,氨基酸链中每个氨基酸与其他位置氨基酸的距离预测矩阵,还有扭转的角度等等,但是最重要的是这个距离预测矩阵。
本质上第一阶段要解决的就是一个 image to image 的问题
第二阶段:
首先构建了一个可微分蛋白质几何模型,然后把这个模型的输出与第一阶段网络的预测结果计算loss。再通过单纯的梯度下降回传,修正几何模型中蛋白质的扭转角度,得到新的预测结果,再计算loss,再回传,反复迭代直到稳定之后,就得到了蛋白质的三维结构。
AlphaFold2
根据DeepMind博客的内容, 猜测 AlphaFold2 应该是一个 end2end 的系统,而且卷积网络应该是被 transformer 替代了。
相关资料:
[1]https://deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology
[2]https://towardsdatascience.com/alphafold-2-explained-a-semi-deep-dive-fa7618c1a7f6
[3]https://github.com/deepmind/deepmind-research/tree/master/alphafold_casp13
[4]https://www.nature.com/articles/s41586-019-1923-7%20