专题(一)介绍转录因子与靶基因启动子、专题(二)介绍蛋白质与蛋白质的互作预测。本次介绍蛋白质与RNA互作。先上应用实操总结(同专题一/二总结类似,看过可忽略直接进入实操正文):
优点:利用AlphaFold3预测蛋白与靶RNA互作,目前大概是生信预测类中最准确的方法。充分使用该工具,make it(互作机制研究) easier。建议结合其他生信分析网站,如catRAPID、RBPDB等网站(干实验数据),或充分整合自己项目的RIP-Seq互作组数据(湿实验数据),进行初步分析,然后再用AlphaFold3进行预测验证,将会提高互作机制研究的成功率。
缺点:AlphaFold3毕竟是基于序列和AI大模型的建模预测,本身仅供参考。另外,真实世界的分子互作,有很多影响因素,比如序列修饰、互作受环境条件、遗传背景等,可供AlphaFold3训练的语料非常有限。因此,基于AlphaFold3的互作预测,需要小心求证。另外,AlphaFold3使用,需要Google和Gmail邮箱才能顺利使用,会限制很多科研工作者的正常使用。
策略:我们团队紧跟互作机制研究热点,可以助力项目研究,使用AlphaFold3工具进行预测分析。另外,我们团队长期聚焦互作机制研究的湿实验技术服务,如RIP-Seq互作组检测、RIP-qPCR互作蛋白验证、修饰互作验证、环境条件互作验证、互作调控机制探索等实验,协助您轻松突破互作机制研究,让科研成果更上一层楼。
实操正文如下:蛋白质与RNA互作是指蛋白质与RNA分子之间的相互作用。这种互作在生物体内广泛存在,参与基因表达调控、RNA加工和转运等多种生命过程。蛋白质通过与RNA结合,影响RNA的结构和功能,进而调控生物体的生理和病理过程。
那么如何用AlphaFold3预测蛋白质与RNA互作呢?
第一步,通过Uniport网站获取候选基因的蛋白质序列(以MYC为例)。
![](http://tiebapic.baidu.com/forum/w%3D580/sign=fb42df8c9758ccbf1bbcb53229d9bcd4/a5839f3eb13533faca17e510eed3fd1f40345bc2.jpg?tbpicau=2024-08-06-05_3ab510f6a52495c338c277ff22ae69ec)
第二步,通过NCBI获取RNA序列(以lncRNA H19为例)。![](http://tiebapic.baidu.com/forum/w%3D580/sign=d51e92568abf6c81f7372ce08c3fb1d7/0065923533fa828bef82ebddbb1f4134960a5ac2.jpg?tbpicau=2024-08-06-05_c9024d320a051e439f450750da249787)
第三步,访问 AlphaFold Server和输入数据进行预测。![](http://tiebapic.baidu.com/forum/w%3D580/sign=9bc48fb12a81800a6ee58906813433d6/0d6e10fa828ba61ee24fbe110734970a314e59c2.jpg?tbpicau=2024-08-06-05_4be29c94bf39ee538fecf1e5858aaa55)
登录谷歌邮箱账号,点击Add entity框就可以添加蛋白质、DNA、RNA、配体和离子(金属离子)。![](http://tiebapic.baidu.com/forum/w%3D580/sign=87232f8fc60a19d8cb03840d03fb82c9/8fa1a18ba61ea8d3b683023ad10a304e241f58c2.jpg?tbpicau=2024-08-06-05_22436821e77c4ad46f293c7b575596ca)
将MYC蛋白质和H19的核酸序列序列输入,点击”Continue and preview job”。![](http://tiebapic.baidu.com/forum/w%3D580/sign=201dc3045fd8bc3ec60806c2b28aa6c8/3ed0851ea8d3fd1f0da8d404764e251f94ca5fc2.jpg?tbpicau=2024-08-06-05_10341c71af7ca2fe85be182451d316ee)
![](http://tiebapic.baidu.com/forum/w%3D580/sign=cd965ad6fa3eb13544c7b7b3961fa8cb/1a458bd3fd1f4134da967340631f95cad0c85ec2.jpg?tbpicau=2024-08-06-05_ff52738dbc36a7ce626568a4404d5297)
点击“Confirm and submit job”即可提交作业,因H19核酸序列较长,本次运行约30 分钟左右。![](http://tiebapic.baidu.com/forum/w%3D580/sign=5744ff30f73533faf5b6932698d2fdca/1488de1f4134970a7ed26611d3cad1c8a6865dc2.jpg?tbpicau=2024-08-06-05_be97b0c836d635e97c0836426af4a85c)
第四步,结果。MYC和H19互作预测结果。点击“Download”可下载数据。颜色越蓝表示预测的置信度越高,越橙则越低。
![](http://tiebapic.baidu.com/forum/w%3D580/sign=f3a2f23b75fa828bd1239debcd1e41cd/41446234970a304e6a83d6c497c8a786c8175cc2.jpg?tbpicau=2024-08-06-05_df07e1d5ab66c16207cb9a6bdd4f1013)
注:pLDDT:基于 0-100 量表的每个原子置信度估计,其中较高的值表示置信度较高。pTM 和 ipTM 分数:预测模板建模(pTM)分数和界面预测模板建模(ipTM)分数均来自称为模板建模(TM)分数的度量。pTM 分数高于 0.5 表示整体预测的复合物折叠可能与真实结构相似。ipTM 衡量复合物内亚基相对位置的预测准确性。高于 0.8 的值表示置信度高的高质量预测,而低于 0.6 的值则表明可能是失败的预测。ipTM 分数在 0.6 到 0.8 之间为灰色区域,预测可能正确或不正确。对于小结构或短链,TM 分数非常严格,因此当涉及少于 20 个标记时,pTM 分数赋值低于 0.05;在这些情况下,PAE 或 pLDDT 可能更能指示预测质量。
这些cif文件可以用PyMol类似的软件打开,然后进行后续分析。![](http://tiebapic.baidu.com/forum/w%3D580/sign=e1a970f4c48ba61edfeec827713597cc/fd6fb40a304e251fc55692c6e186c9177e3e53c2.jpg?tbpicau=2024-08-06-05_6221ddcccc83e001377592bee44fff70)
AlphaFold3给蛋白质与RNA互作预测提供了新的方法和工具。
如遇AlphaFold3实操问题,欢迎评论留言进行交流探讨!
优点:利用AlphaFold3预测蛋白与靶RNA互作,目前大概是生信预测类中最准确的方法。充分使用该工具,make it(互作机制研究) easier。建议结合其他生信分析网站,如catRAPID、RBPDB等网站(干实验数据),或充分整合自己项目的RIP-Seq互作组数据(湿实验数据),进行初步分析,然后再用AlphaFold3进行预测验证,将会提高互作机制研究的成功率。
缺点:AlphaFold3毕竟是基于序列和AI大模型的建模预测,本身仅供参考。另外,真实世界的分子互作,有很多影响因素,比如序列修饰、互作受环境条件、遗传背景等,可供AlphaFold3训练的语料非常有限。因此,基于AlphaFold3的互作预测,需要小心求证。另外,AlphaFold3使用,需要Google和Gmail邮箱才能顺利使用,会限制很多科研工作者的正常使用。
策略:我们团队紧跟互作机制研究热点,可以助力项目研究,使用AlphaFold3工具进行预测分析。另外,我们团队长期聚焦互作机制研究的湿实验技术服务,如RIP-Seq互作组检测、RIP-qPCR互作蛋白验证、修饰互作验证、环境条件互作验证、互作调控机制探索等实验,协助您轻松突破互作机制研究,让科研成果更上一层楼。
实操正文如下:蛋白质与RNA互作是指蛋白质与RNA分子之间的相互作用。这种互作在生物体内广泛存在,参与基因表达调控、RNA加工和转运等多种生命过程。蛋白质通过与RNA结合,影响RNA的结构和功能,进而调控生物体的生理和病理过程。
那么如何用AlphaFold3预测蛋白质与RNA互作呢?
第一步,通过Uniport网站获取候选基因的蛋白质序列(以MYC为例)。
![](http://tiebapic.baidu.com/forum/w%3D580/sign=9695f0d0da82d158bb8259b9b00b19d5/3c513ad8bc3eb1357466c185e01ea8d3fc1f44c2.jpg?tbpicau=2024-08-06-05_97dda9fc6a2b31de5a2afa8c7c5cdabd)
![](http://tiebapic.baidu.com/forum/w%3D580/sign=fb42df8c9758ccbf1bbcb53229d9bcd4/a5839f3eb13533faca17e510eed3fd1f40345bc2.jpg?tbpicau=2024-08-06-05_3ab510f6a52495c338c277ff22ae69ec)
第二步,通过NCBI获取RNA序列(以lncRNA H19为例)。
![](http://tiebapic.baidu.com/forum/w%3D580/sign=d51e92568abf6c81f7372ce08c3fb1d7/0065923533fa828bef82ebddbb1f4134960a5ac2.jpg?tbpicau=2024-08-06-05_c9024d320a051e439f450750da249787)
第三步,访问 AlphaFold Server和输入数据进行预测。
![](http://tiebapic.baidu.com/forum/w%3D580/sign=9bc48fb12a81800a6ee58906813433d6/0d6e10fa828ba61ee24fbe110734970a314e59c2.jpg?tbpicau=2024-08-06-05_4be29c94bf39ee538fecf1e5858aaa55)
登录谷歌邮箱账号,点击Add entity框就可以添加蛋白质、DNA、RNA、配体和离子(金属离子)。
![](http://tiebapic.baidu.com/forum/w%3D580/sign=87232f8fc60a19d8cb03840d03fb82c9/8fa1a18ba61ea8d3b683023ad10a304e241f58c2.jpg?tbpicau=2024-08-06-05_22436821e77c4ad46f293c7b575596ca)
将MYC蛋白质和H19的核酸序列序列输入,点击”Continue and preview job”。
![](http://tiebapic.baidu.com/forum/w%3D580/sign=201dc3045fd8bc3ec60806c2b28aa6c8/3ed0851ea8d3fd1f0da8d404764e251f94ca5fc2.jpg?tbpicau=2024-08-06-05_10341c71af7ca2fe85be182451d316ee)
![](http://tiebapic.baidu.com/forum/w%3D580/sign=cd965ad6fa3eb13544c7b7b3961fa8cb/1a458bd3fd1f4134da967340631f95cad0c85ec2.jpg?tbpicau=2024-08-06-05_ff52738dbc36a7ce626568a4404d5297)
点击“Confirm and submit job”即可提交作业,因H19核酸序列较长,本次运行约30 分钟左右。
![](http://tiebapic.baidu.com/forum/w%3D580/sign=5744ff30f73533faf5b6932698d2fdca/1488de1f4134970a7ed26611d3cad1c8a6865dc2.jpg?tbpicau=2024-08-06-05_be97b0c836d635e97c0836426af4a85c)
第四步,结果。MYC和H19互作预测结果。点击“Download”可下载数据。颜色越蓝表示预测的置信度越高,越橙则越低。
![](http://tiebapic.baidu.com/forum/w%3D580/sign=f3a2f23b75fa828bd1239debcd1e41cd/41446234970a304e6a83d6c497c8a786c8175cc2.jpg?tbpicau=2024-08-06-05_df07e1d5ab66c16207cb9a6bdd4f1013)
注:pLDDT:基于 0-100 量表的每个原子置信度估计,其中较高的值表示置信度较高。pTM 和 ipTM 分数:预测模板建模(pTM)分数和界面预测模板建模(ipTM)分数均来自称为模板建模(TM)分数的度量。pTM 分数高于 0.5 表示整体预测的复合物折叠可能与真实结构相似。ipTM 衡量复合物内亚基相对位置的预测准确性。高于 0.8 的值表示置信度高的高质量预测,而低于 0.6 的值则表明可能是失败的预测。ipTM 分数在 0.6 到 0.8 之间为灰色区域,预测可能正确或不正确。对于小结构或短链,TM 分数非常严格,因此当涉及少于 20 个标记时,pTM 分数赋值低于 0.05;在这些情况下,PAE 或 pLDDT 可能更能指示预测质量。
这些cif文件可以用PyMol类似的软件打开,然后进行后续分析。
![](http://tiebapic.baidu.com/forum/w%3D580/sign=e1a970f4c48ba61edfeec827713597cc/fd6fb40a304e251fc55692c6e186c9177e3e53c2.jpg?tbpicau=2024-08-06-05_6221ddcccc83e001377592bee44fff70)
AlphaFold3给蛋白质与RNA互作预测提供了新的方法和工具。
如遇AlphaFold3实操问题,欢迎评论留言进行交流探讨!