。随着极其快速准确的DNA测序技术的出现,基因数据越来越多,但其中大部分仍然需要解释。为了理解这些数据,研究人员使用基因中的DNA序列来检测共同进化的基因对。这些都是成对的基因,不能改变其中的一个基因而没有相应的改变来维持第一个基因的功能。
在华盛顿大学医学院和哈佛大学的一个合作项目中,科学家通过在对齐的蛋白质序列的一些残基中搜索共同进化,发现了蛋白质对的相互作用。
细胞中成千上万的蛋白质需要在物理和化学水平上相互作用才能发挥作用。例如,一些蛋白质必须聚集在一起才能开始DNA复制,而其他蛋白质则形成分子组装体来产生类似肌肉的纤维。但是,相互作用的蛋白质的身份通常是未知的,确定蛋白质的配对需要花费大量的时间和金钱。
相反,共同进化可以帮助找到合适的蛋白质来形成夫妇。在这一现象中,两个基因出现了互补的变化,这表明它们之间有密切的关系。共同进化的一个例子是,当基因发生突变时,蛋白质产物的形状就会改变。为了保证改变后的蛋白质仍能与配对中第二个基因产生的蛋白质相互作用,后一个基因也要进行相应的改变。这种变化已经在测序的基因组中发现。
该论文的第一作者钱聪说:“共同进化对于理解某些蛋白质如何相互作用是有用的,但我们现在可以将它用作发现的工具。”该团队研究了大肠杆菌的4000多个基因,并使用定制的统计工具将它们与其他细菌的40000多个DNA序列进行了比较。这有助于他们检测4000个基因中的每一个是否共同进化。他们比较了540万对蛋白质。
进行了几轮比较,以确定哪些配对具有最高的共同进化机会。经过筛选,他们预测了1600多个蛋白质对的相互作用。其中有680多个是非常出乎意料的。然后,研究小组将他们的结果与使用已建立的蛋白质对相互作用金标准集的相同方法获得的结果进行了比较。
最后一步证实了协同进化方法在准确性上超越了以前的任何筛选技术。这些技术包括基于蛋白质组的质谱和双杂交筛选。对于在代谢途径中相互作用的蛋白质对,发现了最强的共同进化,而对于那些参与基因数据处理的蛋白质对,发现了最强的共同进化。
事实上,其中一些相互作用是第一次被确定,包括一些可以提高我们对生物反应的理解。例如,蛋白质-抗毒素对可能有助于研究人员理解为什么某些类型的大肠杆菌是其环境中的优势菌群。参与代谢途径的PSstB蛋白也被认为在蛋白质的合成和体内矿物质的通过中发挥作用。
他们用结核分枝杆菌中的390万对蛋白质重复了他们的方法,结核分枝杆菌与大肠杆菌密切相关。他们能够检测到900多种蛋白质相互作用,其中95%是新的。其中至少有70个可能是毒力相关蛋白。这些发现有助于开发治疗这种常见致命疾病的新方法。