案例应用丨解析FOXP2蛋白的寡聚化和DNA结合过程中的热力学和实时结合动力学

发布日期:2025-08-14


蛋白和蛋白以及蛋白与底物之间的相互作用,对蛋白的功能至关重要。而这些相互作用常受到一些较难发现的因素影响。因此,一种生物化学和生物物理学相结合的方法(其基于电驱动的DNA生物芯片和单分子质量分析,)用于对一种转录因子,叉头状蛋白P2(FOXP2)的DNA结合和蛋白寡聚化能力从蛋白性能的不同方面进行分析鉴定。FOXP2蛋白包含核酸结合和蛋白寡聚结构域,例如C2H2-锌指域和一个亮氨酸拉链域,该结构域的作用目前仍旧不清楚。我们发现亮氨酸拉链域通过卷曲螺旋-卷曲的结构形式介导FOXP2的二聚化,同时辅助蛋白和DNA的结合。当锌指域的卷曲-卷曲结构完整时,该结构域有助于蛋白二聚化,但该结构域不涉及DNA的结合。叉头状结构域是驱动蛋白和DNA结合的主要结构。我们的研究发现有助于理解FOXP2蛋白转录活性调控机制。




叉头状转录因子P2(FOXP2)在哺乳动物中央神经系统的基因表达调节方面发挥重要的作用。在胚胎发育过程中,人类的FOXP2蛋白表达在各种组织,例如大脑,肺,小肠和心脏。FOXP2涉及上千基因的转录调节,其活性的失调和人类癌症发生发展相关。人类的FOXP2尤其引人关注,因为它与一种可遗传的言语和语言障碍存在关联。位于FOXP2叉头状结构域的一个R553H的无义突变破坏了该因子和DNA结合的能力,严重的损伤了人类大脑的正常功能。


含有714个氨基酸的人FOXP2蛋白由多个结构域和基序组成,该特征可以从其一级结构中看出。除了叉头状结构域,蛋白还包括一个富含谷氨酰胺的区域,一个锌指域和一个亮氨酸拉链结构域。人FOXP2蛋白的富含谷氨酰胺的结构域包含40个连续的谷氨酰胺序列,是人类蛋白质组中最长的天然发生的多聚谷氨酰胺序列。多聚谷氨酰胺序列可以形成a-螺旋结构,该结构通过形成卷曲螺旋介导蛋白和蛋白的相互作用。


高度保守的叉头状结构域,位于人类FOXP2蛋白的C端,能够识别出含7个碱基的核酸保守序列结合位点。叉头状结构域也有能力介导同源蛋白和蛋白的相互作用。在叉头状的晶体结构中显示该结构经历了重排,导致叉头二聚物结构域的交换。这种结构域的交换似乎是FOXP2蛋白及其同源蛋白FOXP1,FOXP3和FOXP4的适应性结构特征,用以介导DNA成环或内部染色体的相互作用。


人类FOXP2蛋白的锌指基序为含C2H2的经典基序,是人类蛋白质组中最常见的蛋白基序。C2H2锌指基序也介导了同源蛋白和蛋白的互作。与大多数锌指蛋白不同,人的FOXP2仅包含单个的C2H2锌指序列,其保守区域为C-X4-C-X12-H-X4-H,X代表任何氨基酸。人FOXP2中的锌指基序是否涉及DNA结合和/或蛋白互作,仍旧不清楚:在酵母双杂交系统中,删除该序列并不影响蛋白的转录抑制功能。


FOXP2蛋白的亮氨酸拉链结构域有助于蛋白和DNA的结合,促进了蛋白同源和与FOXP1,FOXP2及FOXP4的异源相互作用。在细胞内部环境下,FOXP蛋白非常保守,能够与自身或同源蛋白及细胞内的其他蛋白发生互作。FOXP2是一个复杂精细的多功能蛋白。仅对叉头状结构域的分析,并不能显示FOXP2蛋白和其本身以及和其底物DNA之间互作的完整效应。因此,本文中我们分析了锌指基序,亮氨酸拉链以及叉头状结构域在DNA-FOXP2及FOXP2-FOXP2之间互作的效应功能。


我们利用基因工程的手段制备了FOXP2的七种突变体,用以研究FOXP2蛋白的相应结构域在DNA结合以及蛋白同源寡聚化过程中的作用(请见Figure 1a)。


FOXP2蛋白的突变体示意图


在非变性凝胶阻滞实验中,将携带有经证实的保守的FOXP2结合序列(TGTTTAC)的双螺旋DNA滴定入固定浓度的蛋白突变体中(请见Figure 1b)。



对于含有全部结构域的突变体P1,低浓度DNA时,所有的DNA都被聚集在低迁移率的条带中,说明了DNA-蛋白复合物的形成。增加DNA的浓度导致这些条带迁移速率的增加,表明每个DNA分子结合了更少的蛋白分子。最终,当我们将DNA的浓度增加到每个DNA分子和蛋白分子的化学计量比为4时,自由DNA量明显增加。上述结果与仅含有叉头状结构域的蛋白突变体P4的EMSA滴定结果相反。在较低的DNA浓度时,自由DNA已经存在,高度有序的DNA-蛋白复合物很难被检测到。因此,与突变体P1相比,截短的P4突变体与DNA结合的亲和性明显降低。


蛋白突变体P1和不同长度的DNA靶点以及不同的保守结合位点的混合EMSAs实验显示,不同的保守基序能够被蛋白有效的进行分群(请见Figure 1c)。



当将两个具有不同序列的DNA靶分子混入相同的蛋白样本中时,蛋白将根据相对亲和性区分靶分子。确实,与TATTTGC或TCTTGAC相比,我们发现蛋白突变体P1更倾向于与TGTTTAC序列结合。当蛋白突变体P1与相同的TGTTTAC序列,但分别为32或70个碱基对的序列混合时,蛋白并未表现出结合偏向。


EMSA实验凝胶迁移结果常出现大量的条带弥散现象,是由于在非平衡的凝胶电泳实验条件下,凝胶基质中含有大量的不稳定的蛋白-DNA复合物引起的。通过EMSA进行DNA-蛋白结合亲和性的定量实验并不可行。我们因而借助于以荧光接近感应(FPS)的DNA生物芯片技术(请见Figure 2)。


荧光接近感应(FPS)switchSENCE技术


在FPS测量中,我们监测到含有FOXP2结合保守序列的DNA靶分子的荧光强度发生变化,然而包含锚定双螺旋或更长的阴性对照组未检测到明显的荧光强度的改变(请见Figure 2c)。


为了检测锌指基序,亮氨酸拉链和叉头状结构域对FOXP2与DNA的结合的影响,我们在生物芯片上利用不同的突变体进行浓度依赖性的结合亲和性检测。对于突变体P1-P5,都包含叉头状结构域以及突变体P6和P7,可参考Figure 1a中的蛋白结构示意图。一旦蛋白加入流动系统,荧光强度增加,当蛋白被洗脱时,荧光强度降低(请见Figure 3a)。在这两个阶段中,信号最终都达到稳态。随着蛋白浓度的不同,稳态期的荧光强度存在差异。更高的蛋白浓度产生更高的绝对荧光强度(请见Figure 3a)。因此,蛋白浓度的增加导致表面附着的DNA中被蛋白占据的比例增加,与可逆结合反应的预期一致。当蛋白被洗脱时,稳态期的荧光强度会恢复到蛋白结合之前的状态,表明所有结合的蛋白都被解离。


FOXP2蛋白突变体和DNA结合动力学


突变体P1,包含所有功能性结构域,即使在蛋白浓度为150nM时,稳态期的荧光强度也出现较大幅度的增长。然而,仅含有叉头状结构域的P4突变体需在900nM的蛋白浓度时,产生相同强度的荧光。对于突变体P6和P7,我们未能检测到荧光强度的改变,说明在测试的浓度范围内(达到1.2uM),这些突变体未能和DNA发生结合。我们采用全局动力学拟合模型,结合浓度依赖性的荧光时间曲线以及双分子反应模型,以提取结合速率常数Kon以及解离速率常数Koff。根据解离和结合常数之比,确定蛋白和DNA互作的解离平衡常数Kd,数值从大约2nM到大约360nM,根据蛋白突变体不同发生变化(请见Figure 3d)。


为了对人的FOXP2和其本身的互作进行定量,我们利用single-molecule mass-photometry landing assays技术测量蛋白分子的质量和聚合状态(请见Figure 4a)。


FOXP2蛋白突变体的质量光谱结果


蛋白突变体P1是研究中最长的FOXP2突变体,至少存在五种不同的质量分布(请见Figure 4b)。被分析的颗粒中,一半来自于分子量大约为100kDa的颗粒。因为P1单体的分子量是该数值的一半,我们认为颗粒中大多数是FOXP2二聚体。在P1的质量分布中,更大的分子质量是200 kDa,该数值是100 kDa的整数倍,因此,我们认为该分子聚集体是FOXP2二聚体的二聚体。我们也检测到两个低分子量的分子分布,其中一个是46 kDa,另一个是73 kDa。前者可认为是带有测量误差的FOXP2单体,后者可能由于杂质引起的无法定性的分子。


对于蛋白突变体P2,由于在亮氨酸拉链域含有三个亮氨酸替换丙氨酸的突变,我们获得了完全不同的分子质量分布结果。75%的颗粒的平均分子量为51 kDa,非常接近52 kDa的P2单体分子量。我们因此推测该颗粒为单体形式。分子量更高的颗粒质量分别为100 kDa和150 kDa,因为该数值是50 kDa的整数倍,我们推测该颗粒分别为P2的二聚体和三体。


蛋白突变体P3,含有激活的亮氨酸拉链域,但缺少锌指基序,我们获得了45 kDa和85 kDa的分子颗粒(请见Figure 4d)。P3的预测分子量为42 kDa,因此我们推测这两种颗粒分别为FOXP2蛋白的单体和二聚体。


对于仅含有叉头状结构域的突变体,推测分子量为27 kDa。经测得P4突变体的分子量分布分别为31 kDa,53 kDa和89 kDa。突变体P5测得的分子量分布分别为31 kDa,56 kDa和94 kDa。在测量误差范围内,我们鉴定其分别为单体,二聚体和多聚体。


我们将从FPS测量中获得的解离常数和从质量光谱中获得的解离常数进行了对比,推测分子相互作用的自由能。蛋白突变体P1和P3具有同样的DNA结合强度,Deta G约等于-12 kcalmol-1。因为P3突变体中删除锌指基序并未影响突变体与DNA的结合,我们推测锌指基序并不能直接和被研究的DNA靶序列相互作用。突变体P3(含有亮氨酸拉链和叉头状结构域)和P4(仅含有叉头状结构域)的对比结果表明,删除亮氨酸拉链结构域会削弱蛋白与DNA的结合能力,削弱程度达到Deta G约为3 kcalmol-1。因此,亮氨酸拉链与DNA存在相互作用。在蛋白突变体P2中,我们将亮氨酸拉链区域的三个亮氨酸替换丙氨酸,进而打破了内部重复序列,该序列对蛋白的寡聚化具有明显的作用:具有亮氨酸拉链和锌指基序的P1突变体的蛋白互作亲和性Kd为2nM,然而,重复序列被打破的P2突变体,其蛋白互作的Kd为300nM。因此,打破重复序列会削弱蛋白二聚体的稳定性,其程度达到Deta G约为3 kcalmol-1


与突变体P1相比,删除锌指基序的P3突变体,会削弱蛋白二聚化的稳定性,其程度达到deta G约为2 kcalmol-1。因此,锌指基序有助于蛋白之间的相互作用。然而突变体P2,其包含锌指基序和七联体重复序列被破坏的亮氨酸拉链域,显示其蛋白互作的强度与仅包含叉头状结构域的突变体P4在数值上相一致。因此,我们将在P2中检测到的蛋白互作归因于叉头状结构域之间的互作,而不是由亮氨酸拉链或锌指基序所介导。似乎只有当亮氨酸拉链结构域形成卷曲螺旋结构时,锌指基序才会参与蛋白之间的相互作用。


蛋白突变体P4和P5,仅由叉头状结构域构成,显示了DNA结合能力,其结合亲和性Kd值为300nM(Deta G约为9 kcalmol-1)。叉头状结构域可以和DNA直接相互作用,这与已有的报道相一致。加入亮氨酸拉链结构域能够增强蛋白与DNA结合的稳定性,其结合亲和性为2nM。在结合能方面,FOXP2的亮氨酸拉链或锌指基序有助于蛋白-DNA之间相互作用的能量提高,其程度约为Deta G kcalmol-1


仅含有叉头状的结构大多数以单体的形式存在,但残留的二聚体/单体平衡使得我们能够推测蛋白和蛋白结合的强度。相应的,P4和P5的发生二聚化的能量分别需要Deta G 8.8 kcalmol-1和8.1 kcalmol-1


总的来说,质量光谱和利用荧光接近感应(FPS)的swithcSENCE技术分别从复合体形成的热力学和实时结合动力学两个方面研究蛋白与靶分子的相互作用性能。这对于我们更深入的研究蛋白互作至关重要。