学术资源

《Nature》出击!人类异源端着丝粒染色体间的重组


 

image.png 

 

 

 

 

人类基因组的第一次完整组装

        人类端着丝粒染色体13、14、15、21和22号的短臂(SAACs)共享较大的同源区域。由T2T联盟完成的CHM13组装(T2T-CHM13)是人类基因组的第一次完整组装,填补了遗传密码约8%的空白,提供了同源区域的模型,但目前尚不清楚这些同源区域是遗传的还是通过正在进行的重组交换来维持的。

 

 

端着丝粒染色体非同源区域之间的重组

        近日,美国田纳西大学Erik Garrison研究组在Nature发表了题为“Recombination between heterologous human acrocentric chromosomes”一文,发现端着丝粒染色体包含伪同源区域(PHRs),表明非同源区域之间的重组。利用来自人类泛基因组参考联盟(HPRC)的人类参考泛基因组比对,发现来自所有SAACs的序列构成了一个群落。通过对染色体共享同源区域的比较,将重叠群建立成为一个同源共享区域数据库。

 

        本文中,研究团队发现人类异源端着丝粒染色体之间的激活重组。

 


序列间的同源性

        完成了人类泛基因组草图序列中包含性染色体和端着丝粒染色体群落的系统性比对,提示这些群落与基于参考基因组T2T-CHM13和GRCh38以及已知染色体之间相似性模式可能一致,其中,SAACs群落中包含的染色体种类和重叠群数目最多(图1)。

image.png 

图1.人类细胞系HPRCy1泛基因组的群落鉴定

        通过研究94个已组装完成的人类细胞系HPRCy1泛基因组中具有同源性的染色体群,并利用同源比对建立了人类细胞系HPRCy1泛基因组的无参考模型

        a.HPRCy1的全局映射图:

            其中不同的点代表不同的contigs,比对关系通过边际来体现,端着丝粒染色体以及性染色体用彩色标注加以区分;

        b.针对端着丝粒染色体的近景映射图;

        c.根据映射图的群落分配;x轴代表染色体,y轴代表染色体来源的群落,正方形中数字表示每个特定染色体和群落的组合数;

        d.全局映射图缩略版。

 

        端着丝粒的泛基因组图谱揭示了碱基水平的同源性,概括了异源染色体间的交换模式(图2)。

image.png 

图2.根据HPRCy1组装的端着丝粒泛基因组变异图谱

        a. acro-PVG的主要组成;

        b. SAAC连接位置的近景图:显示15号染色体(HOR_15_4)着丝粒高度重复序列从其他染色体分离过程,然而13和21号染色体之间以及14和22号染色体之间存在大量的共享同源区域,可导致他们在基因组变异图谱缩减;

        c. b图所示区域的近景图,重点关注以SST1阵列和核糖体DNA(rDNA)阵列为中心的分段复制核心。


        由此得到的端着丝粒泛基因组变异图谱(acro-PVG)与T2T-CHM13中观察到的结构以及和同源映射图谱群落结构相呼应。

        13和21号染色体之间以及14和22号染色体之间存在大量的共享同源区域,这导致他们在基因组变异图谱中缩减。

        富含高GC的SST1阵列为中心的区域存在于13,14和21号染色体的单个拷贝中,表明这些区域的基因组高度相似

        acro-PVG提供了人群中SAAC的多重排列方式。在acro-PVG中,可观察到多条T2T-CHM13染色体排列区域,文中预估这些区域可能支持同源重组,这在很大程度上取决于序列的同源性和物理接近性。

 


染色体协同进化的重复序列

        异源端着丝粒染色体之间的重组假设表明,根据acro-PVG的HPRCy1-acro重叠群将成为同源重组区域内不同端着丝粒染色体的嵌合体。参考端着丝粒染色体PHRs特点,每个序列的长臂映射到单条染色体,而短臂是一个片段的嵌合映射到多个端着丝粒染色体(图3a,b)。

image.png 

图3.端着丝粒染色体PHRs特点

        利用目标样本T2T二倍体组装的交叉验证图谱,发现基于参考基因组T2T-CHM13非同源染色体最佳匹配模式下的多样化拼接区域

        a. 重点突出了13号染色体的前25Mb,并用红框在T2T-CHM13区带特殊标注。高亮标注显示在T2T-CHM13基因组的着丝粒和卫星重复序列(CenSat注释)、GC含量和基因相关的PHRs; 

        b. HPRCy1长臂锚定的重叠群映射到端着丝粒染色体的数量;

        c. 基于T2T-CHM13重叠群的区域同源熵计算;

        d. 通过考虑每个hprcy1跨基因组的多重解结,开发了一个逐点度量,以捕获T2T-CHM13的同源模式的多样性(位置同源熵),从而定义PHRs;

        e.同源嵌合表明SAAC中正在进行重组交换。

 

        计算PVG中与T2T-CHM13单中心染色体最匹配的重叠群数量发现,在长臂上,所有的重叠群都与其同源的T2T-CHM13染色体匹配度最高,这与观察到的PVG结构一致;当接近着丝粒染色体长臂时,与15号染色体与其他端着丝粒染色体相比,13和21号染色体之间以及14和22号染色体之间的同源区域同源性更接近rDNA,与PVG拓扑结构中观察到的模式一致

        开发了“区域同源熵”,作为异源染色体之间重组敏感的度量,把介于0kb~30kb区间的区域同源熵认为是正在进行重组的候选区域。对SST1序列全基因组的最大似然进化分析表明,SST1序列的重复序列是由染色体协同进化的,13, 14和21号染色体显示出染色体之间协同进化的独特模式

与所有其他SST1重复序列相比,它们共有约1.0kb的缺失,表明它们的阵列间重组类似于PHRs周围的非卫星序列(图4)。

image.png 

图4.以SST1阵列为中心的13, 14及21号染色体的PHRs

        a.全长元素的最大似然进化分析表明端着丝粒阵列的均质化过程:

            ·彩色圆圈表示从T2T-CHM13组装中提取的单个单体,

            ·彩色三角表示从HG002 Y染色体中提取的SST1全长单体;

            ·13, 14及21号染色体阵列侧翼的部分或嵌合单体别被标记为开放的圆圈或正方形,并根据相应的染色体着色; 

        b. SST1一致性比对示意图,表明缺失只存在于13, 14 及21号染色体阵列的SST1单元中;

        c. T2T-CHM13, HG002-Verkko单倍型和HPRCy1-acro 重叠群与T2T-CHM13的多重序列比对;

        d. T2T-CHM13上与位于14和21号染色体复发性ROB断点区域的BAC相关的PHRs(黄色和浅蓝色)。

 

 

异源染色体间的重组

        根据跨端着丝粒重叠群构建的变异图谱,在T2T-CHM13中异源端着丝粒染色体之间存在多重叠群相似的区域。除15号染色体,伪同源区重组率更高。伪同源区包括先前已被证明位于罗伯逊易位(ROB)的断点处序列,并且它们的排列与13、14和21号染色体上的反向重复交叉兼容。因此本研究推测PHR是通过异源染色体的重组来维持的,这种重组偶尔会导致ROB(图5)。

image.png 

图5.端着丝粒染色体PHRs

        a.13,14,15,21和22号染色体SAACs近端rDNA区域发现的PHRs; 

        b.PHRs由于靠近核仁组织区和rDNA,在物理上共定位,促进了序列交换;

        c.在PHRs中观察到的序列相似性模式表明异源染色体之间正在进行重组交换,尤其是13,14和21号染色体,可能通过异源染色体端粒末端的非交叉重组或交叉介导;

        d. 存在于13,14和21号染色体的SST1阵列周围的PHR在所有三条染色体上几乎完全相同,但相对13和21号染色体,14号染色体方向相反(三角形标注)。

        假设这些同源区域可能具有相同的生物学功能,它们的距离可以促进染色体间交叉或非交叉反应的重组,以上重组事件可发生在减数分裂或有丝分裂期间。HPRC泛基因组提供了多种SAAC单倍型同源模式的基准分辨率,为后续ROBs事件的研究提供更加详尽的基础。

 

 

总结

        人类泛基因组HPRC草图使我们能够从染色体尺度对基因组进化有一个更加全面的认知。新的泛基因组图谱越来越多地代表了人类的多样性,使科研工作者能够更好地了解影响健康和疾病的基因组变异,同时为未来的基因组和细胞遗传学研究奠定了坚实的基础,使我们更接近解决人类遗传进化的长期谜团。