全基因组甲基化检测(WGBS,Whole-genome bisulfite sequencing)是一种基于重亚硫酸盐处理的甲基化分析方法,它在DNA甲基化研究中占据重要地位。
WGBS的技术原理主要包括以下几个步骤:
DNA处理:通过重亚硫酸盐处理样本DNA,将未甲基化的胞嘧啶(C)碱基转化为尿嘧啶(U),而甲基化的C碱基则保持不变。
PCR扩增:进行PCR扩增后,U碱基在PCR过程中会被转变为胸腺嘧啶(T),从而与原本甲基化的C碱基区分开来。
高通量测序:结合高通量测序技术,对处理后的DNA进行测序,获取全基因组的甲基化信息。
数据分析:将测序结果与参考序列进行比对,判断CpG/CHG/CHH位点是否发生甲基化,从而绘制出单碱基分辨率的全基因组DNA甲基化图谱。
WGBS具有以下显著的技术优势:
全基因组覆盖:能够最大限度地获取完整的全基因组甲基化信息,精确绘制甲基化图谱。
单碱基分辨率:可以精确分析每一个C碱基的甲基化状态,提供高分辨率的甲基化信息。
应用范围广:适用于所有具有参考基因组的物种,具有广泛的适用性。
性价比高:相对于传统的甲基化检测方法,如BSP或MSP,WGBS具有更高的性价比。
WGBS广泛应用于多个领域的研究中,包括但不限于:
疾病研究:在癌症、心血管疾病、神经退行性疾病等的研究中,WGBS可用于揭示疾病相关的甲基化变化,为疾病的早期诊断和治疗提供新的思路。
个体发育与衰老:在个体发育和衰老过程中,DNA甲基化会发生显著变化。WGBS可用于解析这些过程中的甲基化变化机制,为理解生命过程提供重要信息。
环境适应与进化:在环境适应和进化研究中,WGBS可用于揭示生物体在环境压力下的甲基化变化,为理解生物的适应机制和进化规律提供有力支持。
WGBS的服务流程通常包括以下几个步骤:
样本收集与准备:收集实验所需的生物样本,并进行适当的处理和保存。
DNA提取与质检:从样本中提取DNA,并进行质量检查以确保其完整性和纯度。
文库构建:通过重亚硫酸盐处理、PCR扩增等步骤构建测序文库。
高通量测序:利用高通量测序平台对文库进行测序,获取全基因组的甲基化信息。
数据分析:对测序数据进行质量控制、比对、甲基化位点识别等分析,绘制出全基因组甲基化图谱。
结果解读与报告:根据分析结果进行结果解读,并撰写详细的研究报告。
TAPS(TET-assisted pyridine borane sequencing)全称TET辅助吡啶硼烷测序,是一种创新的DNA甲基化检测技术。其核心技术在于利用TET(Ten-Eleven Translocation)酶将5-甲基胞嘧啶(5mC)和5-羟甲基胞嘧啶(5hmC)等修饰的胞嘧啶氧化为5-羧基胞嘧啶(5caC)。随后,吡啶硼烷将5caC还原为二氢尿嘧啶(DHU),在PCR过程中,DHU会被识别并转化为胸腺嘧啶(T)。这样,原本甲基化的胞嘧啶(C)就被转化成了胸腺嘧啶(T),而未甲基化的C保持不变。通过对比处理前后的DNA测序结果,即可确定哪些C是甲基化的。
高效性和准确性:TAPS假阴性率在2.7%~3.5%,假阳性率为0.23%,表现出较高的准确性。同时,TAPS的转化效率接近亚硫酸氢盐测序,但操作更为简便。
长链DNA保持:TAPS能够保持10kb以上的长链DNA样本,仅需1ng的DNA即可建库,远低于亚硫酸氢盐测序所需的1mg以上DNA量。这一特性使得TAPS在处理血浆游离DNA(cfDNA)等珍贵样本时具有显著优势。
温和的实验条件:TAPS在室温条件下即可进行,对DNA片段的影响很小,几乎不会引起DNA降解,能够保留更多的DNA信息。
测序质量高:TAPS将少量的甲基化C转化为T,对天然DNA的改变很小,保留了较高的文库复杂度,从而提高了测序数据的质量。
低成本:TAPS的测序成本仅为亚硫酸氢盐测序的一半,具有显著的经济优势。
广泛的兼容性:TAPS可与多种下游分析技术兼容,如甲基化敏感性PCR、限制性酶切、质谱、全基因组测序等,进一步提高了其应用价值。
癌症早期诊断:TAPS能够检测血液循环中的cfDNA甲基化,为癌症的早期筛查提供了可能。例如,在膀胱癌的无创诊断中,TAPS已经显示出较高的灵敏度和准确性。
肿瘤治疗监测:通过检测肿瘤组织或血液中的甲基化变化,TAPS可以帮助评估肿瘤的治疗效果,如三阴性乳腺癌新辅助化疗的疗效预测。
遗传病研究:全基因组甲基化分析对于理解遗传病的发病机制具有重要意义,TAPS技术为这一领域的研究提供了有力工具。
表观遗传学研究:TAPS可以全面、高效地检测DNA的甲基化修饰,为表观遗传学的研究提供了重要支持。
样本采集:从血液、组织或细胞等来源提取高质量的DNA样本。
DNA修饰:利用TET酶和吡啶硼烷对DNA进行修饰,将甲基化的C转化为T。
PCR扩增:设计特异性引物,对修饰后的DNA进行PCR扩增,以获得足够数量的目标片段。
测序:使用高通量测序平台对扩增后的DNA进行测序。
数据分析:利用专门的数据分析软件对测序结果进行比对和分析,确定甲基化位点和甲基化水平。
结果解读:结合生物学背景和实验目的,对甲基化结果进行解读和解释。
理解同一DNA序列在不同细胞类型中的差异功能是生物学研究的一个基本挑战。基因表达、DNA可及性和染色质包装是细胞表型的重要决定因素,甲基化则是控制基因表达和染色质组织结构的基本表观遗传标记。
目前,人类DNA甲基化的数据集通常仅包括一小部分甲基化位点,可用的数据集十分受限。已经对胚胎发育、分化、癌症或其他环境中的甲基化组(methylome)进行表征的研究大都依赖Illumina BeadChip平台,这些平台仅限于450,000或860,000个CpG甲基化位点的子集,仅占人类基因组共约三千万个CpG位点的3%。
此外,此类测定通常独立测量每个CpG位点,忽略了DNA甲基化的协调模式。大多数DNA甲基化分析主要针对组织,因此鲜少有对少数细胞类型的研究,而其他分析则针对培养细胞,其中可能包含非生理甲基化模式。最近的研究使用来自整个组织的单细胞RNA测序数据,可能不够准确,无法识别液体活检中的罕见细胞。一些对人甲基化组的研究使用亚硫酸氢盐全基因组测序(WGBS)分析了分离的原代细胞,但其范围有限。

为了克服这些限制并准确表征人类细胞甲基化组,1月4日,来自耶路撒冷希伯来大学的研究团队在《Nature》上发表了题为“A DNA methylation atlas of normal human cell types” 的研究文章,描述了一种基于深度WGBS的人类甲基化图谱,对从205个健康组织样本中分选的39种细胞类型中数千种独特标记进行片段水平分析。相同细胞类型的重复超过99.5%,证明了细胞识别程序对环境扰动的稳健性。图谱的无监督聚类概括了组织个体发生的关键要素,并确定了自胚胎发育以来保留的甲基化模式。
在单个细胞类型中唯一未甲基化的位点通常驻留在转录增强子中,并含有组织特异性转录调节因子的DNA结合位点。独特的高甲基化位点很少见,并且富集于CpG岛、多梳蛋白(Polycomb)靶标和CTCF结合位点,这表明其在塑造细胞类型特异性染色质环中具有新作用。该图谱为研究基因调控和疾病相关遗传变异提供了重要资源,并为液体活检提供了大量潜在的组织特异性生物标志物。
1. 人类细胞类型甲基化图谱揭示甲基化的个体间差异
为了描绘各种细胞类型的全基因组DNA甲基化,研究人员对代表77种原代细胞类型的205个样本进行了WGBS。所分析的细胞类型代表了大多数主要的人类细胞类型,可对例如胃肠道、造血细胞和胰腺等生理系统进行综合观测,并比较不同环境中的类似细胞类型。研究人员试图识别特定细胞类型中差异甲基化的基因组区域,以阐明细胞类型特异的生物学过程,同时定义细胞身份并促进甲基化生物标志物的开发,从而识别cfDNA(circulating free DNA)片段的细胞来源。

他们开发了一个计算机器学习套件wgbstools(github.com/nloyfer/wgbs),用于表示、压缩、可视化和分析WGBS数据。通过在多种条件下鉴定DNA甲基化模式的变化点,研究人员将基因组分为7,104,162个不重叠的连续区块,保留了2,783,421 个至少三个和八个CpGs甲基化区块。对这些紧凑基因组单元的分析比单个CpG位点更直接,并且由于甲基化的区域性质,可以将其视为人类DNA甲基化的生物“原子”。
对于大多数细胞类型来说,有0.5%或更少的区块在不同供体之间显示出50%或更多的差异,而不同细胞类型样品之间的差异为4.9%。供体间DNA甲基化的高度相似性与基因组序列的预估个体间变异性相当。在不同实验室获得的重复中观察到类似的个体间差异。引人注目的是,对于至少3个生物学重复的细胞类型而言,99%的样本显示出与另一个重复的最高相似性。这些结果强调了一个基本生物学现象,即DNA甲基化主要由细胞谱系和细胞类型特异性程序而非遗传或环境因素决定。
2. 甲基化记录了细胞的发育历史
DNA甲基化模式反映了细胞的功能特性,也可以用来追踪其发育历史。为了确定早期祖细胞后代所共有的模式,研究人员计算了至少四个CpGs区块内的平均甲基化,并选择了所有样本中变异性最高的那些,然后对所有205 个甲基化组使用无监督聚集算法,系统地将相同细胞类型的生物样本聚类。这支持细胞分离的再现性,并表明每种正常细胞类型的三个或四个重复足以推断其甲基化模式,可用于如生物标志物鉴定等实际应用。

由此产生的扇形图概括了人类组织间谱系关系的关键要素。例如,源自同一胚胎内分泌祖细胞的胰岛细胞类型(α、β和δ)密集地聚集在一起。与反映谱系而非功能的甲基化组一致,胰岛细胞进一步与胰管和腺泡细胞聚集,然后与肝细胞聚集,它们与肝细胞共享内胚层起源。有趣的是,肺支气管上皮与食管和口腔上皮聚集,而肺泡上皮与肠上皮聚集,这与肺泡细胞谱系早期发育起源的证据一致。
一些甲基化模式在早期发育阶段形成的谱系中是常见的。例如,有892 个区域在源自早期内胚层衍生物的上皮细胞中未甲基化,而在源自中胚层和外胚层的细胞中甲基化。研究人员认为,这些细胞在内胚层中被去甲基化,衍生的细胞类型保留了这些模式。由于内胚层衍生物不具有共同的功能或基因表达,这提供了甲基化模式作为稳定谱系标记的又一个例子。
3. 细胞类型特异性甲基化标记物
研究人员研究了以细胞类型特异性方式差异甲基化的基因组区域,重点关注包含五个或更多CpGs的差异甲基化区块。他们发现几乎所有这些CpGs区域(97%)在一种细胞类型中都未甲基化,而在所有其他细胞类型中均甲基化。然后,根据靶细胞类型与所有其他样本甲基化的绝对差异对这些差异区域进行分类。
每种细胞类型的前25个差异非甲基化区域包括1,246个人类细胞类型特异性甲基化图谱标记,这些区域在特定的细胞类型中是唯一的非甲基化(平均甲基化13%),在所有其他样品中是甲基化的(平均甲基度91%),并且可以作为灵敏的生物标记物,用于定量混合物中特定细胞类型的DNA的存在。该图谱具有多种应用,包括对cfDNA片段的分析。

4. 人类细胞类型特异性调控图
研究人员进一步对这些细胞类型特异性差异非甲基化区域进行表征,确定了每种细胞类型的前250名非甲基化标记物,并使用GREAT来识别与每一组标记物相邻的基因,测试其对各种基因集注释的富集。与特定细胞类型中唯一非甲基化位点相邻的基因,通常反映该细胞类型的功能特性。
研究人员分析了DNA可及性和细胞类型特异性标记的染色质包装,如通过使用ATAC–seq、DNaseI–seq和组蛋白标记指示活性启动子和增强子。前250名 单核细胞和巨噬细胞的非甲基化标记物是高度可获得的,单核细胞被H3K27ac和H3K4me1标记,而其他细胞类型的标记物在单核细胞内没有富集。研究还显示了细胞类型特异性标记处chromHMM增强子注释的强烈协同富集。这些发现与先前的研究一致,将组织特异性去甲基化与基因增强子相关联。

为了进一步评估细胞类型特异性非甲基化区域的生物学重要性,研究人员探索了它们与转录因子(TF)的关系,转录因子可以影响DNA甲基化或以细胞类型特异的方式结合DNA。他们确定了每个细胞类型前1,000名的非甲基化标记,并用HOMER进行motif分析以计算已知TF结合motifs的富集。对于大多数细胞类型,排名靠前的motifs包括主调节器和关键TFs。细胞类型特异性非甲基化区域和TF结合motifs之间的这种关联,可以识别新的基因调节回路,并指示特定细胞类型中活跃的远端增强子。
研究人员设计了一种算法,以识别细胞类型特异性标记附近的基因,该标记在匹配条件下显示出基因表达水平增加。这突出了许多细胞类型的标志性基因,并表明每种细胞类型前25的潜在靶点。这些发现进一步支持了一个原则,即在特定细胞类型中,特异性非甲基化的基因座可能是调控该细胞类型中表达基因的增强子,并通常控制相邻基因。
为了生成每种细胞类型中潜在的调控区目录,研究人员对每种细胞的所有样本进行了片段水平分析,确定了39个细胞类型集群中的非甲基化基因组区域,然后对这些区域进行基因组特征注释,结果显示平均56%的区域有CpG岛重叠,46%的区域在启动子附近,44%的区域与CTCF结合位点重叠,突出了非甲基化位点的调控和结构作用。研究人员将这些区域与ENCODE和Roadmap Epigenomics的H3K4me3、H3K27ac、H3K4me1、H3K27me3、CTCF ChIP–seq和ATAC–seq联合分析,生成了一个细胞类型特异性的潜在增强子区域目录,这些区域的motif分析确定了每种细胞类型中的关键TFs。
5. 细胞类型特异性高度甲基化位点
研究人员研究了那些在一种细胞类型中甲基化但在人体其他地方未甲基化的基因组区域,它们富集了CpG岛,并且在其他细胞类型中被H3K27me3和Polycomb标记。与独特的非甲基化区域相比,这些细胞类型特异性高甲基化区域通常对motif富集不太重要。有趣的是,只有约3%的细胞类型特异性差异甲基化区域是高度甲基化的。

在汇集所有细胞类型特异性高度甲基化区域后,研究人员发现染色质调节因子CTCF的靶序列高度富集。这表明,CTCF结合位点的DNA甲基化,可以作为组织特异性调节开关来调节其结合,可能影响组织特异性三维基因组结构。
6. DNA甲基化测序数据算法
最后,研究人员开发了一种DNA甲基化测序数据的算法,并使用了每种细胞类型的前25位标记(共1,246个 标记)来研究从复合组织样品和cfDNA获得的甲基化组。简单来说,研究人员生成了一个图谱,其中计算了每个细胞类型(列)中每个标记(行)的非甲基化片段的百分比,然后使用非负最小二乘(NNLS)算法来拟合输入样本并估计其相对贡献。

基于DNA甲基化模式的分析为鉴定cfDNA的组织来源提供了机会。新冠肺炎对多种组织造成损害,其中一些组织没有生物标记物。研究人员使用了因新冠肺炎住院的患者的WGBS数据,从粒细胞、红细胞祖细胞、肺和肝中鉴定出过量的无细胞DNA片段,还发现了血管内皮细胞对这些患者的cfDNA的显著贡献。这些结果表明,血管内皮细胞死亡在新冠肺炎的发病机制中起着重要作用,可能与凝血病有关,并突出了使用综合细胞类型特异图谱进行cfDNA甲基化组分析的益处。
总结
该研究描绘了人类细胞类型的全面甲基化图谱,以及一套细胞类型特异性标记和计算工具,用于混合细胞类型样本的片段水平分析。此外,这项工作揭示了DNA甲基化的原理及其在细胞生物学和基因调控中的作用,有助于识别每种细胞类型中的活性增强子。由此绘制出的DNA甲基化图谱最有希望的用途之一是灵敏识别出患有癌症和其他疾病的个体血浆中cfDNA的来源组织,将为多个研究方向及翻译水平的应用提供了宝贵资源。
Genome-wide Analysis of DNA Methylation Profiles in a Senescence-accelerated Mouse
Prone 8 Brain using Whole-genome Bisulfite Sequencing
期刊:Bioinformatics
影响因子:5.766
发表单位:北京师范大学
发表年份:2017 年1月
一、研究背景
阿尔茨海默病,是一种进行性退化性脑疾病。本研究以小鼠为研究材料,系统分析了患病鼠与正常鼠的DNA甲基化作用模式,为开发新的治疗策略提供了有效资源。
二、方法流程
7个月大的雄性小鼠,SAMP8(患病组),SAMR1 (对照组)大脑皮层组织细胞。
1. DNA样品,末端修复,加A
2. 加甲基化接头,PCR扩增
3. 磁珠纯化
Illumina HiSeq,PE150
甲基化水平分析,DMR 鉴定,GO 富集分析,基因差异表达分析, WGBS 与 RNA-seq关联分析
三、研究结果
1. 基因组功能区域甲基化水平分析
. SAMP8和 SAMR1小鼠基因组功能区域甲基化水平较为相似。TSS和5′UTR区域的ML最低;introns区的ML最高;exons和3′UTR区的ML水平接近。结果表明,小鼠脑组织的甲基化位点主要位于gene body区,而非UTR 区。2. 甲基化胞嘧啶上下文
占主导地位的 CHG 甲基化位点为 CAG;占主导地位的 CHH 甲基化位点为 CAC。3.DMRs 的鉴定及 DMR 相关基因分析
鉴定出63个DMRs,SAMP8 vs SAMR1,41个为高甲基化DMRs,22个为低甲基化DMRs。有24个DMRs注释到26个编码蛋白的DMRs相关基因。GO富集分析结果表明,神经胶质凋亡(GO: 0034349)等GOterms显著富集。
四、研究结论
本研究通过小鼠脑组织全基因组甲基化研究发现,患病鼠的全基因组甲基化水平与正常鼠接近,但前者略低于后者。CpG和non-CpG 位点的甲基化水平都与阿尔茨海默病密切相关。GO富集分析表明,部分DMRs相关基因通过甲基化调控AD。通过与RNA-seq的关联分析,最终得到3个与AD最相关的基因(Dlgap1,TMEM51和Eif2ak2)。
参考文献
Zhang S, Qin CX,Cao GQ, et al. Genome-wide Analysis of DNA Methylation Profiles in a Senescence-accelerated Mouse Prone 8 Brain using Whole-genome Bisulfite Se-quencing.Bioinformatics, 2017 , 33 (11) :btx040.
3:哪些因素会影响实验结果?
A:样品DNA质量、Bisulfite处理过程、测序深度、测序质量等都会影响到最终的结果。
©2024 - 我的网站 版权所有