WGS测序,即全基因组测序(Whole Genome Sequencing),是一种对生物体整个基因组进行测序的技术。它涵盖了生物体内所有染色体上的DNA序列,包括编码蛋白质的基因、非编码RNA基因、调控元件、重复序列以及染色体结构变异等所有遗传信息。
| 领域 | 具体应用 |
|---|---|
| 疑难罕见病诊断 | WES阴性但高度怀疑遗传病的病例、非编码区突变导致的疾病(如启动子区变异致耳聋)、复杂结构变异病例,诊断率可再提升10%-15% |
| 肿瘤全景分析 | 肿瘤基因组全面图谱构建、驱动突变与乘客突变区分、肿瘤突变负荷(TMB)计算、新抗原预测、胚系与体细胞变异同步检测 |
| 新生儿筛查与危重症 | NICU危重症患儿快速WGS(rWGS,26-48小时出报告),用于病因不明的新生儿代谢危象、癫痫等紧急诊断 |
| 复杂疾病研究 | 精神分裂症、自闭症、糖尿病等多基因疾病的全基因组关联分析(GWAS)、罕见变异 burden分析 |
| 人群基因组学 | 大型队列研究(如UK Biobank、中国十万人基因组计划)、人群频率数据库构建、演化与迁移研究 |
| 药物基因组与精准健康 | 全基因组药物反应预测、多基因风险评分(PRS)、个体化健康管理 |
DNA完整性、文库片段分布、覆盖均一性、测序深度、碱基质量(Q30>85%)。
| 组织类型 | 送样建议 |
|---|---|
| 冻存组织 | 大于 0.1 g |
| 培养细胞数量 | >5×10⁶ 个 |
| 全血 | >1 ml |
| FFPE | 厚度 5-10 μm,含组织面积大于 25 mm² 的切片 6 张 |
| DNA | 总量 >500 ng |
| 血浆/血清 | >3 ml |
与参考基因组比对
样本比对率,指比对到参考基因组上的数据量除以有效测序数据量,反映了样本测序数据与参考基因组的相似性。测序深度,指比对到参考基因组的碱基总数除以基因组大小;覆盖度,指被测到的该物种基因组的碱基总数占该物种基因组长度的百分比;测序深度和覆盖度能够直接反应测序数据的均一性及与参考序列的同源性。
不同样本每个染色体的平均覆盖深度柱形图(左侧坐标)和覆盖率折线图(右侧图标)变异检测和注释
SNV全称Single nucleotide variant,是指在基因组上由单个核苷酸的替换所引起的变异。InDel指小片段的插入/缺失。SV(结构变异)指的 是在基因组上一些大的结构性的变异,比如大片段插入(insertion)、倒位(inversion)、易位(translocation)。CNV(拷贝数变异)是一类特殊的结构变异,指 的是基因组上大片段序列拷贝数的增加或者减少,可分为缺失(loss)和增加(gain)两种类型。变异注释内容包括基因及区域注释,数据 库(人种频率)注释,保守(有害)性预测,变异位点信息,基因功能及通路注释等。变异检测结果统计| Sample | ABC |
|---|---|
| SNP | 3580963 |
| exonic | 21905 |
| intronic | 1219968 |
| UTR3 | 24647 |
| UTR5 | 5460 |
| intergenic | 2053039 |
| ncRNA_exonic | 11609 |
| ncRNA_intronic | 197370 |
| upstream | 21560 |
| downstream | 22510 |
| splicing | 2566 |
| ncRNA_UTR3 | 0 |
| ncRNA_UTR5 | 0 |
| ncRNA_splicing | 329 |
基因功能富集分析
候选基因GO功能富集散点图候选基因集蛋白互作网络分析
对候选基因集进行蛋白互作网格分析,寻找互作用的共调控基因。和代谢通路类似的,不同患者的突变基因可能不同,但是存在相互作用的基因突变导致的 表型可能是一致的。寻找存在相互作用的突变基因,能够帮助定位真正和疾病相关的致病基因。候选基因GO功能富集散点图| Gene1 | AGene2 | Weight | Type | Source |
|---|---|---|---|---|
| ACADS | ANK3 | 0.0036732843622961685 | Co-expression | Arijs-Rutgeerts-2009 |
| CAPG | NBEAL2 | 0.009666444250224945 | Co-expression | Arijs-Rutgeerts-2009 |
| CES2 | ANK3 | 0.0023196574937742625 | Co-expression | Arijs-Rutgeerts-2009 |
| CES2 | SCIN | 0.003236607932114256 | Co-expression | Arijs-Rutgeerts-2009 |
| CES2 | SPHK2 | 0.002634019861890413 | Co-expression | Arijs-Rutgeerts-2009 |
Phenolyzer分析
在疾病研究中,确定候选基因和疾病的关联性是十分重要的。依据用户提供的疾病/表型名称,通过精准算法, 结合测序结果和多种数据库,对基因进行筛选排序,构建基因-疾病表型之间的关联图。
候选基因排序展示图Somatic SNV检测及注释
| Category | Numbers |
|---|---|
| CDS | 98 |
| synonymous SNP | 28 |
| missense SNP | 67 |
| stopgain | 2 |
| stoploss | 0 |
| Unknown | 1 |
| intronic | 12,917 |
| UTR3 | 148 |
| UTR5 | 12 |
| splicing | 4 |
| ncRNA exonic | 50 |
| ncRNA intronic | 1,831 |
| ncRNA UTR3 | 3 |
| ncRNA UTR5 | 1 |
| ... | ... |
高频突变基因分析
高频突变基因(Significantly mutated genes, SMG)综合考虑了体细胞SNV和InDel等变异,是指突变频率显著高于背景突变频率的基因。肿瘤高频突变分析使用MuSiC软件, MuSiC以所有或部分肿瘤样本为背景,对各个突变类型进行统计检验。
癌症体细胞全景突变个性展示图高频突变基因富集分析
在生物体内,不同基因相互协调行使其生物学功能,通过Pathway显著性富集能确定高频突变基因参与的最主要生化代谢途径和信号转导途径。利用PathScan软件进行通路富集分析,使 用的代谢通路数据库有:KEGG、Biocarta、PID、Reactome等。
干细胞癌遗传突变主要的信号通路突变频谱分析
点突变基因共有6种类型:C>A/G>T,C>G/G>C,C>T/G>A,T>A/A>T,T>C/A>G,T>G/A>C,根据各类型点突变的数量对肿瘤样本和点突变类型进行聚类分析,我们 可以分析所研究癌症的点突变类型的偏好和各种癌样本在点突变水平上的相似程度。
突变频谱展示图突变特征分析
考虑点突变位点上、下游各1bp位置的碱基种类,可以将点突变分为96种类型。突变特征分析是根据各肿瘤样本中96种突变类型的频率,通过非负矩阵分解的方法将点突变分解为多个 不同的突变特征,将样品突变特征与COSMIC网站中30种已知的突变特征进行聚类,利用与样本突变特征相似的已知特征的注释信息解释样本突变过程。
突变特征展示图
英文标题:
Genome-wide association study of placental weight identifies distinct and shared genetic influences
between placental and fetal growth Structure and function of rice hybrid genomes reveal genetic basis and optimal performance of heterosis
中文标题:
胎盘重量的全基因组关联研究确定了胎盘和胎儿生长之间不同/共同的遗传影响
研究背景:
胎儿和母亲之间的胎盘连接为胎儿提供营养和氧气、清除胎儿血液中的废物、产生激素、生长因子和细胞因子,使母体抗体传递给胎儿,赋予新生儿先天免疫力。次优胎盘可导致宫内生长受限流产、早产和先兆子痫。功能不良的胎盘与生长受限、不良神经发育和心脏代谢疾病的风险有关。
胎盘重量(PW)很容易测量,在流行病学研究中经常使用来表示胎盘的生长和功能。已有研究表明,胎盘与胎儿的生长关系表现为正相关,全基因组关联研究(GWAS)已经在母体和胎儿基因组中确定了与BW相关的遗传基因座,这些基因座富含胎盘表达定量性状基因座(eQTL)。然而,目前还没有PW的GWAS,胎盘生长、胎儿生长和不良妊娠结局(例如先兆子痫)之间的关系尚不清楚。尽管胎盘主要由胎儿来源的细胞组成,但它与母体生理学有着错综复杂的联系。基因分析为深入了解直接胎儿、间接母体和母体起源效应(POE)的复杂相互作用提供了机会。
主要发现:
研究者通过PW的GWAS分析确定了40个关联信号,发现胎儿对胎盘重量的遗传贡献远大于母体的贡献。这些信号与已知的出生体重关联部分重叠,但有12个主要或仅与胎盘重量有关。发现了母体对胎盘发育、形态以及氨基酸和抗体转运的影响和联系。孟德尔随机化揭示了胎儿对先兆子痫的贡献,并暗示胎儿胰岛素参与胎盘生长的调节。
参考文献:
Beaumont, R.N., Flatley, C., Vaudel, M. et al. Genome wide association study of placental weight identifies distinct and shared genetic influences between placental and fetal growth. Nat Genet (2023).
下载网址:https://www.nature.com/articles/s41588-023-01520-w
英文标题:Structure and function of rice hybrid genomes reveal genetic basis and optimal performance of heterosis
中文标题:
杂交水稻基因组的结构和功能揭示了杂交的遗传基础和最佳性能
研究背景:
杂种优势指杂合子第一代(F1)在目标性状上表现优于亲本自交系的现象,杂种优势是生物界的普遍现象。杂种优势被广泛应用于农业生产中,用于提高粮食作物和经济作物的生长速率、产量和抗逆性。上世纪70年代初,袁隆平先生及其助手在野生稻群体里发现了一株天然败育个体,推动了杂交水稻育种的商业化发展。杂交稻育种极大提高了水稻的产量,继半矮秆育种后实现了产量的第二次跃升,被誉为“第二次绿色革命”。过去半个世纪,大量的杂交稻品种被育成,若能分析大量优良杂交稻品种的基因组和表型信息,能帮助解析杂种优势形成的遗传基础,从时间维度上分析杂交稻品种基因组结构的变化,又能帮助探索改良育种应用杂种优势的规律。
主要发现:
该研究通过分析2,839份杂交稻品种的表型变化趋势,回顾了改良育种的成就:1. 库器官显著增大,包括每穗粒数和有效穗数。库器官的增大搭建了材料的高产架子,为产量提升打下了基础。2. 为了配合增大的库器官,源器官显著增大,包括主要光合器官剑叶的叶长和叶宽,以提高源器官的灌浆能力;3. 抽穗期稍缩短。水稻生育后期(灌浆期)的气候条件多变,极端天气可能影响水稻的产量,甚至导致颗粒无收。稍缩短的抽穗期可以降低材料在生育后期遇上极端天气的风险,从而提高材料的稳产性能;4. 籽粒蒸煮品质和外观品质显著提升。早期杂交稻的稻米品质较差,通过育种家的不懈改良,稻米品质得到显著提升。抽穗期的缩短和米质的改良,对提高或维持现有产量水平带来了极大挑战。该研究发现杂交稻育种通过源库协同改良,单株产量不仅没有下降,反而实现了小幅的提升。
Q1:全基因组测序可以做哪些分析?
答:全基因组测序在不同类型样本中分析内容不同,其获得的变异位点信息是诸多生物学信息分析的基础数据。在个体层面,可以进行基因型分型和功能原件分析,群体层面可以进行种群遗传结构和进化历史分析。全基因组关联分析(GWAS)是其中的热点,通过对遗传多样性丰富的自然群体的每个个体进行基因组测序,结合目标性状的表型数据,可以快速获得影响目标性状表型变异的染色体区段或基因位点。GWAS可以一次性定位多个性状,且定位精度高,直接获得与目标性状相关的基因。
Q2:全基因组测序对于测序深度的有何要求?
答:从科研角度来看,WGS测序通常需要达到一定的测序深度才能确保结果的可靠性和准确性。一般来说,WGS的测序深度在30X以上可以较为可靠地检测基因组中的单核苷酸多态性(SNP)和插入缺失(INDEL)。对于遗传病检测的样本建议深度一般是40X左右,对于高异质性的肿瘤样本,WGS的测序深度需要更高,以达到70-100X,以确保能够全面、准确地检测肿瘤细胞中的基因变异。GWAS分析根据群体大小测序深度建议平均测序深度在10~30X。
Q3:对于石蜡FFPE样本或者微量或降解严重的样本有何要求?
答:WGS测序建议DNA要求能达到20ng/ul&1ug。对应的石蜡FFPE样本约10个切片。对于DNA量严重不足或者降解的样本,可以进行微量建库,DNA需求量为10pg,但由于扩增循环数增加引起的dup会造成数据的浪费和测序成本的增加。
©2024 - 我的网站 版权所有