外显子组(exomes)是基因组中全部外显子的总和。以人类基因组为例,共计约 18 万个外显子,仅占基因组总量的 1%,碱基规模约 30Mbp。针对全部外显子区域开展测序的技术,即为全外显子组测序,简称 WES。人类外显子组占基因组比例不足 2%,却囊括了约 85% 的疾病相关变异,因此在编码区基因变异研究中,该技术相较全基因组测序,具备更高的经济性与检测效率。
WES基于目标捕获测序(Targeted Capture Sequencing)原理。首先通过超声打断或酶切将基因组DNA片段化,然后利用与所有已知外显子区域互补的生物素标记探针(Bait/Probe)与片段化DNA进行液相杂交,特异性地"钓取"外显子片段;随后通过磁珠分离捕获的目标片段,经过PCR扩增和文库构建后,在高通量测序平台上进行双端测序(Paired-End),最终通过生物信息学分析识别SNV(单核苷酸变异)、Indel(插入缺失)、CNV(拷贝数变异)等变异类型。
| 领域 | 具体应用 |
|---|---|
| 罕见病诊断 | 儿童发育迟缓、智力障碍、多发畸形等未确诊遗传病的分子诊断,诊断率可达25%-40% |
| 肿瘤精准医疗 | 实体瘤/血液肿瘤的体细胞突变检测、靶向用药指导(如EGFR、KRAS等用药相关突变)、耐药监测 |
| 遗传病携带者筛查 | 隐性遗传病(如地中海贫血、脊髓性肌萎缩症)的孕前/产前携带者筛查 |
| 药物基因组学 | 药物代谢酶(如CYP450家族)和药物靶点基因变异检测,指导个体化用药 |
| 科研转化 | 新致病基因发现、队列研究、多组学整合分析 |
DNA完整性、文库片段分布、捕获效率(中靶率>60%)、覆盖均一性、测序深度(有效深度>100X)、碱基质量(Q30>85%)。
| 组织类型 | 送样建议 |
|---|---|
| 冻存组织 | 大于 0.1 g |
| 培养细胞数量 | >5×10⁶ 个 |
| 全血 | >1 ml |
| FFPE | 厚度 5-10 μm,含组织面积大于 25 mm² 的切片 6 张 |
| DNA | 总量 >500 ng |
| 血浆/血清 | >3 ml |
与参考基因组比对率、测序深度、覆盖度分析
样本比对率,指比对到参考基因组上的数据量除以有效测序数据量,反映样本测序数据与参考基因组的相似性。测序深度,指比对到参考基因组的碱基总数除以基因组大小;覆盖度,指被测到的该物种基因组碱基总数占该物种基因组长度的百分比;测序深度和覆盖度能够直接反应测序数据的均一性及与参考序列的同源性。
基因功能富集分析
对注释、筛选得到的候选基因进行GO,Pathway,miRNA,Disease,Proteome,Phenotype等功能富集。富集分析中采用P-value的多重检验 校正值Q-value来控制FDR(False Discovery Rate),此外,也可以采取更严格的Bonferroni多重校正法(Bonferroni multiple correction method)。 缺省富集显著性阈值为控制FDR的Q-value<0.05。
候选基因集蛋白互作网络分析
对候选基因集进行蛋白互作网络分析,寻找相互作用的共调控基因。和代谢通路类似的,不同患者的突变基因可能不同,但是存在相互作用的基因突 变导致的表型可能是一致的。寻找存在相互作用的突变基因,能够帮助定位真正和疾病相关的致病基因。

克隆结构分析
肿瘤异质性主要是肿瘤在生长过程中,经过多次分裂增殖,其子细胞呈现出基因方面的改变,从而使肿瘤细胞的生长速度、侵袭能力、对药物的敏感 性、预后等各方面产生差异。对肿瘤组织进行克隆结构分析正是基于肿瘤异质性,通过信息分析手段,将肿瘤组织内遗传突变信息相似的肿瘤细胞进行聚类。
英文标题:
Genomic evolution and diverse models of systemic metastases in colorectal cancer
中文标题:
结直肠癌系统转移的基因组进化和多种转移模型
研究背景:
由于转移会影响临床治疗的有效性,阐明转移的路径和起源可以优化结直肠癌(CRC)患者的治疗决策。迄今为止,CRC中从原发部位到肝脏和肝外器官以及肝脏和肝外器官之间的系统发育进化几乎没有特征。因此,尚不清楚是否需要根据CRC系统转移的不同模型修改治疗策略。
主要发现:
作者选取6例结直肠癌患者的原发性肿瘤、区域淋巴结转移、肝转移、肺转移、胸淋巴结转移和正常组织样本进行病理评估,并进行外显子组测序。基于CRC多器官转移的多区测序分析了远处转移的基因组进化,以重建系统发育树。并确定了三种不同的转移模型,包括分支模型(从原发肿瘤到肝/肺的多系播种)、顺序模型(从肝到肺的单系播种)和散发模型(从原发肿瘤到肝/肺的单系播种)。此外,作者还发现了一个潜在的新型驱动基因,其复发性突变并在在独立队列中得到了验证。
参考文献:Chen HN, Shu Y, Liao F et.al Genomic evolution and diverse models of systemic metastases in colorectal cancer. Gut. 2022 Feb;71(2):322-332.
下载网址:
https://gut.bmj.com/content/71/2/322
英文标题:
Deleterious variants in X-linked CFAP47 induce asthenoteratozoospermia and primary male infertility
中文标题:
X连锁的精子鞭毛畸形致病基因CFAP47
研究背景:
在导致男性不育的诸多因素中,弱畸精子症越来越多的受到人们的关注。作为弱畸精子症的一个亚型,精子鞭毛多发形态异常(Multiple Morphological Abnormalities of the Flagella, MMAF)主要表现为精子尾部鞭毛的多种畸形,同时伴有精子活力降低或数目的减少。已有的研究提示这一类疾病与遗传因素相关。自2014年以来,陆续有22个MMAF相关的致病基因被发现,包括该团队前期报道的CFAP家族基因CFAP43、CFAP44、CFAP58,TTC家族基因TTC21A、TTC29,以及动力蛋白家族基因DNAH8等。已发现的这些导致MMAF的基因都表现为常染色体隐性遗传。
主要发现:
该研究中首先通过全外显子测序技术结合高效的生物信息学分析,对331例汉族男性MMAF患者进行了遗传分析,发现来自不同家系的3例MMAF患者携带X染色体上CFAP47基因的罕见变异。进一步的功能预测分析表明这些突变位点都具有较强的致病性。此外,通过对来自澳大利亚的24例MMAF患者进行基因组拷贝数变异分析,发现一例患者携带X染色体短臂2区1带第1亚带(Xp21.1)上的缺失,这一缺失覆盖了整个CFAP47基因。精子形态学分析发现,CFAP47缺陷患者的精子尾部呈现出典型的MMAF的表型,包括尾部鞭毛的多种畸形以及超微结构的异常。此外,Cfap47基因缺陷的雄性小鼠同样表现出精子活力降低、形态及运动方式异常,生育力显著降低的表型特征。由此可见,CFAP47是导致MMAF相关男性不育的新基因。
参考文献:
Chunyu Liu, Yue-Qiu Tan, Feng Zhang. et al. Deleterious variants in X-linked CFAP47 induce asthenoteratozoospermia and primary male infertility,The American Journal of Human Genetics,Volume 108, Issue 2,2021,Pages 309-323
下载网址:
https://www.sciencedirect.com/science/article/pii/S0002929721000021
Q1:哪些科学研究需要用到外显子组测序?
1)癌症研究:肿瘤易感性、致病机理、肿瘤异质性、转移和复发以及药物疗效研究;2)遗传病研究:群体遗传学、单基因致病基因和复杂疾病易感基因研究;3)生殖生育:检测胚系突变;4)新发变异:即发现先证者(Probands)有,但其父母没有的突变;5)药物基因组与用药指导等。
Q2:什么是胚系突变,什么是体细胞突变?
胚系突变是指在生殖细胞中发生的任何可遗传的突变,也称作获得性突变。胚系突变可遗传给后代;
体细胞突变:生殖细胞系以外的体细胞中发生的突变。最广为熟知的体细胞突变造成的疾病就是癌症;
遗传病研究关注胚系突变,而肿瘤研究大多关注体细胞突变。
Q3:外显子组测序对肿瘤组织样本的准备有什么要求?
癌症基因组学侧重于研究肿瘤细胞的体细胞突变。需要在准备肿瘤样本时同时采集来自于同一个体的癌旁组织(与肿瘤组织邻近的正常组织)作为对照样本,为避免因个体差异导致筛选的体细胞突变位点假阳性。如采集不到癌旁样本,则需提供同一个体的外周血白细胞或是PBMC作为对照样本。
Q4:癌组织为什么要采用高深度外显子组测序?
相对于遗传病而言,肿瘤组织样品中突变位点的等位基因频率较低,一方面由于肿瘤细胞在肿瘤组织中的占比偏低,另一方面则由于癌症发展后期产生的突变仅存在于极少量的肿瘤细胞中,采用高深度测序可以尽可能全面的检测到与癌症发生发展相关的变异。为此,外显子组测序深度为,癌组织≥ 200×,推荐500×,癌旁组织/血液≥ 100×。
Q5:什么是Copy Number Variation(CNV)基因组拷贝数变异?
基因组拷贝数变异是基因组变异的一种形式,通常使基因组中大片段的DNA形成非正常的拷贝数量。例如人类正常染色体拷贝数是2,有些染色体区域拷贝数变成1或3,这样,该区域发生拷贝数缺失或增加,位于该区域内的基因表达量也会受到影响。如果把一条染色体分成A-B-C-D四个区域,则A-B-C-C-D/A-C-B-C-D/A-C-C-B-C-D/A-B-D分别发生了C区域的扩增及缺失,扩增的位置可以是连续扩增如A-B-C-C-D也可以是在其他位置的扩增,如A-C-B-C-D。
©2024 - 我的网站 版权所有