一篇案例说明RNA-seq在疾病诊断中的重要价值
导读|RNA-seq是基因功能及结构研究的基础和出发点,是研究基因表达的主要手段。第二代高通量测序技术的特点赋予了转录组卓越的覆盖度、灵敏性以及基因区段特异性,能够全面快速地获得某一物种特定组织或器官在某一状态下的几乎所有转录本序列信息,已广泛应用于基础研究、临床诊断和药物研发等领域。近日,一篇案例就说明了RNA-seq在疾病诊断中的重要价值,阅微基因带你一睹为快!
肌肉功能失调是一种罕见疾病,分类复杂,根据不同的表现形式,包括贝克尔肌肉萎缩症、先天性肌营养不良症、杜氏肌萎缩症、肢带肌萎缩症等20几种。目前对于这种罕见疾病的诊断主要是通过外显子测序和全基因组测。尽管这种方法逐渐成为常规的诊断,但是经过DNA水平检测准确率最高也不会超过50%。本研究另辟蹊径,采用DNA结合RNA-seq的方法,将整体诊断率提高了35%,且看研究者是如何进行深入分析提高诊断率。
标 题:转录组测序提高孟德尔疾病的遗传诊断
Improving genetic diagnosis in Mendelian disease with tranome sequencing
杂 志:science translational medicine,2016
IF= 16.796
研究背景
外显子测序和全基因组测序逐渐成为孟德尔疾病诊断的常规方法。尽管这种方法很成功,但是对于罕见疾病的基因分析后的诊断率大概在25%-50%。研究者将RNA-seq方法作为补充,对50个从遗传角度未被确诊的肌肉失常患者进行研究。研究者文章描述了一个综合的方法,分析原发性肌肉疾病(肌病和肌营养不良)患者的RNA数据,利用分析框架集中发掘患者独特的转录水平变化。
材料方法
1.实验方案
①取样方案
分组
实验组:63名肌肉失常原发性肌肉疾病(20种)患者-肌穿刺样本;
对照组:来源于GTEx数据库的184个不同个体来源的骨骼肌RNA数据;
样本选择标准
对照组样本选择标准:RNA RIN值缺血时间和表型特征:如年龄, BMI,死亡原因
实验组样本选取标准:
1)已确诊病人选择:遗传分析至少有一个基因功能缺失或剪接位点变异;N=13
2)具有候选延展剪接位点变异,且致病性功能未知样本;N=4
3)有强烈的候选基因的样本,如临床上肌营养不良蛋白表达减少;N=12
4)基于WES或WGS无强烈的候选基因的样本。N=34
②测序策略
RNA-seq:Ilumina Hiseq 2000 PE 76 50-100M
WES:Ilumina Hiseq PE 76
WGS:Ilumina X-ten PE 151
2.技术路线
研究结果
1、PCA分析结果
对247个样本进行PCA分析,结果显示:
a.基于聚类结果,剔除两个患者的样本,(聚类上这个两个样本更倾向于脂肪组织), 剔出后的样本与组织污染或晚期退化性肌肉病理一致。
b.GTE来源的control肌肉组与患者肌肉样本重叠在一起,活检组织存在正常组织的污染。(可能是组织活检获得的样本包括了正常的皮肤和脂肪样本),下图为剔出后的结果:
2、可变剪接分析
研究者自己编写了代码进行可变剪接的分析,条件筛选如下:
(代码获取链接:https://github.com/berylc/MendelianRNAseq)
基于split-mapped reads挖掘致病性可变剪接事件:
1)仅考虑唯一比对的reads,且为非允余序列;
2)对于比对注释获得的的junction reads,进行局部的标准化;
3)统计splice junction在样本中的出现的情况,以及在每个样本的reads支持度及其标准化后值。
过滤参数,基于原来被鉴定出来的已知的致病性剪接事件鉴定出的参数为筛选标准。
结果:每个样本识别的致病性可变剪接体的中位数:神经肌肉疾病相关基因5个, OMIM基因26个,所有基因190个。
经过RNA-seq分析获得了可能的致病性可变剪接体,主要类型为,外显子跳跃、外显子延伸、外显子和内含子拼接,对获得的剪接体并进行了qpcr验证,结果一致。
B图:线状体肌病患者,DNA水平检测为移码变异,RNA-seq鉴定显示为NEB基因A-G变异导致的外显子延伸,引入一个过早的终止密码子,提前终止基因转录形成一个隐性等位基因。
C图:DNA测序经常可以筛选得到某些基因的大量变异,但是对于病例上的解释较难,如TTN基因,在转录水平上找到了一个错义突变体,产生了新的变异体。
D图:非编码致病性突变体鉴定-DMD基因:内含子中C-T的变异形成伪外显子,形成新的内含子致病性突变体,在3个患者中检测到。
Types of pathogenic splice aberrations discovered in patients
来自具有严重杜氏肌营养不良症的患者的RNAseq仅显示到伪外显子的剪接,在具有较轻的贝克肌营养不良表型的两名患者中观察到注释外显子之间的野生型剪接,暗示功能性DMD的其他的类型的转录本可以解释温和性的疾病。
3、胶原VI相关性营养不良中复发剪接位点产生变体
转录组测序功能的一个显着的例子是我们发现了严重胶原VI相关营养不良的遗传亚型是由胶原蛋白的1个基因中的突变引起。
对4个严重胶原VI相关营养不良患者进行分析,如下图:胶原VI蛋白相关基因COL6A发生了由GC>GT的变异,形成一个72 bp的伪外显子,并产生一个新的可变剪接体。伪外显子所得到的24个氨基酸发生在COL6A1基因的N末端三螺旋胶原G-X-Y重复区域内,新的可变剪接体破坏了这种结构,并确定了其在各种胶原性疾病中可引起显性致病性。
4、RNA-seq诊断率
上图为63名患者经DNA-seq结合RNA-seq最终结果,从左到右四个柱子意义如下:
左数第一个柱状:13名以前分析确诊的患者。
第二个柱子:4名患者以前的遗传分析确定了未知意义的扩增剪接位点变体,其中2个RNA-seq结果的患者的延伸 的可变剪接位点变化显著,可确诊。
第三个柱子:12名以前遗传分析确定的具有强烈的候选基因的患者,8个RNA-seq解决-非编码致病变异。
第四个柱子:34名以前遗传分析为检测到强烈候选基因的患者,7名患者RNA-seq解决。
总之,RNA-seq对未被确诊的35%的患者进行了确诊。
文献亮点
1、本研究在方案设计上,打破了传统的思维定式,不是针对某一种基因型样本进行选取,而是对于感兴趣的疾病所有的不同类型都进行了取样及研究,在临床上更接地气;
2、在临床上常规DNA手段无法确诊的罕见疾病,联合RNA-seq对于未被确诊的病人及无法解释的基因变异做了深入的解析;
3、临床的应用价值:提示RNA-seq与DNA-seq相结合的重要性。