rrbs测序数据处理(rloop, 测序,意义)

2024-06-05

简化甲基化测序和甲基化测序的区别

全面准确的检测了两种小鼠胚胎干细胞的DNA甲基化修饰并进行了系统的比较;同serum ESCs相比,雄性2iESCs全局低甲基化;在血清中,雌性ESCs跟雄性2i ESCs类似呈现全局低甲基化,而在2i ESCs状态下,甲基化水平会进一步降低。

革新性地,APOBEC偶联甲基化表观测序(ACE-seq)和酶法甲基化测序(EM-seq)以酶法取代传统化学处理,ACE-seq通过AID/APOBEC脱氨酶识别5hmC,保证了样本的完整性;EM-seq则通过TET2和脱氨酶的协同作用,同时监测5mC和5hmC的动态。

蛋白质污染对样品的纯度有明显的影响,不适合RRBS测序。2, 简化甲基化测序(Reduced Representation Bisulfite Sequencing,RRBS)是利用限制性内切酶对基因组进行酶切,然后进行Bisulfite测序对基因组甲基化展开分析。

WGBS全称WholeGenomeBisulfiteSeuqneicng: 即全基因组重亚硫酸盐测序。

灵活度高能够直接对任意物种的高甲基化片段进行测序无需已知的基因组序列信息。检测范围广覆盖整个基因组范围的甲基化区域。精确度高能够在实际结合位点50个碱基范围内精确定位。数字化信号直接对甲基化片段进行测序和定量不存在传统芯片杂交的荧光模拟信号带来的交叉反应和背景噪音问题。

视频12:甲基化测序 DNA的甲基化是在DNA的序列不变的条件下,在其中某些碱基上加上甲基的这样一个过程。一般是使甲基化位点的下游的基因表达量变少 甲基化和差甲化的C碱基都不能被转化成U碱基 氧化 用高钌酸钾氧化的方法来氧化羟甲基化的C,其转化效率是94%左右。用糖基把羟甲基化的C给保护起来。

dna蛋白质污染能不能做rrbs测序

1、蛋白质污染会影响荧光定量pcr 实时荧光定量PCR技术,是指在PCR反应体系中加入荧光基团,利用荧光信号积累实时监测整个PCR进程,最后通过标准曲线对未知模板进行定量分析的方法。

2、方法是通过设计生物素或链霉亲和素探针,把目标RNA拉下来以后,与其共同作用的DNA染色体片段就会附在到磁珠上,最后把染色体片段做高通量测序,这样会得到该RNA能够结合到在基因组的哪些区域,但由于蛋白测序技术不够成熟,无法知道与该RNA结合的蛋白。

3、随着高通量测序技术的发展,我们能够从全基因组水平来分析5’-甲基胞嘧啶及组蛋白修饰等事件,发现很多基因组学研究发现不了的东西,这就是 “DNA甲基化测序”!且近年来测序成本的不断下降及测序技术的迭代更新,DNA甲基化测序方法可选择性更多了。

4、RNA模板提取一般采用异硫氰酸胍或蛋白酶K法,要防止RNase降解RNA。 Mg2+浓度 Mg2+对PCR扩增的特异性和产量有显著的影响,在一般的PCR反应中,各种dNTP浓度为200umol/L时,Mg2+浓度为5~0mmol/L为宜。Mg2+浓度过高,反应特异性降低,出现非特异扩增,浓度过低会降低Taq DNA聚合酶的活性,使反应产物减少。

5、从而使用较小的数据量富集到尽可能多的包含CpG位点的DNA片段。 相比于WGBS技术,RRBS是一种准确、高效且经济的DNA甲基化研究方法,通过酶切,并进行Bisulfite测序,该方法在保证DNA甲基化状态检测的高分辨率的同时提升测序数据的高利用率。

6、蛋白质污染:如果质粒DNA样品中存在蛋白质污染,蛋白质会吸收260纳米波长的光,导致OD260读数高估质粒DNA的浓度。这是因为OD260读数不仅包括DNA的吸光度,还包括蛋白质的吸光度。 RNA污染:RNA也可以吸收260纳米波长的光,如果质粒DNA样品中含有RNA污染,同样会导致OD260读数高估DNA浓度。

甲基化测序

随后设计BSP引物进行PCR,在扩增过程中尿嘧啶全部转化为胸腺嘧啶,最后对PCR产物进行测序就可以判断CpG位点是否发生甲基化称为BSP-直接测序方法。将PCR产物克隆至载体后进行测序,可以提高测序成功率,这种方法称为BSP-克隆测序法。

MSAP是利用对DNA甲基化敏感的两种同裂酶Hpa II和Msp I来对基因组DNA进行酶切和连接。由于两种酶能够识别相同的限制性酶切位点,即CCGG位点。当DNA序列中的CCGG位点出现不同程度的甲基化状态时,会分别被这两种酶识别,以有无产物的方式体现出来。

灵活度高能够直接对任意物种的高甲基化片段进行测序无需已知的基因组序列信息。检测范围广覆盖整个基因组范围的甲基化区域。精确度高能够在实际结合位点50个碱基范围内精确定位。数字化信号直接对甲基化片段进行测序和定量不存在传统芯片杂交的荧光模拟信号带来的交叉反应和背景噪音问题。

DNA甲基化数据分析全流程

DNA甲基化一般遵循三个步骤进行数据挖掘。 首先,进行整体全基因组甲基化变化的分析,包括平均甲基化水平变化、甲基化水平分布变化、降维分析、聚类分析、相关性分析等。

亚硫酸氢盐测序法(Bisulfite sequencing PCR,BSP)用亚硫酸氢盐处理基因组DNA,则未发生甲基化的胞嘧啶被转化为尿嘧啶,而甲基化的胞嘧啶不变。随后设计BSP引物进行PCR,在扩增过程中尿嘧啶全部转化为胸腺嘧啶,最后对PCR产物进行测序就可以判断CpG位点是否发生甲基化称为BSP-直接测序方法。

第五列为甲基化数目 第六列为未甲基化数目 在这里,需要对我们的数据利用R,linux或者python整理成DSS包所需输入文件格式。这里我使用python整理的输入文件格式。

载入两个包DSS和bsseq(需要该包构建obj对象) 利用DMLtest函数call DML,分为一下几个步骤:根据甲基化水平进行loci的差异分析 根据dmlTest来call DML 当然,用户也可以指定差异的阈值,只有差异大于阈值的才会被call出来。

差异甲基化分析R包methylkit、DSS和dmrseq的比较

DML是甲基化差异位点,DMR为甲基化差异区域。

methylkit:用于高通量亚硫酸氢盐测序的DNA甲基化分析和注释的R包。该包的目的是处理RRBS以及WGBS的测序数据。此外,也可以处理从Tab-seq或oxBS-seq获得的5hmC的碱基对分辨率数据。DSS:该软件包专为高通量测序数据的差异分析而设计,依赖于bsseq包。

使用trim_galore对数据进行质量控制-过滤

Trim Galore 是对 FastQC 和 Cutadapt 的包装。2 trim_galore适用于所有高通量测序,包括RRBS(Reduced Representation Bisulfite-Seq ), Illumina、Nextera和smallRNA测序平台的双端和单端数据。

拿到原始数据后,首先用软件 FastQC 看一下数据质量 得到html文件,打开后如图 我们比较关心的数据信息 使用安装好的trim_galore去除质量的reads。

trim_galore --clip_R1 5 --three_prime_clip_R1 2 --rrbs -o trimmed --basename SRX1635022 .fastq.gz RNA-seq 数据分析完整流程 额,去接头好像还没写,改天一定。

不同的过滤软件都会有和接头 stringency 相关的参数设置,比如reads和接头最小的重叠碱基数、最多的错配数。当设置一个比较小的stringency值,就保证最为严格,能检测绝大多数的接头。比如 trim_galore 的这个参数(默认是非常严格:数值1):大部分的ChIP-seq数据都是短读长,去低质量不是必须的。