晶诚所至 生命所能

Engage to Life Energy

 
上课笔记|高通量scATAC + CRISPR筛选识别癌症中的调节网络
发布日期:2021-10-18浏览:

 

 

 

 

文章概要

文章的题目,是《High-throughput single-cell chromatin accessibility CRISPR screens enable unbiased identification of regulatory networks in cancer》

 

文章发表在Nature communications杂志的2021年5月刊上。

 

文章的题目,翻译成中文,意思是《高通量单细胞染色质可及性 CRISPR 筛选能够无偏见地识别癌症中的调节网络》

 

文章的通讯作者,是William Greenleaf,

 

他是美国的斯坦福大学,遗传学和应用物理学副教授。

 

研究背景

 

实验结果分析

 

实验内容的第一部分,具有染色质可及性读数的单细胞 CRISPR 扫描

这是做Spear-seq的整体实验流程。

 

我们把这些步骤拆细了来说。

第1步,用慢病毒感染,把CRISPR干扰的sgRNA传递到细胞中去。

 

这里的sgRNA,已经预先整合了Nextera的接头,也就是Illumina的Nextera转座酶方法的接头。

 

这样,可以方便后面的建库、测序

这里,特别说一下要包装进慢病毒的Spear-ATAC sgRNA的结构设计。

 

图中,上面是传统的sgRNA的设计。

 

我们可以看到,左边黄颜色的,是U6启动子,这个启动子特别启动sgRNA基因的转录。中间就是sgRNA序列所处的位置。右边是恒定序列。

 

下面,是作者设计的适合Spear-ATAC的sgRNA的结构设计。

 

我们可以看到,左边黄色的U6启动子中间,夹了一段Read2接头。这段Read2接头,是将来建库测序要用到的建库接头,并且它是Nextera的文库接头。

 

同时,这个插入的接头,不会影响U6启动子的功能。

 

右边,多了一个Read1接头,它是与Read2接头配对的Nextera文库接头,

 

有了Nextera的Read1和Read2的接头,中间的这段DNA包括sgRNA spacer的这一段,就会被扩增ATAC文库的时候,也会被扩增。

第2步,是把这些细胞用流式细胞进行分选,把MOI低于0.05的细胞去掉,也就是去掉没有被慢病毒感染的细胞,剩下被病毒感染可能性高的细胞

 

MOI是multiplicity of infection的首字母缩写,指一个细胞被几个病毒所感染

 

MOI低于0.05也就是这个细胞几乎没有被病毒感染

第3步,进行转座反应,再把细胞核用10x的方法进行微滴包裹,在做微滴包裹的同时,要掺入特异性针对sgRNA的引物

第4步,先是在微滴内对单细胞ATAC文库进行线性扩增。

 

然后是对sgRNA片段进行指数扩增,

 

注意右侧的扩增的引物,是从10x微珠上来的,这个引物就带了标识细胞身份的barcode,也就是cell barcode

 

那么扩增出来的文库sgRNA文库,也就带上了cell barcode

第5步,是用带biotin的扩增引物,

 

把带sgRNA的片段用扩增方法富集出来

 

注意,扩增出来的PCR产物会带有biotin标签

接下来,把文库进行测序,把得到的数据进行分析。

这是加与不加primer,单细胞ATAC测序得到的染色质开放位置的对比。

 

红色是带了primer的情况,深蓝色是不带primer的情况。

 

我们可以看到,两者几乎完全重叠。

 

也就是说,加与不加 primer,对测到的染色质开放位置,几乎没有影响

这是加与不加 primer,测序到转录起始位点的富集度的比较。

 

可以看到,加了 primer 之后,测到的转录起始位点的富集度略高一点。

这是加与不加 primer,测序得到的片段长度比较

 

可以看到,两者很相近。

这是用与不用生物素富集sgRNA文库,测序得到的片段长度的分布情况。

 

左边是没有用生物素标签富集的文库,

 

右边是有经过生物素标签富集的文库。

 

很显然,两者有很大的差异。

 

作者计算得出,用生物素进行富集,得到的sgRNA片段,比不用生物素,多了40倍。

接下来,作者设计了9个sgRNA。

 

这其中,针对GATA1基因的,有3个sgRNA;针对GATA2基因的,有3个sgRNA。

 

另外,还有3个sgRNA,不针对任何的基因,仅仅用作对照组。

 

这些sgRNA文库被导入到K562白细胞中,这些细胞都已做了基因工程改造,能够表达CRISPRi dCas9-KRAB基因合盒子,来敲低作者感兴趣的基因。

作者通过测序,捕捉到了6390个细胞核

 

这其中,有3045个细胞核可以直接与表观遗传学特征联系上。这里说的表观遗传学特征,也就是指sgRNA的结果

 

这3045个细胞,占到了全部细胞核的48%

 

图中,就是这3045个细胞核,与对应的sgRNA的关系。

 

计算平均每个细胞的花费,用Spear-ATAC-seq方法,每个细胞是0.46个美元;相比之下,Fluidigm C1上做Perturb-ATAC,是每个细胞9.8个美元。

 

比较通量,在10x的芯片,一次可以处理多达8万个细胞,只需要7分钟。而用Fluidigm C1,一次只能处理96个细胞,每次要花4个小时。

 

因此Spear-seq比Fluidigm的效率更高,成本更低。

这是Spear-ATAC实验得到的细胞UMAP图,再在这上面用三种颜色标示了针对三种目标的sgRNA对应的细胞。

 

从图中,我们可以清楚地看到,被sgGATA1和sgGATA2,还有不针对特定目标的sgRNA干扰的三种细胞,在UMAP图上被清楚地分开。

 

这表明sgRNA的分配有高度的特异性。

 

GATA1和GATA2都参与造血分化和发育。然而,红系转录因子GATA1是K562细胞中的一个必需基因,而GATA2d对K562细胞系的生长和存活是可有可无的。

接着,作者开发了一个框架,用于无偏见地识别包含不同sgRNA的多个细胞群中转录因子基序可有性的变化。

 

先计算了TF基序可访问性分数,然后减去非靶向sgRNA的TF基序可及性分数,然后,对所有这些TF基序可及性差异分数进行排名。

 

结果如图所示。

 

正如预期的那样,对GATA1的敲低,降低了包含GATA基序的峰的可及性。

如预期那样,GATA1的敲低降低了包含GATA基序的峰的可及性,与GATA1的ChIP-seq峰可及性有重叠。

与K562相比,GATA1敲低导致GATA足迹减弱。

GATA1基因座的局部可及性,在敲低后也降低。

 

这进一步验证了分配给sgGATA1的细胞在该基因座下调表达。

通过在含有sgGATA1的细胞、与表达sgNT的细胞之间,做表达差异分析,观察到14262个峰的可及性增加,14026个峰的可及性降低。

GATA1敲低后,可及性降低的峰富含 GATA 基序,

 

而 GATA1 敲低后可及性增加的峰富含 SPI/RUNX 基序

GATA1敲低后,可及性降低的基因组区域的GREAT富集因靠近红细胞特异性基因而富集

而 GATA1 敲低后,可及性增加的基因组区域因靠近巨核细胞特异性基因而富集

 

实验内容的第二部分,使用 Spear-ATAC 随时间评估跨监测扰动

这是做随时间推移的敲除转录因子的动态影响的实验设计。

 

取样的时间点,设计在敲除实验的第3天、第6天、第9天、和第21天。

 

针对的基因是6个,每个基因设计3个sgRNA,

 

这样是18个sgRNA。再设计3个惰性sgRNA,一共是21个sgRNA

这是4个时间点的sgRNA扰动后的TF基因可及性变化排名

 

可及性变化的峰值随着时间的推移而变化。

这是每个 scATAC-seq 亚群的染色质峰可及性热图

 

在GATA1敲低后第3天,富含 STAT5 基序的峰的可访问性增加,但在第 6 天和第 9 天恢复到接近基线的可访问性水平

 

STAT5 已知参与 GATA1 依赖过程中红细胞分化的维持;因此,在第 6 天和第 9 天,含有 STAT5 基序的峰的可及性降低,随后含有 SPI 基序的峰的可及性增加,这可能进一步表明向更多巨核细胞谱系的转变。

 

实验内容的第三部分,使用 Spear-ATAC 的高通量扰动筛选

这是作者为了验证Spear-seq的高通量,而设计的实验方案。

 

针对36个转录因子,对每个转录因子基因做2-3个sgRNA

 

再加上12个sgRNA针对必要基因,14个不针对特定目标的sgRNA作为对照。

 

被转染的细胞,有三种,分别是K562、MCF7、和GM12878

实验总共得到32,832个细胞核。

 

平均每个sgRNA有372个细胞。

这是用chromVAR对三种细胞,经过扰动后的基序可访问性变化的排序。

 

再次确定了顶级的sgRNA:TF的关系。

 

例如:sgGATA1:GATA的对应关系,以及sgKLF:KLF的关系

类似地,导致强烈基序可及性差异的 sgRNA 基因型,所鉴定的基序与靶向转录因子一致,如 GATA1、NFE2、KLF1、FOSL1 和 NRF1 

为了建立 TF 之间的调节关系,作者测量了 TF 扰动对共变调节网络的影响,方法如图所示

 

为了识别这些扰动的共变网络,作者通过靶向细胞减去非靶向细胞内的 TF-TF 基序可及性相关性

分析了最强目标扰动 sgGATA1 的这些关系。作者确定了五个受 GATA1 敲低影响的 TF 基序模块

 

从这个分析中,作者再次发现 GATA1 的消耗导致模块 1 的协调活动增加,模块 1 由关键的造血 TF 组成,如 SPI1、IRF1等

 

总结


 

 

 

上一条:正在热播|在微孔芯片上以单细胞水平分辨的人诱导多能干细胞分化为胰管样类器官
下一条:岁岁重阳,今又重阳。​愿天下父母幸福安康!
返回
网站地图 | 法律声明 | 联系我们

地址:上海市松江区中心路1158号5幢5楼

电话:400-9200-612  传真:+86 21 6090 1207/1208-8154

晶能生物技术(上海)有限公司 Copyright 2012 Genergy Inc. 沪ICP备10017363号

友情链接: