用于spCas9 KO的sgRNA设计

用于spCas9 KO的sgRNA设计原则:

  1. 对于有多个splicing variants的基因,sgRNA应该设计在所有variants的共有区段(NCBI可以看);
  2. 在外显子而非内含子上设计sgRNA;
  3. 对于mRNA,在CDS而非5’/3’UTR上设计sgRNA;
  4. 对于mRNA,在CDS的胸部设计sgRNA,不在头部(防止下游alternative AUG起始翻译)也不在后半段(防止产生保留部分功能的RNA);
  5. 对于任何基因,应该设计多条sgRNAs,防止实验现象由脱靶效应产生。

张涛说Alternative AUG起始的可能比较小,大多数时候还是靠上游好一点。

另外,有时候RefSeq有很多条RNA variant,并不一定你所用实验材料内全都有,大部分情况还是就1~2条占绝对优势,可以结合相应细胞的RNA seq数据检查。还可以通过点开某一条RefSeq,看NCBI条目里的参考文献多不多,如果多的话说明可能是主要的转录本。

Uniprot里某个基因的“sequence”栏的序列也可参考:

对于人类基因,当检索某一个具体的基因时,结果页面的Sequence区域通常会选定一个特定的转录本编码的蛋白质(isoform)作为“canonical”序列。这一序列与NCBI RefSeq数据库中的某一个转录本完全对应,体现了其权威性和标准性。

UniProt在确定某个蛋白质的“canonical”序列时,遵循着一套严格的标准,UniProt选择“canonical”序列必须满足以下四种标准中的至少一种:

  1. 最普遍
  2. 与其他物种中的同源序列最相似
  3. 基于其长度或氨基酸组成,能够最清晰地描述结构域、亚型、多态性、翻译后修饰等
  4. 在缺乏任何信息的情况下,选择最长的序列
https://mp.weixin.qq.com/s/3GaJhdO42ck_tJvAT9qq0Q

实操中最迅速的方法:

  1. 从商业Cas9 CRISPR human 4x Brunello筛选的文库sgRNA表格中找到所需的基因,有4条sgRNA;
  2. 在Benchling看一下大概的on-score和off-score合不合适;
  3. 在NCBI查一下对splicing variants的覆盖率;
  4. 如果必要,再去Uniprot查查main transcript是哪个;如果必要,在自己实验材料的RNA seq数据中查查;
  5. 确定sgRNA序列后,根据所选质粒确定引物设计的规则(接头序列),在这里生成引物。

评论

您的邮箱地址不会被公开。 必填项已用 * 标注