发布时间:2023-12-08
浏览次数:0
前面写的废话
我可能不适合科学研究,因为我总是担心一些“不必要”的事情~
当我第一次接触二代测序时,我和Jimmy一起开始了RNA-seq。 当时使用的对比工具是。当时我并没有多想为什么要用这个工具。 如果你说你应该使用它,我就会使用它。 所以它现在已经成为我最喜欢的比较工具。
然而,由于我需要处理不同的数据,我发现它已经不能满足我的要求了。 我似乎需要考虑其他工具,但我不知道从哪里开始。 我不知道哪个工具更适合我。 于是一场不考虑生物学意义而只考虑工具特性的战斗开始了……
看连续剧的时间太长了。 废话系列太多了。
虽然我总是说这是一个充满废话的系列,但我真的希望你认真看看这一部分。 毕竟我的能力有限,短短几句话很难听懂我想表达的意思,除非我写文言文……
DNA测序&RNA测序
搜索了各种帖子后发现,在比较比对工具时,大家喜欢将其分为DNA比对工具(DNA-seq)和RNA比对工具(RNA-seq)。 如果你仔细想一想,你会发现它们之间唯一的区别是是否会考虑跨外显子比对(即是否将未比对的reads进行分割,并将分割后的两个部分再次进行比较)。
现在随着各种seq的出现,我们不能再简单地根据是比较DNA还是RNA来判断工具的选择,而是要判断reads的比较是否需要跨越外显子。 例如,PRO-seq/GRO-seq在建库时捕获RNA,但它们不需要考虑跨外显子比对。
说了这么多废话,我们来简单总结一下常用的各类工具有哪些:
以上都是我用过的。 那些我没用过的对我来说并不常用,所以我不会在这里比较它们。
&
它出现在远古时代(意思是很久以前)。 当时测序行业发展尚未成熟,序列长度普遍在50bp以下。 因此,它似乎满足长度低于50 bp的reads的比较。 官方表示,它可以快速将短DNA序列(35bp)与人类基因组进行比对。
而它的出现弥补了它的不足。 它擅长比较长度为 50-100bp 的读数,甚至长度可达 。 它适合比较相对较长的基因组,例如哺乳动物基因组。
结论: 和 ,是两种不同类型的比较工具,而不是 的升级。 尺子有长有短,适合长度50b以内的reads比较,适合50-100b,甚至更长的reads比较。但这两个都是DNA-seq比对工具
和
/工具本身不能进行比较,它是通过调用/进行比较的。 强调一下,它不是原版的升级版,而是原版的升级版。 所以只能调用,而不仅仅是(默认)而且还可以更改设置调用。
在 /call/ 之后,序列将首先使用 / 进行对齐。 对于那些未对齐的,将考虑跨越外显子的可能性,并且读取将被拆分并重新对齐。
如果你去 // 的官网仔细观察,你会发现每个都有自己的官网和自己的介绍。 托哈特则不同。 它只有一个版本。 它于2012年4月9日才发布2.0.0版本,宣布支持比较。 而我们通常也称之为支持版本。
另外,如果你够无聊,上下滚动他们的主页,你会发现2019年还有更新。但是2016年2月就停止更新了……为什么?请看下面的部分
原作者不知道为什么停止更新,而是开发了一个新的比较工具。 他们甚至向人们推荐它,声称它速度更快、内存占用更小、准确性更高。 。
此外,它不仅支持RNA-seq比对,还支持DNA-seq比对。 您唯一需要做的就是添加一个参数 --no--。 但目前,大多数人用它来进行 RNA-seq,没有人用它来进行 DNA-seq。
世界银行
其实没什么好说的。 这是我知道的最早的比对工具,是DNA-seq比对工具。 大多数进行全基因组或全基因组比较的人似乎都使用 BWA。 当时我本科的时候有一门课叫计算生物学。 我在学习BWT算法时,经常把算法的名字和比较工具的名字搞混了。
值得一提的是,这个工具是李恒开发的。 如果你不认识李衡,你至少应该认识这个工具。 这东西也是李衡开发的。 一个强大到可怕的男人……
星星
第一次听到这个工具的名字是在我研究的第一年,确实有点无知。 当时我以为这是一个小众的野鸡工具,后来发现身边很多人都在用这个工具,于是我就出于好奇在网上搜索了有关它的资料。
如果你不搜索,你不会知道。 如果你搜索一下,你会感到震惊。 哇,皇室用的RNA-seq比对工具太好吃了……
几种RNA-seq工具的比较
或许是因为RNA-seq分析比较流行,大多数比对工具都是利用RNA-seq的效率来进行比对。
《Into the by a Broad-RNA-seq》这篇文章堪称史上最全面的RNA-seq综述。 比较了 RNA-seq 的各个方面。 因为太全面了,有点乱,所以只关注了一些我感兴趣的地方。
STAR和STAR对于我们来说都有很大的优势,更何况Toph不会再更新了,这更是我们不再使用它的理由。 至于他的准确率是最高的,但是他的灵敏度比较低。 STAR 更敏感dnastar序列比对,但会有许多包含软剪辑的低质量比对。 此外dnastar序列比对,STAR的比例最高。 它会匹配或丢弃所有双端测序读段,并且不仅会匹配某个读段,例如
最后这篇文章还给出了一种自己认为比较好的RN-seq组合方法:
之前的龙星课程给出了RNA-seq的另一种组合方法:SATR+RSEM,其中STAR既可以用于比较,也可以用于定量(计数)
选择哪种组合取决于您的习惯、视力和心情......
文章末尾有广告
只需点击一下,我就会获得一些收入
您的点击就是我的动力
您不考虑订购广告吗?
参考
如有侵权请联系删除!
Copyright © 2023 江苏优软数字科技有限公司 All Rights Reserved.正版sublime text、Codejock、IntelliJ IDEA、sketch、Mestrenova、DNAstar服务提供商
13262879759
微信二维码