转录组比对番外篇：aligner 与 mapping 区别

发布时间：2023-06-07

浏览次数：0

指导

考虑到比较转录组时，可用的软件很多，但很少介绍它们之间的差距。为此，本文主要介绍STAR,,.的区别。

1. 定义 2. 对比

那么[1]有什么区别呢？

2.1.

当我们比较一个read时，除了要问它在基因组中可能的位置外，还要问核苷酸和核苷酸之间的确切对应关系。例如，我们想要得到类似于“ 可能起源于 chr1 位置 123 到 140。前 7 个核苷酸是 foo 和参考之间的完全匹配，然后是 3 个核苷酸插入，然后是核核苷酸的其余部分匹配 foo 和参考。”

2.2.

当我们进行阅读时dnastar序列比对dnastar序列比对，我们只是在问，“它是从哪里来的？” 不过，我们不一定关心读取与其来源之间的对齐。

直到最近，它们几乎是同义词。工具喜欢并改变它，因为它们可以在不查看精确比对的情况下将读取分配给基因/特征/任何东西。因为这样更快，而且我们实际上并不关心一般的对齐结果，所以这在个别应用程序中是一个巨大的优势。

ncbi序列比对_dnastar序列比对_序列比对名词解释

3. 区别 3.1. 星星

STAR[2] 是一个。它的工作是找出每个测序读数在基因组中的位置，这就是（主要）它输出的内容 - 读数列表及其在基因组上的坐标（以 BAM 文件的形式）。它非常关心每个核苷酸的正确位置。

对于表达分析，您需要将这些位置转换为基因表达值。有几种方法可以做到这一点，但最简单的方法是估计基因组中与每个基因重叠的位置的读数数量（执行此操作的程序示例是）。另一种方法是使用统计模型将读数分配给可能的转录本（其中多个转录本可能在基因组中重叠）。执行此操作的程序示例是 RSEM。

3.2.&

并且是定量工具——它们获取包含测序读数的文件并输出基因表达水平。事实上，弄清楚这些读数在转录组中的来源是该过程的第一步。一旦找到，他们使用统计模型将其转换为转录表达水平，考虑读取来自哪些转录本。

看起来和做的更多，所以他们应该花更长的时间，但事实并非如此——事实证明他们要快得多。这一代工具最初是基于这样的想法，即如果你正在量化基因，你更关心的是 read 可能来自的转录本集，而不是它在转录本/基因组中的精确位置。他们以不同的形式来做到这一点——使用“伪对齐”，最新版本使用一种叫做“选择性对齐”的东西，它介于 STAR 和（据我所知）之间，尽管旧版本被称为准对齐。

4.异同与单独使用STAR+量化相比，求和速度更快，占用显存更少。它们提供转录水平的表达信息（其中 STAR+ 计数仅提供基因水平，而 STAR+RSEM 提供转录）。处理读取映射到多个转录本或基因的情况。一般来说，只有转录组（由细胞形成的转录物序列）而不是基因组被描绘出来。参考文献

[1]:#

[2]:#

如有侵权请联系删除！

TAGS：转录组

上一篇：「图」Windows 10X设计文档曝光：遇见未来的桌面系统

下一篇：Java代码编写工具

返回列表

诚信、勤奋、创新、卓越

13262879759

行业动态

转录组比对番外篇：aligner 与 mapping 区别

联系我们