发布时间:2025-05-25
浏览次数:0
微生物种类繁多,诸如真菌、病毒等,只要它们具备一个参考基因组,便可以进行序列对比分析dnastar序列比对,进而识别出与参考基因组存在差异的部位,这些差异点就是我们所说的变异位点。
以近三年来肆虐的SARS-CoV-2病毒为研究对象,在《Acute – 2 in With 2019》一文中dnastar序列比对,详细阐述了通过DNA测序寻找变异位点的具体流程,其中主要涉及四个软件,具体步骤如下所示:
这四个阶段,对于所使用的软件种类并无特定要求,比对分析可选择BWA等工具,处理PCR重复数据的软件也有十几款,而后续变异检测同样有多种选择,实际上,将这些步骤整合到一个脚本中即可。
使用samtools的mpileup功能,结合ref.fasta作为参考序列,对test.bam文件进行处理;然后通过bcftools的call命令,以-vmO z的参数设置,将结果输出为压缩格式的test.bcftools.vcf.gz文件。
如果要理解上面的命令,就需要自己去看一些软件的文档:
然而,仅是确定变异位点,这只是ngs数据分析的初步阶段,面对庞大的参考基因组,需关注各基因功能区域的变化,以及这些突变是否具有生物学上的重要性。特别是对于微生物,面对成千上万个测序数据,我们更关注的是群体层面的概念:
整体查看突变
若涉及人类DNA或RNA的测序资料,需进行变异搜寻,一般采用GATK流程。在处理过程中,前期的bam文件会依据所使用的比对工具而定。一旦获得bam文件,例如在进行STAR软件对RNA-seq数据的比对后,便需遵循以下步骤:
sambamba markdup -
$gatk SplitNCigarReads -
$gatk SplitNCigarReads
$gatk AddOrReplaceReadGroups
$gatk HaplotypeCaller
如果是肿瘤DNA测序数据找变异,通常是突变,流程是:
参考书目:《关于该地点现场的研究报告》
学徒作业
获取SARS-CoV-2的测序数据后,挑选出一段序列,对其进行质量控制,接着对reads进行处理,随后进行比对分析,再去除PCR重复序列,最终确定变异位点。
文末友情宣传
强烈建议您向身边的博士后同仁以及年轻的生物学实验室负责人推荐,以增强他们对数据的理解,助力他们的科研工作迈向新的高度。
如有侵权请联系删除!
Copyright © 2023 江苏优软数字科技有限公司 All Rights Reserved.正版sublime text、Codejock、IntelliJ IDEA、sketch、Mestrenova、DNAstar服务提供商
13262879759
微信二维码