你好,欢迎进入江苏优软数字科技有限公司官网!

诚信、勤奋、创新、卓越

友好定价、专业客服支持、正版软件一站式服务提供

13262879759

工作日:9:00-22:00

转录组高级分析:基于STAR构建基因组索引及后续流程

发布时间:2026-05-07

浏览次数:0

转录组高级分析:7.STAR构建基因组索引

去往服务器之上的第三部分,便是以STAR为依据来开展转录组的比对以及一定量流程。前边诸如指控、数据准备之类的,都已然被略过了,那些都处于第一部分当中。此时此刻,第三部分的第一步呢,就是凭借STAR来构建索引,一般而言,一个物种通常仅仅只需构建一回。

首先,将GPF转换为by十二的格式,之后去点击运行。当点击运行时发生了一个状况,即显示没有找到命令。于是运行这个便出现了报错。为何会这样呢?是由于昨天提到,若后续再次进入环境时,必须重新运行前面初始化的那几行,也就是从二十二行至二十七行,所以在此处要把它再次运行一遍。

在完成初始化之后,激活了环境,接着重新运行四百二十九行,在这个时候dnastar序列比对,运行成功了,期望没有看到报错。

接下来能够作出去挑选长度较为相近的转录本用以后续评估的选择,而不清楚究竟是谁登录了我的账号,随后借助head去展开查看,如此这般即为by文档。

下面存在一部能够被用于生成RNG的脚本,先将其予以生成,后续再去查看如何进行使用的。

先准备妥当,之后便可着手构建基因组的缩影。首先要新建一个目录用以存储缩影,也就是寻觅到 index 点 start,给缩影逐一赋予一个名字,明确究竟是属于哪个软件的缩影。

这边与ppt里的命令相同,是打remo的,这个地方命令之后加了个and号dnastar序列比对,and号意味着要将程序置于后台运行,然而这并不意味着因下套致使后来置于后台运行时,发现终端仍能够继续输入命令,还能够做别的,只是依旧无法继续往下运行,因为缩影尚未构建完成,所以要往下运行时或许就会报错。

这边存在这么个小小的按钮,能够见到它何时消失,表明缩影构建完毕,这边会给出输出。等它运行结束后,在这上面会有个the,要是运行结束后此处未出现闪烁光标,能够直接去回车一下,可通过四百七十九来查看这个。

·所以呢,依旧是把二二定制文件当作主要的,只要去看一下,只要不存在大小是零的情况,应该就不会有什么问题了。

到这边来输出人染色体的大小,把这个文件进行拷贝,鉴于视力数据仅给了某一条染色体便给的是二十号染色体,所以呈现出来只有一行。

还有一点是需要留意的,那就是STAR会依据GPF文件里面在第三列是否存在X来判断,GPF文件有注释,gtf文件也有注释,难道第三列不会有一个基因吗?它会凭借X来判定这个地方究竟是不是一个基因。

在某些时候,拿到了得gtf,然而,存在着有可能不标准的情况,也就是,不要去避避,部分的基因,就会变少了,x所结出来的基因数量,也就减少了。在这样的时候,可以凭借这个命令去进行查看,利用四百九十三这个注册来查看,star从中发现了一千三百九十一个基因。

自己去从gtf文件当中查看,有一千三百九十一个基解,只要这两个相关数字能够相互吻合,那就表明gtf解析不存在任何问题,这属于验证的整个过程。

如有侵权请联系删除!

13262879759

微信二维码