发布时间:2026-05-07
浏览次数:0
去往服务器之上的第三部分,便是以STAR为依据来开展转录组的比对以及一定量流程。前边诸如指控、数据准备之类的,都已然被略过了,那些都处于第一部分当中。此时此刻,第三部分的第一步呢,就是凭借STAR来构建索引,一般而言,一个物种通常仅仅只需构建一回。
首先,将GPF转换为by十二的格式,之后去点击运行。当点击运行时发生了一个状况,即显示没有找到命令。于是运行这个便出现了报错。为何会这样呢?是由于昨天提到,若后续再次进入环境时,必须重新运行前面初始化的那几行,也就是从二十二行至二十七行,所以在此处要把它再次运行一遍。
在完成初始化之后,激活了环境,接着重新运行四百二十九行,在这个时候dnastar序列比对,运行成功了,期望没有看到报错。
接下来能够作出去挑选长度较为相近的转录本用以后续评估的选择,而不清楚究竟是谁登录了我的账号,随后借助head去展开查看,如此这般即为by文档。
下面存在一部能够被用于生成RNG的脚本,先将其予以生成,后续再去查看如何进行使用的。
先准备妥当,之后便可着手构建基因组的缩影。首先要新建一个目录用以存储缩影,也就是寻觅到 index 点 start,给缩影逐一赋予一个名字,明确究竟是属于哪个软件的缩影。
这边与ppt里的命令相同,是打remo的,这个地方命令之后加了个and号dnastar序列比对,and号意味着要将程序置于后台运行,然而这并不意味着因下套致使后来置于后台运行时,发现终端仍能够继续输入命令,还能够做别的,只是依旧无法继续往下运行,因为缩影尚未构建完成,所以要往下运行时或许就会报错。
这边存在这么个小小的按钮,能够见到它何时消失,表明缩影构建完毕,这边会给出输出。等它运行结束后,在这上面会有个the,要是运行结束后此处未出现闪烁光标,能够直接去回车一下,可通过四百七十九来查看这个。
·所以呢,依旧是把二二定制文件当作主要的,只要去看一下,只要不存在大小是零的情况,应该就不会有什么问题了。
到这边来输出人染色体的大小,把这个文件进行拷贝,鉴于视力数据仅给了某一条染色体便给的是二十号染色体,所以呈现出来只有一行。
还有一点是需要留意的,那就是STAR会依据GPF文件里面在第三列是否存在X来判断,GPF文件有注释,gtf文件也有注释,难道第三列不会有一个基因吗?它会凭借X来判定这个地方究竟是不是一个基因。
在某些时候,拿到了得gtf,然而,存在着有可能不标准的情况,也就是,不要去避避,部分的基因,就会变少了,x所结出来的基因数量,也就减少了。在这样的时候,可以凭借这个命令去进行查看,利用四百九十三这个注册来查看,star从中发现了一千三百九十一个基因。
自己去从gtf文件当中查看,有一千三百九十一个基解,只要这两个相关数字能够相互吻合,那就表明gtf解析不存在任何问题,这属于验证的整个过程。
如有侵权请联系删除!
Copyright © 2023 江苏优软数字科技有限公司 All Rights Reserved.正版sublime text、Codejock、IntelliJ IDEA、sketch、Mestrenova、DNAstar服务提供商
13262879759
微信二维码